AI“大跃进”时　打工人训练模型只为取代自己？｜专栏

撰文：蔺思含

出版：2026-04-16 10:00更新：2026-04-16 10:41

在探索中美AI行业内卷的故事时，笔者试图去了解两国AI打工人在这股热潮下的亲身经历，其中一位曾经参与豆包模型开发、后又转进阿里的AI部门的打工人的故事，或许能够成为其中的代表。她在大厂工作四年，进入AI行业三年，坐在国内科技圈AI热潮的头等席，看着企业疯狂砸钱、砸人力，训练模型和变现，气势恍如“大跃进”。

采访前一天，她收到老板发到群里的短讯：“号召大家9116”，每天9点到11点，每周6天——“其他的团队已经‘卷’起来了”。

与大多数人不同的是，她在大厂残酷的优胜劣汰机制下留了下来，成为这一批打工人中的幸运儿。由于字节、阿里等国内大厂对员工有严格的保密规定，我们暂且称她为“A小姐”以保护她的身分。

刚刚进入字节时，A小姐在“头条新闻”工作，每天朝十晚六，很多时候即便在岗也无事可做。下班以后就去学打架子鼓。“那个时候我真的很喜欢打鼓，因为那个时候我也不是很忙，报名上课花了我1万块钱。”

A小姐交了一年的学费，但在这期间，她从原来的部门调到了大模型研发的岗位，也就是后来字节推出的“豆包”项目团队，让这1万块打了水漂。

2022年底ChatGPT3.5横空出世，在此之前，国内科技圈只有百度或者一些好的创业公司有AI大模型方面的一些布局：“其实国内大厂都没有认真关心过这个事。但3.5出现后，让大家看到原来真的能搞出来一个对话机械人，然后大家很兴奋，就开始招兵买马做。”

2023年4月至5月，字节跳动开始大规模投入大模型研发（豆包项目），内部进行了疯狂扩招。A小姐通过“内部活水（转岗）”机制加入了当时急需大量人力的豆包团队。当时她与大多数人一样，认为这是一个新兴、有趣且极具前景的行业，都想投入其中。

“你不会特别想到加班会很严重或者什么，而且当时豆包这个部门是强制大小周的，为了让你更有积极性一点，他说我们是有加班费的。其实你在大厂的其他部门，这种日常加班一般是没有加班费的，所以你虽然比较累，但是你钱赚多了。”

A小姐这时还有一种“创造新东西”的兴奋感（Exciting），感觉自己在做一件有意义且处于前沿的事情。

但后来的发展，是出乎大多数人意料的。

2023年到2024年间，训练模型的工作基本是“教AI说人话”，就像老师给学生改作文，需要人工手写一个“标准答案”（比如写一篇小说、回答今天是几号），然后喂给AI，让它模仿。这时模型的优化还没有什么技术难度，基本是靠投入大量的人力完成。

随着DeepSeek等推理模型的出现，AI不再只是学说话，而是要“办事”，成为具有工具调用能力的Agent（智能体），训练过程不再是教它怎么写字，而是教它怎么解决一个复杂的现实难题。

举例而言，以前输入“给我推荐一家餐厅”的指令，AI可能会编造一个餐厅的名字。但现在，AI必须像真人一样思考和操作：先打开地图APP，定位你在哪；打开OpenRice，搜寻附近的餐厅；对比评分高低；计算餐厅离你的距离；最后综合推理，告诉你：“推荐去这家，因为它评分高且离你最近。”

这时，训练模型需要的人力要求也变高了——不能只看文字通不通顺，而是必须懂代码、懂数据分析，检查写的Python代码有没有错、它的推理逻辑（先查地图再查评分）是否合理。

2024到2025年，各大厂的大模型训练逐渐转向自动评估——设计一套“评分规则”，让AI进行“自动化评测”。这时，前期的大量人力失去了价值，企业立刻开始裁员。

在这期间，A小姐升职，开始带领团队，随之而来的是更大的压力，开始“向上管理”，要证明部门价值，也要执行裁员指标。有一段时间公司开始流行“降本增效”的极端口号，逼迫员工思考“怎么拿更少的人做更多的事”，形成了一套不断招、不断裁的机制——优先裁掉前几年扩张期招进来的、学历相对普通（普通一本或二本）、绩效不佳或成本较高的“老员工”，转而招聘学历背景更好（985高校、海外研究生）、更年轻、更聪明且工资相对较低的应届生或实习生——“又便宜又好”。那些日以继夜过着996生活、训练和优化模型的打工人，终于被模型给取代。

“当时非常流行这句话，如何让更少的人完成更多的事情。我每次听到这些话都想吐。”

A小姐去年从字节跳到了阿里，感受到大厂内卷的极致——“阿里非常喜欢搞大跃进，并且喜欢讲故事。他们通常想在两个月内推出一个大产品，于是我就疯狂地进行宣发，将这个产品推广出来。”

在内部，阿里实行“赛马机制”，两三个团队做同样的事，输者全员被裁，或被拆解输送人才。甚至不同业务线也竞争激烈，一些部门甚至将内部其他事业部的产品视为直接竞品（对标对象）。

由于人力成本高，在降本增效的方针下，裁员变成了管理层的“政绩”，甚至层层加码——老板要求裁10%，中层就裁20%，不顾实际业务需求。

A小姐自述，以前自己是个“F人”（MBTI中的情感型），情感丰富，也容易感受到他人丰富的情感，但这两年工作下来，A小姐逐渐变成了“T人”（MBTI中的理性型），遇到事情已经不会有太多情绪上的波动，团队有女孩因工作做不完打电话崩溃大哭，她没有安慰，只是开始思考解决问题、安排任务。

她坦言，这几年能在高压、决策混乱的大厂环境中生存下来，是因为能够剥离个人情感、不追求价值认同、纯粹以“打工赚钱”为目的，避免精神崩溃——“他们都说我是‘天选打工人’”。

对于AI的迅速更新迭代，A小姐有一种“过一天算一天”的感觉：

“我认为现在模型发展速度比想像中快很多，尤其是我们23年看到的（模型）是那么粗糙的形态，现在已经变得很好了。例如之前做产品经理，需要手画交互界面到底是什么样子的，你可能需要画好几天，今天在画前端时，我让新版3.0pro画，两分钟后我再告诉他如何修改，一分钟就画完了。他可能取代了好几天的工作量。”

眼下，国内的AI产业还在扩张期，对人力的需求整体还在增加，但在许多真正做模型的人认为这个窗口期并不长：“实际上我们心里都觉得，再过几年就真的找不到工作了。”

DeepSeek因996成功？　矽谷“中国焦虑”论的虚实｜专栏国内整顿、国外兴起　美国矽谷如何掀起“996”风潮？｜专栏

阿里巴巴

AI人工智能

AI“大跃进”时 打工人训练模型只为取代自己？｜专栏

AI“大跃进”时 打工人训练模型只为取代自己？｜专栏

AI“大跃进”时　打工人训练模型只为取代自己？｜专栏

AI“大跃进”时　打工人训练模型只为取代自己？｜专栏