AI“大跃进”时 打工人训练模型只为取代自己?|专栏
在探索中美AI行业内卷的故事时,笔者试图去了解两国AI打工人在这股热潮下的亲身经历,其中一位曾经参与豆包模型开发、后又转进阿里的AI部门的打工人的故事,或许能够成为其中的代表。她在大厂工作四年,进入AI行业三年,坐在国内科技圈AI热潮的头等席,看着企业疯狂砸钱、砸人力,训练模型和变现,气势恍如“大跃进”。
采访前一天,她收到老板发到群里的短讯:“号召大家9116”,每天9点到11点,每周6天——“其他的团队已经‘卷’起来了”。
与大多数人不同的是,她在大厂残酷的优胜劣汰机制下留了下来,成为这一批打工人中的幸运儿。由于字节、阿里等国内大厂对员工有严格的保密规定,我们暂且称她为“A小姐”以保护她的身分。
刚刚进入字节时,A小姐在“头条新闻”工作,每天朝十晚六,很多时候即便在岗也无事可做。下班以后就去学打架子鼓。“那个时候我真的很喜欢打鼓,因为那个时候我也不是很忙,报名上课花了我1万块钱。”
A小姐交了一年的学费,但在这期间,她从原来的部门调到了大模型研发的岗位,也就是后来字节推出的“豆包”项目团队,让这1万块打了水漂。
2022年底ChatGPT3.5横空出世,在此之前,国内科技圈只有百度或者一些好的创业公司有AI大模型方面的一些布局:“其实国内大厂都没有认真关心过这个事。但3.5出现后,让大家看到原来真的能搞出来一个对话机械人,然后大家很兴奋,就开始招兵买马做。”
2023年4月至5月,字节跳动开始大规模投入大模型研发(豆包项目),内部进行了疯狂扩招。A小姐通过“内部活水(转岗)”机制加入了当时急需大量人力的豆包团队。当时她与大多数人一样,认为这是一个新兴、有趣且极具前景的行业,都想投入其中。
“你不会特别想到加班会很严重或者什么,而且当时豆包这个部门是强制大小周的,为了让你更有积极性一点,他说我们是有加班费的。其实你在大厂的其他部门,这种日常加班一般是没有加班费的,所以你虽然比较累,但是你钱赚多了。”
A小姐这时还有一种“创造新东西”的兴奋感(Exciting),感觉自己在做一件有意义且处于前沿的事情。
但后来的发展,是出乎大多数人意料的。
2023年到2024年间,训练模型的工作基本是“教AI说人话”,就像老师给学生改作文,需要人工手写一个“标准答案”(比如写一篇小说、回答今天是几号),然后喂给AI,让它模仿。这时模型的优化还没有什么技术难度,基本是靠投入大量的人力完成。
随着DeepSeek等推理模型的出现,AI不再只是学说话,而是要“办事”,成为具有工具调用能力的Agent(智能体),训练过程不再是教它怎么写字,而是教它怎么解决一个复杂的现实难题。
举例而言,以前输入“给我推荐一家餐厅”的指令,AI可能会编造一个餐厅的名字。但现在,AI必须像真人一样思考和操作:先打开地图APP,定位你在哪;打开OpenRice,搜寻附近的餐厅;对比评分高低;计算餐厅离你的距离;最后综合推理,告诉你:“推荐去这家,因为它评分高且离你最近。”
这时,训练模型需要的人力要求也变高了——不能只看文字通不通顺,而是必须懂代码、懂数据分析,检查写的Python代码有没有错、它的推理逻辑(先查地图再查评分)是否合理。
2024到2025年,各大厂的大模型训练逐渐转向自动评估——设计一套“评分规则”,让AI进行“自动化评测”。这时,前期的大量人力失去了价值,企业立刻开始裁员。
在这期间,A小姐升职,开始带领团队,随之而来的是更大的压力,开始“向上管理”,要证明部门价值,也要执行裁员指标。有一段时间公司开始流行“降本增效”的极端口号,逼迫员工思考“怎么拿更少的人做更多的事”,形成了一套不断招、不断裁的机制——优先裁掉前几年扩张期招进来的、学历相对普通(普通一本或二本)、绩效不佳或成本较高的“老员工”,转而招聘学历背景更好(985高校、海外研究生)、更年轻、更聪明且工资相对较低的应届生或实习生——“又便宜又好”。那些日以继夜过着996生活、训练和优化模型的打工人,终于被模型给取代。
“当时非常流行这句话,如何让更少的人完成更多的事情。我每次听到这些话都想吐。”
A小姐去年从字节跳到了阿里,感受到大厂内卷的极致——“阿里非常喜欢搞大跃进,并且喜欢讲故事。他们通常想在两个月内推出一个大产品,于是我就疯狂地进行宣发,将这个产品推广出来。”
在内部,阿里实行“赛马机制”,两三个团队做同样的事,输者全员被裁,或被拆解输送人才。甚至不同业务线也竞争激烈,一些部门甚至将内部其他事业部的产品视为直接竞品(对标对象)。
由于人力成本高,在降本增效的方针下,裁员变成了管理层的“政绩”,甚至层层加码——老板要求裁10%,中层就裁20%,不顾实际业务需求。
A小姐自述,以前自己是个“F人”(MBTI中的情感型),情感丰富,也容易感受到他人丰富的情感,但这两年工作下来,A小姐逐渐变成了“T人”(MBTI中的理性型),遇到事情已经不会有太多情绪上的波动,团队有女孩因工作做不完打电话崩溃大哭,她没有安慰,只是开始思考解决问题、安排任务。
她坦言,这几年能在高压、决策混乱的大厂环境中生存下来,是因为能够剥离个人情感、不追求价值认同、纯粹以“打工赚钱”为目的,避免精神崩溃——“他们都说我是‘天选打工人’”。
对于AI的迅速更新迭代,A小姐有一种“过一天算一天”的感觉:
“我认为现在模型发展速度比想像中快很多,尤其是我们23年看到的(模型)是那么粗糙的形态,现在已经变得很好了。例如之前做产品经理,需要手画交互界面到底是什么样子的,你可能需要画好几天,今天在画前端时,我让新版3.0pro画,两分钟后我再告诉他如何修改,一分钟就画完了。他可能取代了好几天的工作量。”
眼下,国内的AI产业还在扩张期,对人力的需求整体还在增加,但在许多真正做模型的人认为这个窗口期并不长:“实际上我们心里都觉得,再过几年就真的找不到工作了。”