AI 抢人大战,批量制造这个时代的流量明星

小新 正四品 (知府) 2026-05-21 22:00 3 0 返回 经济观察
小新 正四品 (知府) 楼主
2026-05-21 22:00
第1楼

摘要:2023 年初,字节 Seed 团队只有一两百人,在内部是一个探索性项目;在腾讯,混元大模型团队分散在 TEG 和各 BG,管理层的态度是 “不必冲在最前面”;而阿里云 2023 年换帅,通义千问团队在达摩院和阿里云的组织调整中反复摇摆。但从 2023 年底开始,两个代表性玩家率先搅乱了原本平静的市场。大模型领域比较受关注的教授以及实验室,语言模型有清华大学朱军、唐杰、刘知远、黄民烈等老师的学生,北京大学 NLP 实验室;语音领域有西北工业大学谢磊教授的团队,香港中文大学的语音大模型实验室、中国科学院的声学研究所等团队;多模态模型是香港中文大学的 MMLab、复旦大学视觉智能实验室、浙江大学的 CAD&CG 实验室,以及姜育刚教授的团队。


在中国,年收入过亿的人屈指可数。娱乐圈里,只有最头部的流量明星能触到这条线,即便是中国娱乐圈最鼎盛的 2017 年,在福布斯中国名人榜上,年收入过亿的明星也就十几个人。

2024 年,A 股 5400 多家上市公司中,董事长年薪最高的药明康德李革只有 4180 万,A 股董事长平均年薪仅为 133.94 万元。而一半以上的 A 股上市公司,全年净利润还不到 1 亿。

现在,一个新群体闯入了这个收入层级:大模型研究员。

在中国,传言姚顺雨以亿元薪酬入职腾讯(后被公司否认),郭达雅以近亿年薪(期权价值增长后的平均收入)加盟字节。在大洋彼岸,一些研究员的年薪超过 NBA 拿顶级合同年薪的勇士队球星库里,甚至超过了执掌苹果多年的库克。

三年前,AI 研究员普遍年薪百万。到了 2024 年,少数人膨胀到千万,如今极少数人能破亿。

这个薪资膨胀速度比此前任何一个行业都快。2015 年的 O2O、出行大战,2020 年的社区团购,以及后来的直播电商,都没有如此疯狂,字节、腾讯、阿里、DeepSeek、Meta、OpenA,国内外大厂同时在抢同一批人,总人数只有几百人。

他们是这个时代的明星,被各家公司提前锁定、天价签约、竞业隔离,甚至有人被前东家蹲守偷拍,只能戴口罩出门,流动上班。为了吸引他们,各家公司一号位亲自下场,开出几倍的薪资,许诺更大的管理权限和自由。

我们访谈了研究员、猎头、大厂 HR、投资人,还原了抢人大战的过程,以及中国最贵的几百个人是如何诞生的。

大模型三年,研究员收入翻了 6 倍不止

2023 年,顶级 AI 研究员的薪酬不过上百万。经历了 ChatGPT 时刻的震撼后,中国一年内涌现出上百家大模型公司,但一年过去,市场情绪从狂热转向怀疑,一级市场融资降温,二线大模型公司开始裁员收缩。

彼时大厂还处于降本增效的尾声,对大模型投入有限。2023 年初,字节 Seed 团队只有一两百人,在内部是一个探索性项目;在腾讯,混元大模型团队分散在 TEG 和各 BG,管理层的态度是 “不必冲在最前面”;而阿里云 2023 年换帅,通义千问团队在达摩院和阿里云的组织调整中反复摇摆。这样的情况下,研究员的薪资也在大厂正常的薪酬序列里,没有额外的溢价。

以前大多数研究员的心态是,在大厂做研究、发论文、拿一个不错的薪水,已经是很好的职业状态了。但从 2023 年底开始,两个代表性玩家率先搅乱了原本平静的市场。

首先是成立不久的 DeepSeek。梁文锋很早就意识到人才的重要性,当时已经在寻找最优秀的研究员,用高于市场的价格挖人,给研究员开更高的现金,不仅能覆盖之前的总包,甚至部分可以有 30%-50% 的涨幅。但 DeepSeek 社招不多,以应届生和实习生留任为主,其内部超 7 成的人是本科生和硕士生,对市场的影响有限。

真正让水温升高的是字节。2023 年底开始,字节后知后觉模型的重要程度,开始奋起追赶,饱和式投入。2024 年字节对基础模型研发人才的招聘名额不设上限,从阿里通义、百度文心和月之暗面、智谱等团队广泛挖人,经常开出双倍的薪资涨幅。

一个标志性的跳槽案例是 2024 年下半年周畅离开阿里加盟字节。八位数总包、4-2 职级,字节给的待遇十分优厚,他带过去的几个人都一起升职加薪。一位曾在 Seed 的人士告诉我们,周畅到字节后,迅速推动了多模态基模能力的提升。

到了 2025 年,DeepSeek 的爆火让全行业意识到,极少数对的人能带来颠覆性的结果。创业公司和腾讯等大厂也加大投入,重整模型团队,抢人大战再次升级,普通研究员开始有了八位数的 offer。

新的锚点产生后,行情迎来跳涨,有猎头说,2025 年上半年,行情是按月在变的,“三月给的价四月就不够用了”。

猎头意识到招聘市场在变化的一个细节是,当时字节愿意多花比 2024 年还多出至少 50% 的溢价,吸引人才的加入。2025 年的 TopSeed 计划(字节面向大模型领域前 5% 人才的 “顶尖 AI 研究人才专项”)可以给应届生开出 300-500 万的年包,2024 年只有 150 万元。此时 DeepSeek 的薪酬仍保持着对人才的吸引,能开出仅现金就 300 万的年包,还将内推成功一个研究员的奖金提高到 20 万。

但总有后来者带着更强的焦虑和更充沛的资金奋起追赶。在海外,这个角色是 Meta,扎克伯格在一个月之内,用 1 亿美元从 OpenAI 挖角到了感知技术负责人余家辉;2 亿美元从苹果 AI 挖到了基础模型团队(AFM)的负责人庞若鸣;2.5 亿美元(四年)挖到了 Vercept 天才创始人 Matt Deitke;给 OpenAI 的高级研究员更是开出了四年 3 亿美元的薪酬,部分人第一年总薪酬可以达到 1 亿美元。

在国内,这个角色一开始是字节,从阿里和百度挖人,后来又变成腾讯,从字节挖人。

2025 年下半年,腾讯一直大手笔地从字节跳动 AI 大模型团队挖人,一出手就是高溢价,向顶尖研究人员开出至少双倍薪资。

腾讯有个实用的策略:找到一些在 Seed 面临薪资倒挂的老将,向他们开出极具诱惑力的 offer。“这些人在原来公司做了两三年,但因为市场普遍职级体系膨胀,新来的人的薪资和他们差不了多少,甚至更多。这个口子,是最容易撬开的。” 一位猎头说。

腾讯吸引到了不少人才。 Seed 视觉 AI 平台团队负责人肖学锋,RL 负责人袁钰峰,Seed Infra 成员张弛、黄启——这些人陆续出现在了腾讯混元的组织架构里。

腾讯挖人的标志性事件是姚顺雨的加入。入职时,他年仅 27 岁,没在大厂待过,一毕业就去了 OpenAI,加入腾讯后直接出任大模型负责人,向刘炽平汇报。这不仅打破了大公司传统的资历、级别、年限体系,也传递出一个信号,中国公司从硅谷抢人,是必要的,也是可行的。尽管过亿年薪的传闻被腾讯官方辟谣,但这变成了一个新的参照。

一位猎头告诉我们,2025 年下半年,越来越多的研究员愿意出来看看机会。此前他们还会带着对现东家的 “某种忠心” 拒绝邀请,但腾讯和 Meta 的入场,让他们不得不重新掂量自己在市场上的价值。

业内人士告诉我们,2025 年下半年 DeepSeek 就有部分人收到过 Meta 的邀请,开出了 “像网络上传的(数千万美元甚至更多)那样富有诱惑力的 offer”。

2026 年,郭达雅高薪加入字节,再一次打破了人们的预期。姚顺雨的成长路径是标准的精英通道,清华姚班、普林斯顿博士、OpenAI,做出过范式级别的学术贡献,腾讯需要他的方向判断力,在顶层重新设计腾讯的模型路径。

郭达雅是中山大学博士,没有海外经历。他是 DeepSeek R1、Coder、Math 的核心贡献者,他的定价逻辑与姚顺雨不同,是按他已经创造的价值倒推出来的。

2025 年之前,“从 Google/OpenAI 出来” 是 AI 人才的最强背书。现在,“从 DeepSeek 出来” 成了同等甚至更强的履历,因为 DeepSeek 团队用极少的资源做出了世界级的成果,其 coding、infra、data 等方向的人才,都是各家最急需的。

为了争抢郭达雅,阿里、腾讯、字节三家大厂先后行动,了解情况的人告诉我们,其中有两家的老板亲自去邀请他。阿里最早,给的现金更多,职权范围更大;字节的期权部分更有吸引力,更重要的是,字节将重点投入 Coding Agent 方向,与郭达雅的想法更契合,“接下来两年的发展最符合他预期”。

郭达雅的离开加剧了 DeepSeek 的人才流失压力,也让更多参与过大模型训练的研究员开始重新衡量自己的价值,行业内人心浮动。

社招薪资或许因人而异,校招更能反映市场行情的变化。2023 年,顶级 AI 研究员校招入职字节,年包在百万左右;到了 2025 届,字节的顶尖人才招聘计划 TopSeed 可以开 300 万-500 万;2026 届,字节取消了校招生 TopSeed 的标签,提高了人才招聘的标准,开出更高的薪资吸引人才,某些岗位核心的校招生可以开到 600 万,部分人能开更高。同期,Seed、Kimi、腾讯混元少数的实习生也能拿到 300 万的薪资。

短短三年,研究员的薪资翻了 6 倍不止。

只有几百人,怎么拉拢都值得

训练一个大模型的成本,包含几个部分:算力、数据和人。

训练投入是最大的。Anthropic CEO Dario Amodei 在 2024 年预测,正在训练中的模型耗资已接近 10 亿美元,2025 到 2027 年将出现 100 亿美元级的训练。

而维持模型运转同样昂贵,OpenAI 2024 年仅推理服务就花了近 40 亿美元。训练加推理,OpenAI 一年烧掉约 70 亿美元算力费用。在这场 AI 竞赛中,算力投入已经膨胀到百亿美元量级,而且每年还在以成倍的速度增长。

一位业内人士告诉我们,一个靠谱的 Infra 人才,能提高算力利用率多达 50%。“即便已经开源了,到现在为止很多二级算力提供商,也无法把 DeepSeek V3.2 优化到官方宣称的水平。”

不止 Infra。在大模型的训练流程的关键节点上,一个足够聪明、有研究品味(taste)的人,能把整条链路的效率拉升一个数量级。关于 Loss 曲线在某个点突然抖动的归因,不同的人会有不同的判断。这个判断引发的决策分歧,可能让两个团队在几个月拉开巨大差距。

对公司来说,模型率先突破某个能力阈值——比如可靠的代码生成、稳定的多步推理——它就能率先切入商业场景,一旦成功建立用户习惯,后来者很难撬动。

模型能力的代际差距在商业端被急剧放大。Anthropic 的 Claude Code 帮助公司 ARR 从 2025 年底的不到 100 亿美元飙升到接近 300 亿美元;而同期 OpenAI 的 ARR 增速只有约 25%。两家公司模型能力只差三个月,但商业价值可能差好几倍。

因此,对大厂来说,时间是比金钱更重要的成本。大厂们能做的,就是把市场上最聪明的这批人,用尽一切手段锁在自己这里。

全球能真正推动大模型进步的研究员有多少?多位业内人士给出的估算都比较一致,只有几百人。

他们的画像是这样的。首先是天才,市场上公认最值钱的那批人,往往有类似的经历:高中阶段打过数学、信息学竞赛,拿过奖项,凭此保送进了清华或北大。DeepSeek 内部有很多奥赛(或者其他竞赛)金银牌,保送清北的学生,有些还没毕业,甚至放弃读博,就出来工作。另一条路径是,各大名校的少年班,保送高校,本科毕业后在 UC 伯克利、CMU 等国际高校进修,之后加入谷歌、OpenAI、Anthropic 等海外大模型公司,参与过模型训练。

除了天才以外,人才第一梯队里被反复抢的,还有那些在出身上叠加了研究成果的人。比如,DeepSeek 和 Seed 基模组的核心研究员。对现在的市场来说,从 0 到 1 做过模型训练,或者在一个成熟团队里主导过有外界认可度的技术迭代,在圈子里也是 “硬通货”。

再下一个梯队的人才,是在中国 C9 院校的本硕博,或者在新加坡国立、港中文这类学校读 PhD,能拿到 TopSeed 或阿里星这类顶级项目认证的人。他们和有过模型训练经验的人才都属于这个梯队。

储备人才方面,整个清华大模型相关专业——计算机系、电子系、自动化系和交叉信息研究院——每年本科生大约 700 人,超过 80% 选择深造。他们在校招时竞争力最强,是中国大模型研究的人才基本盘。

天才们能拿到的是大几千万人民币甚至过亿的薪酬包,各大模型公司的核心研究员们也能拿到千万,再往下的储备人才和普通研究员,基本都能拿到几百万的 offer。

这些天才在校期间,或者工作初期就有大把的投资人、猎头建联。一位关注 AI 的投资人告诉我们,他认识大部分知名 AI 相关实验室的学生。

大模型领域比较受关注的教授以及实验室,语言模型有清华大学朱军、唐杰、刘知远、黄民烈等老师的学生,北京大学 NLP 实验室;语音领域有西北工业大学谢磊教授的团队,香港中文大学的语音大模型实验室、中国科学院的声学研究所等团队;多模态模型是香港中文大学的 MMLab、复旦大学视觉智能实验室、浙江大学的 CAD&CG 实验室,以及姜育刚教授的团队。

他们也会早早被 VC 或者 FA 锁定,给出类似 “只要你创业我就会给你拿一笔钱” 的承诺。

但天价薪酬有时也会失效。在有限供给下,薪资只是一个起步门槛,业务方向、项目的重视程度、团队人才密度、算力资源等,同样在天平上。

2025 年底,OpenAI 首席研究官 Mark Chen 在播客中透露:扎克伯格为了从 OpenAI 挖人,亲手煲了汤,亲自送到研究员家门口。扎克伯格还建了一个 WhatsApp 群叫 “Recruiting Party”,在群里协调挖人目标名单。对于他认为重要的候选人,他会亲自发消息,请求 “聊 15 分钟”,然后邀请对方到帕洛阿尔托和太浩湖的私人别墅吃饭。仅在 Google DeepMind 一家,他就给数十名研究员发过这种消息。

从 2023 年四季度开始,有投资人发现,字节跳动创始人张一鸣开始频繁约见 AI 研究者,并循着 AI 方向的论文一对一拜访作者,其中还有未毕业的博士生。

这个极端稀缺的市场里,CEO 们的行为模式是趋同的:面对一个市场上只有几百人的群体,传统的招聘流程、薪酬体系、组织层级全部失效,只剩下人与人之间最原始的说服方式。

激进挖人,让对手失守

这个极端稀缺的市场里,各家的抢人策略出现了明显分化。

一位猎头把这件事说得很直白:“你以为大厂在招人,其实是把对手能用的人,从市场上提前清掉。” 一个明显的例子是,最近大公司们对天才的渴求不再像以前那样强烈,但面向 2027 届的秋招启动时间,反而比往年同期更早。

在人才金字塔顶端,中国做大模型公司的核心研究员大概有 500 人。除了他们,一线团队现在想要的是 “打娘胎里就开始做 AI” 的那批人,本科就进实验室,博士期间参与过训练流程,或者有明星 paper 的人。有限供给下,有人多自然就会有人少,各家要比拼的是出手的速度和投入的决心。

字节曾是几家国内公司中行动最快、投入最大的那家。2023 年成立,三年时间,字节负责大模型研发的部门 Seed 就从最开始的一两百人团队,到近期 1300 人的规模,膨胀了接近十倍。

字节对人才的争抢也是系统性的。从张一鸣到技术 leader 再到 HR,整个组织都有计划地分类招募不同等级的人才。蒋路、黄文灏、周畅,以及近期加入 Seed 的郭达雅,背后都有最高层的直接参与。

多位猎头告诉我们,字节不只想要对应岗位的人,还想要全世界最聪明的人。这家公司肯为好人选开绿灯,因人设岗常常发生,先把人抢过来,再给他找位置。

抢人大战中,Seed 和 Deepseek 是出手最果断的两家。他们不仅有经验辨识好的人选,也更清楚一个人选的价值,可以优先出价。而后面出价的人,面临的是 “我要比上一个高多少才有竞争力”。

腾讯在一段时间内被迫成为后出价的人,要付出更高的溢价争抢人才。2025 年,意识到模型层面的落后,腾讯的方式是不惜成本地挖人,要在最快时间内建立起一支能打仗的队伍。

过去一年,字节 Seed 有近 30 名成员加入腾讯。据了解,原 Seed 视觉 AI 平台团队负责人肖学锋,入职后加入 AI Infra 部,负责多模态推理相关工作,向姚顺雨汇报。训练 Infra 组负责人黄启来自 Seed;RL Infra 组负责人张弛 2025 年底从 Seed 离职后加入腾讯,直接向姚顺雨汇报;大语言模型部的 RL 算法组负责人袁钰峰,同样从 Seed 挖来。

原 Seed 视觉基础研究团队负责人也在 2025 年下半年加入了腾讯 AI Lab,近期随 AI Lab 组织调整转入大语言模型部,当前向姚顺雨汇报。这位负责人 2021 年从新加坡国立大学加入字节,在多模态领域是全球知名的研究科学家,曾是字节 TopSeed 人才计划的导师。

腾讯从 Seed 集中挖人的意图也比较明确:补齐训练平台、推理系统和强化学习框架等底层能力。尤其是 Infra 能力,字节 Seed 的 AI Infra 能力曾被其内部高层认为是国内领先水平,腾讯储备的算力不足,定向挖有经验的人成了短时间内的最优解。

“腾讯不会错过谁。” 一位猎头评价腾讯的招聘策略。为了追赶,腾讯会以广撒网的方式抢夺人才,对人才的要求最早也没有 Seed 和 DeepSeek 那么高,一些研究员甚至会在拿到 Seed 的 offer 后,转头去跟腾讯要更高的薪酬。

相比之下,阿里 Qwen 在抢人这件事上比较保守,更倾向于通过校招内部培养。过去通义实验室下属的 Qwen 团队,以氛围好著称,90% 都是阿里自己培养的校招生,各个环节之间合作紧密。他们和字节一样,没有职级、没有 OKR,研究员可以专注于自己的事情。当时林俊旸领导下的 Qwen 也不过 100 人左右,人少,对研究员来说 Scope 大,且会公开发布技术报告,向外界展示成果。

但阿里严格的职级体系也给人才招聘制造了障碍。原 Qwen 负责人林俊旸是 P10,其他负责人 P9、P8,在社招时只能招对应 P6 或者 P7 职级的人才。此时,Qwen 的研究员去 Seed,一般来说职级上至少升 2 级。晋升难,薪资和职级严格挂钩, Qwen 一度面临人才流失。

2024 年 7 月,周畅从 Qwen 离职并签署竞业协议。两个月后他加入字节,从事大模型相关工作。阿里递交了劳动争议仲裁申请。这是这场人才大战中最早引起公众关注的竞业纠纷之一。

周畅离职后,阿里高层给 Qwen 大多数成员升了一个职级,附带提高激励,但也只是亡羊补牢。Qwen 也一直在向阿里高层争取和行业同水平的人才激励。2025 年下半年,林俊旸曾让 Qwen 研究员主动出去面试,以求到涨薪的机会,避免人才外流。直到 2026 年 3 月,林俊旸本人也离开了阿里。

除了大厂,AI 初创公司同样是这场博弈中激进的买家。有创业公司愿意为研究员开出高额纯现金的薪酬包,来吸引核心人才加入。

目前,这场大战已经变成了一个混乱的漩涡,几百人在几家公司来回流动。

DeepSeek、Kimi 等还没上市的创业公司失血,研究员流向字节、腾讯、小米等大厂;Seed 内部竞争激烈,过去一年至少流失 70 人,同时又从 DeepSeek 和阿里定向挖人;Qwen 内部经历人才与组织的摩擦,和管理的阵痛,一部分人去了字节、腾讯和创业公司;而腾讯暂时成为最激进的买家,从国内外同时挖人,想快速赶上大模型第一梯队。

比抢人更难的是留人

在这场天才的争夺中,对公司来说,留人的成本和挖人的几乎一样高。一贯用纯现金薪酬吸引人才的 DeepSeek,在智谱和 MiniMax 上市后,吸引力有些失效了。

智谱和 MiniMax 相继上市、股价高涨,期权价值膨胀接近 10 倍;阶跃星辰、Kimi 的 IPO 也提上了日程。对于创业公司来说,留人的最大筹码就是上市后手中期权的暴涨,以及上市后长达半年到一年的解禁期。因此目前,智谱和 Minimax 的人才流失压力不大。

但 DeepSeek 不是。DeepSeek 此前没有估值,也没有明确的融资计划,员工手中的期权无法流通,也没有可预期的变现方式;且 DeepSeek 期权归属期很长。一般公司的期权全部归属年限是 4 年。

梁文锋重新接洽投资方,融资、估值,给员工们更强的确定性。2025 年秋天开始,DeepSeek 开始做更多产品化和商业化方面的布局。梁文锋多次在全员会上提及上市,和员工同步融资、估值计划。最近的消息是,DeepSeek 的首轮融资,计划融 500 亿元,梁文锋个人出资 200 亿,投后估值或超 3500 亿元,目前这轮融资还没有最终敲定。

同期,没有上市计划的字节也多次提高 Seed 部门成员激励,避免人才外流。2025 年 9 月,字节为 Seed 部门单独发了一笔期权津贴:按绩效和职级不同,每人每月可获得价值 9 万、11 万或 13.5 万元的字节期权,首批连续发放 18 个月——按 1300 个正式员工,金额取最低 9 万,字节投入了超 过 20 亿的成本留人。

除此之外还有豆包股。豆包股是去年 10 月字节内部为豆包相关大模型业务建立的一套虚拟股机制,通过为员工发放虚拟股权,激励、稳定人才。员工入职字节总包有很多部分,现金、期权、豆包股、签字费,与未来激励相关的还有项目奖、绩效奖、创业激励等。

入职腾讯的总包虽然没有这么复杂,包含常规的现金、期权、签字费,但腾讯一般会用签字费补全和其他家浮动的金额;阿里也有相应的激励,且 P9 以下直接发放现金吸引人才。知情人士告诉我们,曾有 P8 向通义高层提出离职,阿里为了挽留人才,当即承诺给人晋升,以及发放接近百万的现金奖励。月之暗面也在今年初推出新的顶尖人才校招计划,直接授予尚未毕业的实习生公司期权股数。

即便如此,还是不断有人离开,只靠钱有时候也留不住人,还要靠制度和文化。

公司们通过各种协议,层层设卡,让这些跳槽的研究员付出更高代价。竞业协议是最常用的手段。研究员离职后 6 到 24 个月不能加入竞对,有些公司虽然会帮忙承担违约金,但对大部分普通研究员,这还是比较有效的限制手段。从全行业来看,一个显著的变化是,2023 年,竞业协议还未覆盖基模团队所有成员;到 2025 年,进入基模训练流程的每一位入职员工都必须签署。

近期字节还要求员工签署脱敏协议,提出离职申请的员工需要继续待在公司 3 个月才能离开。据了解,这也是行业普遍存在的现象,腾讯也在推行。这在以月为单位变化的模型领域,对员工来说是巨大的机会成本。

除了这些,大模型研究员们在意的还有:和谁一起工作、做的事有没有意义、有没有自由。

各家都在调整组织形态来匹配这种需求。大公司取消 KPI/OKR,弱化职级,组成项目制,甚至实习生也能直接与最高层交流。

《海外独角兽》在文章里统计,研究员入职 Claude Code 母公司 Anthropic 2 年后还在的比例是 80%,是当时头部 AI labs 里最高的,超过 DeepMind 的 78%。CEO Dario 会花 30% 到 40% 的时间确保 Anthropic 的文化是好的。

DeepSeek 曾用 “不融资、不商业化、只做研究” 的叙事吸引了一波行业内最顶尖的天才。他们人少,每个人的权限足够大,展现出了少数好的人能带来 “突破性” 成果的可能性。

随着人数的变多,“天才的想法” 也成为组织熵增的一大来源。“他们从前是自己领域内的 ‘小霸王’,带着 ego 来到 Seed,每个人都想成就一番事业。” 一位 Seed 人士说。我们此前提到,Seed 会出现一种情况:几个研究员决定自发研究一个方向,如果上级不同意、不分配资源,他们可以上升汇报,得到认可后,就可以从上到下推进。

天才们有自己对这个领域走向的判断,这些尝试有时候和公司的商业利益完全不相关。过去这是一些大公司能承受的损耗。但行业内明显的感知是,模型的技术路径在收敛,很多人担心行业对创新的需求不那么高了。抢人大战或许很快会迎来转折点。

努力变得值钱,同时付出代价

这个行业里的人才,放到任何别的地方都是被仰望的天才。他们聪明、有能力,名校毕业、顶会论文、有扎实的工程能力——这在大多数行业,足以让他们成为组织里的焦点。

当全世界最顶尖的人同时涌入同一条赛道,天才和天才之间的竞争,就成了神仙打架,天才们需要用更多的努力去证明自己的身价。

对大模型研究员来说,最直接影响自己身价的,是自己的研究成果会不会被看到。一位招聘从业人士告诉我们,研究员的 “定价”,是根据 “AI native” 的程度,学历背景、论文情况、项目经历都有影响,面试更多是增量信息和薪资谈判。

一个典型例子是,DeepSeek-V4 技术报告公布后,有公司的高招人士、猎头,连夜根据 V4 列出的核心贡献者 “按图索骥”,寻求联系。去年 3 月,吴永辉刚接管 Seed 基础研究不久 ,曾在部门全员会上提到,Seed 做了很多不错的工作,但外界不太了解,他鼓励研究者以论文和博客的形式发表成果。“他还建议大家 ‘装修’ 下个人主页。” 一位曾在 Seed 的人说。

根据我们初步统计,吴永辉加入 Seed 之后的三个月,该团队发布的论文数量就超过 2024 年全年。但后来由于人才竞争太激烈,对外的展示逐步减少。目前,各家公司都尽可能保护核心研究员的信息,让他们减少和外界沟通,防止被对手挖角。

但对研究员个人来说,代码不开源,论文不发表,成果就只存在于公司内网。且技术迭代太快,几天之前还很新的进展,一周之后就被新的成果淹没了。

越来越多人主动做起技术 PR,这成为大多数 AI 领域的博士生,和开源模型研究员们工作生活的一部分。2025 年,从 “Ask me Anything”,到技术问题、论文解读,再到研究困惑、行业见解,越来越多的研究员开始在小红书、推特等平台运营自己的账号,尽管此前他们从不在社交媒体发言。

“技术需要 PR。” 一位研究员告诉我们,“对做开源模型的公司来说,两个技术实力相差不大,但其中有位自带流量的技术 Leader,公司会更偏向于要后者。” 顶流研究员能给一家公司带来更多曝光和机会。

研究员们拿着和流量明星几乎同水平的工资,工作内容也越来越像流量明星:工作,为自己 “打歌”(做技术 PR);他们接受播客的采访,发表自己的观点,甚至 “发疯”;也像流量明星一样,花时间思考受众喜欢看什么样的内容。学术会议后,研究员们应邀参加大公司的宴会,在米其林菜品前谈论技术进展。

甚至他们的日常生活都变得像明星,要随时保护自己的个人隐私。有些研究员因为竞业失去自己的名字,为了避免前公司聘请的私家侦探在他们可能入职的公司门口拿着相机偷拍,他们不得不换上全新的手机号、微信号,带着口罩、墨镜出现在公司,有时还会流动办公,没有自己的工位。

问题在于,研究员的工作强度更高,甚至职业周期可能还不如流量明星。一位大模型研究员告诉我们,他们的工作常态是 10116(10 点上班,11 点下班,一周工作 6 天),但他只是实习生。正式员工熬夜到两三点是常态,从前工作比较多的时候也会通宵,“2023 年那会经常三天睡两觉”。

公司为了留住他们,提供充足的资源,足够的权限,不设 KPI 和 OKR 。天才天生自驱,他们需要超越同行来证明自己。激烈的竞争中,总有人会被淘汰。“有明星 paper,做过核心项目的,职业周期可能长一些,1 年以上;一般的研究员 3 个月不出成果,可能就要面临认知过时的质疑了。” 一位研究员说。

xAI 是一个典型样本。马斯克给研究员们发足够多的钱。早期,员工晚入职一天就可能错过百万美元的收益。但入职后,员工处于高压状态:每两周汇报一次成果,没有产出的人随时会被辞退。

不到一年,联创出走,团队核心成员接连离职。xAI 说明一件事,当人们做事的追求,从 “把这件事做好”,悄悄变成了 “我做什么,才能在这儿多待一周,拿到更多的钱”,这对需要长周期积累的基础研究来说,无疑是一种损伤。

2026 年初,一位一线团队核心研究员告诉我们,Agent 的能力不断延伸,他们的团队正在焦虑未来可能会被 AI 取代,但他们不能停止研究的步伐。另一位研究员也告诉我们,Coding Agent 已经能帮助他做 90% 执行的工作,他每天需要做的事情是给这些 Agent 下达清晰、高质量的指令。

“这个行业最终会变成,前 5% 的人拿着从前 10 倍的工资,干着 100 个人的活。” 一位研究员说。技术正在服务越来越多的人,但获得高额收入的人却越来越少。随着技术路线收敛,创新的需求降低,大多数研究员会回归普通工作。

窗口不会永远都开着。

司雯雯、申远对本文亦有贡献

题图来源:Billions

暂无回复,快来抢沙发吧!

  • 1 / 1 页
敬请注意:文中内容观点和各种评论不代表本网立场!若有违规侵权,请联系我们