32岁林俊旸官宣告别,阿里大模型就此转向?

摘要

【摘要】 林俊旸离职,阿里AI就此转向

2026年3月4日凌晨,阿里巴巴通义千问(Qwen)技术负责人林俊旸在社交媒体X(原推特)上发布了一条简短的推文:“me stepping down. bye my beloved qwen”(我要卸任了。再见,我亲爱的Qwen)。


然而就在前两天,Qwen刚把Qwen 3.5的小模型阵列亮出来:0.8B、2B、4B、9B,主打能在更轻的设备上跑、用更少算力挤出更高的“智能密度”。更戏剧的是,埃隆·马斯克还在X上留言夸“impressive intelligence density”。这类外部认可,本来是团队最该庆祝的时刻。


结果不到一天,“我卸任了”。


这一消息迅速席卷了国内AI行业,几乎所有人都在追问其离职的原因。之所以引发如此巨大的震动,是因为在林俊旸推文下,千问核心成员Chen Cheng转发并留言称自己“心碎”,并表示“我知道离开并非你的选择”。这一表态迅速被外界解读为:离任背后或存在组织与管理层面的原因,而不仅仅是个人职业选择。


截至目前,当事人并未对外给出完整解释;但围绕这次“突然卸任”,正如Hugging Face亚太区生态系统负责人王铁震所言:林俊旸的离职对通义千问项目而言是“巨大损失”。而在模型竞争愈发激烈的当下,行业里最集中的猜测,主要落在两件事:组织怎么改、方向往哪儿走。


架构调整引爆矛盾?


先说最像“导火索”的那根线:组织架构。


不少相关分析都认为这是两方矛盾爆发的根源。这也是为什么在3月4日中午左右的内部沟通会上,高层把重点放在“这是扩张、不是收缩”,并承认在组织沟通上存在不足。


之所以会出现这样的情况,根源其实就在于组织架构到底应该是垂直还是水平整合。


如果整理林俊旸的相关公开发言,可以发现他曾在多个不同场合多次提到:预训练、后训练乃至Infra(基础架构,在AI领域一般指支撑AI应用从开发、训练、部署到运行的所有底层技术和工具的总称)与训练团队需要更紧密的协作与沟通,以提升端到端能力迭代效率。


在这个层级的最上层,林俊旸直接负责的Qwen(通义千问)团队隶属于阿里云CTO周靖人负责的通义实验室,但就在近期,通义实验室计划将千问团队分拆。虽然这些团队仍隶属通义实验室,但这依旧会使得组织架构从涵盖不同训练流程和模态的“垂直整合”体系,变成预训练、后训练、文本、多模态等分开的水平分工团队。


针对这次调整,阿里巴巴首席人才官蒋芳也承认沟通存在不足:我们在快速发展,这波调整是为了扩充更多人才、提供更多资源。这次组织形式没沟通好,新人引入肯定会带来阵型变化,扩大过程中必然涉及到这些,我们可能没处理好。


这类调整并不罕见,大厂里也常见,不可否认的是,包括字节、谷歌这些大厂的组织架构几乎都是水平分工团队,这也从某种程度上证明了水平分工团队有其独特的优势区间。从某种程度上来说,现阶段大模型的训练发展正朝着工业化方向迈进,水平分工的工业化效率会更高,也更适合商业化团队。


但水平分工也并非没有坏处,从员工角度来看,这样的组织架构很容易出现各个分组有不同KPI,最终导致整体协作能力降低。


毕竟,历来大厂跨部门合作都是极大的难点。几乎所有大厂员工可能都经历过:一旦想要其他部门的员工花时间帮你完成任务,就意味着你大概率要找对方的直属领导,甚至两个部门员工共同的大领导才能推进工作。员工要推进一个端到端优化,很可能要跨多个组拉齐节奏。甚至最终导致每个分组都有自己的KPI,最终导致“谁为整体结果负责”这件事变得更加模糊。


于是,在两厢取舍之下,阿里选择了更适合扩张和商业化的水平整合,而不是继续沿用林俊旸更看好的垂直整合模式。


这种矛盾很快被互联网加工成:林俊旸是被迫离职的“悲情功臣”。而逼林俊旸出走的手段,就是用DAU来当作千问新一年的KPI。这则传言最初的源头来自卡内基梅隆大学InfiniAI实验室和Catalyst(一个跨学科的机器学习与系统研究团队,人员基本由卡内基梅隆大学的研究人员构成)的博士生Xinyu Yang。



这种传言虽然从逻辑上来说确实没问题,毕竟让基础模型研究的团队用考核App的标准做KPI,是个人可能都会不满。加上最近千问在经过一系列营销活动后,日活依旧和豆包有巨大的差距(豆包已有仅2亿日活,目前千问约为7000万),用DAU做考核确实符合“外行指导内行”的想象,由此该传言自然变成了流传最广的版本。


随后,大量媒体引用了这一观点,加上开篇提到的核心成员Chen Cheng的发言,一时之间,DAU作KPI逼走往日工程的传言甚嚣尘上,风头一时无二。但情况真得是这样吗?


但根据Morkeing的多方求证后,基本可以确定这是大概率是不实消息。


首先要说明的是,此前林俊旸负责的Qwen团队隶属于阿里云 CTO 周靖人负责的通义实验室,确实承担着大模型技术研发的核心职责,如今的千问APP也最早出自这一部门。 但是阿里为了进军C端,先是将“AI超级框”夸克定位为AI旗舰应用,此后又将千问APP并入脱胎自原夸克所在AIDC部门的千问事业群,在千问APP内接入电商、外卖、导航等功能。


因此,即使以DAU作为考核KPI,这也应该是AIDC部门的千问事业群的KPI而非Qwen团队。


其次,几位近千问团队的人士对Morketing表示,即使是商业化层面,今年千问的商业化的KPI也是MaaS(模型即服务)收入,而非DAU。


而这则揭开了双方之间最根本的思路不同——到底是技术推动商业发展,还是以商业化为核心推动技术发展。



商业与技术,
到底谁才是推动者

根据相关受访者的言论来看,管理层和林俊旸之间也存在着明显的决策差异:公司管理层更看重旗舰模型的能力,而不是千问目前发展较好的小尺寸模型,因此其考核标准也更偏向考核旗舰模型的能力


然而,现阶段,如果将千问作为一个开源产品来看待,它毫无疑问是成功的。无论是从相对专业的测试还是业内人士的评价来看,在小尺寸LLM(大语言模型)领域,千问都是毫无疑问的王者水平。无论是Z-image、Qwen-image还是通义万相(Wan)系列视频生成模型,都处于业内领先水平。


这意味着,如果只考虑个人使用和本地化部署,千问确实是现阶段小尺寸LLM里的最优解。


但说实话,千问的旗舰模型相比之下,就显得多少有点差强人意,无论是Qwen-Plus还是Max,几乎很难和同时期的DeepSeek一较高下。与业内大多数优秀模型对比只能说是勉强没有掉队,但大概率不是最优解。如果具体到某些特定领域,例如coding(编程)、生成图片和生成视频的能力,更是难与时下领先的产品一较高下。


但就像上文提到的今年千问的商业化的KPI是MaaS收入。显然,集团是希望千问能够在2026年迅速完成商业化的。


这点从今年红包大战上就已经能够看见端倪。相比其他家几乎都只是在AI领域占位,千问是为数不多给自己框定了相当明确使用场景的大模型,例如让用户点外卖,淘宝购物。


除此之外,一位曾经尝试过使用不同大模型API做测试的用户也向Morketing表示,自己注册过多个不同平台做测试,只有通义是注册完不久之后就有销售打电话来询问他的诉求,甚至在近期调用已经很久不用的千问API后,对方销售也迅速打电话来询问使用情况。


这一系列的事件,无一不在证明集团对于商业化的迫切诉求。然而这恰恰是双方对于大模型研发的逻辑差异所在。


对于林俊旸而言,在现阶段,大模型转应用的未来并不明确的情况下,他大概是期望通过小尺寸LLM打磨团队开发能力,同时通过开源获得社区反馈,从而反哺模型训练。并且即使未来产品真的要商业化,千问全尺寸、全模态的模型路线可以让很多企业、学校的技术从业者能够很快选用到适合自己的模型,建立了好口碑。在这些模型落到生产环境后,很多企业主也会倾向于购买千问的模型服务,从而在模型成熟后快速推动商业化进程。


其逻辑的核心是用技术进步推动商业发展。


然而,从公司的角度来说,这套逻辑显然并不容易被接受,一方面开源软件的商业逻辑很难论证,这是几乎所有开源软件长期都在面临的问题,国内外都如此——Meta花了数十亿美元训练的开源大模型Llama,外界至今都还在争论这笔账究竟该怎么算,而且Llama也确实没能在财报上为Meta添砖加瓦。


与之相反,当Google大范围禁止工作人员发表大模型的相关论文后,虽然公司内部产生了不少反对声音,但随着Gemini的不断迭代,Google母公司的股价反而在稳定上升。


这对于阿里而言,几乎是只有一个答案的选择题,随着现如今字节旗下的豆包已然接近2亿日活大关,还有尚未完全发力的腾讯在后方虎视眈眈,这就意味着阿里自家的旗舰模型关系的已经不再是一个小问题,而是关系阿里云的商业化闭环,以及整个阿里集团的未来的重要决策。


这使得基于商业化需求推动技术革命,就成了阿里目前最好的选择。


于是,对于集团高层管理而言,如何快速的将大模型真正意义上商用,自然就成了眼下最着急的任务,毕竟股价、市场预期都在背后推动商业化的诉求,而大模型是否能够快速商用,旗舰模型的重要性不言而喻。


也正因此,双方对于商业化的急切程度明显不同,导致了研发思路完全不同,最终矛盾演变成了双方的分道扬镳。


大厂AI掌门人离职,
似乎已经成了行业规律

从某种程度上来说,AI掌门人的离职几乎成了一种必然的宿命。


技术与商业化似乎天然存在一个悖论:技术负责人往往有着理想主义者的光辉,他们希望通过技术推动商业化变革,用技术改变世界。与之相对,科技企业却更希望通过商业化推动技术革新,认为技术只有为商业服务才有价值。


虽然人们总是说金钱是改变世界的附赠品,赚钱是技术革新的必然,但对于上市公司而言,追求稳定、有效几乎是一条必然路径。


之所以这么说,是因为如果将林俊旸的离职置于更广阔的视野下,我们会发现这是一场跨国界、跨公司的共同问题。百度曾经的吴恩达,也在科研向产品化的转型中离职;OpenAI内部核心成员如Ilya Sutskever,也在安全与商业、理想与现实的终极对抗中离开。即使是现如今日活最高的豆包,字节跳动的AI相关负责人也经历过多次更迭。


虽然目前我们尚不清楚林俊旸的下一步去向,也不清楚这次人事变动会对通义千问的未来发展产生何种影响,但核心人物的离职对于AI行业而言再正常不过。只不过在全球AI军备竞赛的关键节点,千问能不能押准未来,用自己的工业化能力走出失去核心技术负责人的阴霾,并找到属于自己的位置,才是决定千问未来的核心关键。



觉得内容还不错的话,给我点个“在看”呗

图片
图片

Morketing原创发布,未经授权请勿转载

收藏 收藏 0
行业

洲际酒店、麦德龙、优信,为何不约而同选择AI解决增长问题?

行业

微博“种草”,阿里“拔草”,如何实现社交流量的反复收割?

评论 · 0

请先后参与评论