身在 Kimi 的 800 天

前两天有一篇和 Kimi (Moonshot-AI) 公司文化有关的文章在自媒体平台引起一些讨论(不放原文链接了,如果您没看过原文,也不会影响本文阅读)。 那是一篇用文学笔触构建的美丽故事,虽然不少“奇闻轶事”确有其事,但并没有代表性,但确实也引起了不少读者的误解。 Kimi 当然有自己独特的组织文化氛围和价值观,但通过堆砌怪异细节、迎合大众对nerd的刻板印象,显然不足以传递出正确的信息。

Kimi 是我深度参与的第五家创业公司,我想,我应该有能力提供一个更准确的叙事角度,描述 Kimi 的独特性。

开局先叠甲:以下内容全部是我从个人立场出发看到的部分选择性事实和带有强烈个人倾向的有偏解读,不代表完整事实、不代表公司立场,更不构成投资建议。


Kimi 并不独特

2011 年的夏天,即将大四的我来到北京准备读研/找工作之类的事情,我幸运地得到一位高中学长推荐的机会,到清华电子系的一个课题组参与项目开发。 几个月后,我通过了清华的推研复试,而我参与的课题项目也在顺利推进并逐步走向产业化,并终于在2013年成立了公司开始正式运营,这是我的第一份“工作”,是比“创业公司”更早期的工作。

我的第一个“创业项目” (比那些敲键盘喝咖啡的不知道高到哪里去了)

此后我逐渐从项目中淡出,专心享受校园生活顺便研究自己的博士课题。那几年正是鼓励“大众创业、万众创新”的年景,实验室里也陆续孵化出了其他创业公司, 那些昨天晚上还穿着拖鞋裤衩儿一起吹牛打游戏的师兄弟,第二天可能就西装革履地出现在某个路演现场,用“大家好,我是XX科技的CEO”开头向潜在的投资者们介绍自己的项目。

2016 年,又是一个夏天,在同学们每天张口闭口就是 CNN/ImageNet/Caffe/炼丹 的氛围中,我终于坐不住了,经两位学弟内推,加入了旷视科技。

那时的旷视,只有二百来人,技术和理念也都很先进, 交付/迭代速度也很快,暑假两个月的实习期,我本人就直接参与了三个产品的定义、研发和交付全流程。当时我们常调侃 公司里面“通信基本靠吼”,MegBrain 出bug了就直接走两步找开哥,训练平台挂了再走两步就能找到wjf…… 吵吵闹闹,乱乱糟糟,欣欣向荣。

那时的旷视,很少有我这样的博士生,研发主力是刚毕业或退学的本科生,更厉害的是实习生,最厉害的是高中生。那年暑假,我常听大家提起一个叫“小强”的同事,由于去 stanford 参加暑研所以没有在公司出现,他是旷视的6号员工,高二就被文斌“骗”过来实习了,是工龄与公司年龄一样的老师傅。 巧合的是,那年9月旷视组织调整,一直到我2023年离职之前,小强都是我的直接领导。

那时的旷视,处在剧变的前夜,Alpha Go 的出现让资本开始密集关注到 AI 相关领域,行业竞争开始加剧,旷视的看家本领“人脸识别”技术优势开始被竞争对手赶超, 事情开始变多、变难、变复杂,“数据不够、卡不够、人不够”的矛盾越来越显著,公司的管理文化也开始从“学 Google”转向了“学华为”。虽然加班变多,事情更难做, 但业务收入确实也在快速增长,如果不出意外的话,2019年旷视应该完成 IPO 成为“中国AI第一股”。

很快,意外就来了,而且是成群结队的来,实体清单、疫情、还有各种不能说的,旷视的首次 IPO 终止,第二次 IPO “中止”了两年多。 但大家仍然在用最大的努力推动公司发展:IPO 可以停,公司的业务改进不能停、组织与管理升级不能停,IPO 与否是表面的,健康的财务和组织是本质的。 除了业务和技术外,公司在各个层面都组织了多样的管理学训练营,我有幸参加了其中的很多个,学到了不少有用的知识和技巧。 虽然经历了严重的、连续的外部打击,但那时的旷视人确实在认真准备着,发展成一家健康的中型公司,等待机会。

2022年11月,旷视的机会没有来,ChatGPT 来了,属于旷视和“AI四小龙”的时代结束。

有朋友嘲讽我:“你为kimi哭过吗”,我没有,但我绝对为旷视哭过不止一次。

Kimi 并不独特,任何一家人员规模在同等量级的的公司,只要老板愿意,都应该有能力做到没有部门墙、组织灵活调整、直接沟通、快速迭代。 摇滚文化也并不独特,你甚至完全可以类比到阿里当年的“武侠文化”影响下,到今天还特色的“花名”制度。天才少年也并不少见,只我一人就认识好几个不同时代的天才,放眼整个 中国,优秀人才每年都在不断涌现。

Kimi 并不独特,公司并不是没有管理,而是在当前的市场洞察和业务设计下,基于领导者的战略意图与价值观,自然演进出来的文化氛围与组织设计(这段是为了证明我真的学过而故意不说人话)。 说人话:AI 时代每周都有大变化,传统的季度/双月OKR/KPI拉通对齐那一套怎么可能跟的上。

kimi 并不独特,有人的地方就有政治,屁股决定脑袋是人类社会的必然规律。300多个不同背景、不同经历、抱着不同目的的人,毫无隔阂相互完全理解,这不仅仅是天方夜谭, 我愿称之为 1984/美丽新世界 一般的反乌托邦恐怖场面。在相对粗放的管理状态下,不合适的(意思就是我不喜欢的)人显然也有不少。

Kimi 并不独特,被 DeepSeek “拯救”的公司也不止 Kimi 一家,同期的智谱在 2023 年眼看着就要走向 “AI 1.0 的老路”,到后面完成业务转型和组织大换血 (这些是听说的), 经过剧烈动荡后仍然能输出 GLM 4.5, GLM 5 这样的优秀成果,我非常钦佩。

Kimi 并不独特,只是每个时代都有自己的烙印,我有幸亲眼见证了“万众创业”的时代、Alpha Go 时代、“降本增效、学华为”的时代以及现在正在经历的又一个 AI 时代。 如果你仔细观察,会发现每个时代,几乎每一家公司都在做类似的转型,只是每个公司具体情况有所区别而已。发生在 Kimi 的那些“不一样”的事情,大部分只是当前这个 极速变化的时代在他身上的投影。

Kimi 并不独特,他只是做了很多该做的事:

  • 模型公司要做模型
  • 做 research、发paper要做实验
  • 训模型要看 metric
  • 不 work 的东西不要硬上

你看,这就是一堆理所应当的事情。

把理所应当的事情都做到,并不是一件简单的事。因为我确实见过模型公司不做模型;也见过占坑 paper 没有实验,无法复现/实验无法自圆其说的paper更是数不胜数; 训模型靠“赌一把”的大有人在;为了个人利益不 work 的东西硬要上的事例我相信每个人都见过。

把理所应当的事情都做到,确实已经领先99%的人,但这是个比烂逻辑,没有增量价值。

去年有一段时间大家在密集地迭代改进 K1.5,试图做出一个能与 Deepseek-R1 相当的 “K1.6” 出来 (是的你今天仍然能看到它的痕迹),项目如火如荼的进行,我不知道植麟经过了多长的思考, 最后说出“不发了”三个字的时候,房间里很安静,几秒钟后,大家都松了一口气。

所以,真正难做的是那些不理所当然的事情,而这一点,我只能说现在还远远不够,目前的进度也让我无法厚着脸皮说哪里做得好了。

愿 SGD 之神保佑,让我有机会下次再说吧。