光子AI / 编著
闫俊杰,1989年出生,河南人,Minimax创始人兼首席执行官。2006年考入东南大学数学学院,2015年博士毕业于中国科学院自动化所模式识别国家重点实验室,并在清华大学计算机系从事博士后研究,在深度学习和计算机视觉领域发表多篇学术论文。曾任商汤科技副总裁、研究院副院长及智慧城市事业群CTO,主导构建通用计算机视觉模型和智慧城市技术体系。2022年初在上海创立上海稀宇极智科技有限公司(Minimax),公司以“与所有人共创智能”为使命,致力于实现通用人工智能(AGI)。2024年8月入选《财富》中国40位40岁以下商界精英榜。2024年上半年推出商用万亿参数MoE架构大模型abab 6.5,并发布开源模型MiniMax-01系列。2025年7月完成近3亿美元C轮融资,投后估值达40亿美元。截至2025年9月30日,公司拥有超过2.12亿个人用户和13万企业客户,产品覆盖200多个国家和地区,海外市场收入占比超70%。2026年1月9日,MiniMax在港交所上市(股票代码:0100.HK),全球发售3358万股,发行价165港元,首日市值突破700亿港元。公司研发多模态大模型,覆盖文本、语音、图像及视频等领域,闫俊杰在2026年初公司上市时指出,真正的通用人工智能必然是多模态输入与多模态输出的融合体,并透露公司计划在未来几个月将各模态整合到统一模型中。
光子AI,让AI像光一样照亮每个人 / Photon AI & AI Genius Institute, 2026
您的慷慨捐赠,将帮助我们持续为读者提供高质量的内容。
Donate to Photon AI & AI Genius Institute Generously,and we will continue to provide high-quality content for readers.
| 微信 | 支付宝 |
|---|---|
![]() |
![]() |
2016年3月9日,首尔四季酒店的一间会议室里,空气凝固得近乎窒息。
李世石执白落下第四手棋,神情笃定。这位曾十八次夺得世界围棋冠军的传奇棋手,在此刻仍相信人类智慧的不可替代性。而他的对手——谷歌DeepMind开发的AlphaGo,只是一个由服务器、算法和无数条电线组成的冰冷系统。
五天后,比分定格在4:1。李世石输了。
全世界为之震惊。围棋是人类智力活动中最复杂的游戏之一,其可能的棋局数量超过宇宙中原子的总数。数千年来,人类一直相信这是机器永远无法征服的领域。然而,AlphaGo用一种人类棋手从未见过的下法,撕碎了这种傲慢。
在中国,数以亿计的观众通过直播见证了这一历史时刻。其中有一个人,彼时正在商汤科技担任技术研发工作。他盯着屏幕上那些匪夷所思的落子,心中涌起的不是恐惧,而是一种难以言喻的兴奋——
如果AI能够在围棋这样的"封闭问题"中战胜人类,那么在"开放问题"中呢?在理解语言、生成文字、创造艺术、辅助决策这些更接近日常生活的领域呢?
这个人叫闫俊杰。五年后,他将创立一家名为Minimax的公司,试图回答这个问题。
AlphaGo的胜利标志着深度学习技术的里程碑式突破,但它仍然是一个"专用系统"——只会下围棋,其他什么都不会。真正让AI从"专才"走向"通才"的,是另一场静悄悄的革命。
2017年6月,谷歌大脑团队在一篇论文中提出了一种新的神经网络架构。论文标题平淡无奇:《Attention Is All You Need》(注意力就是你所需要的一切)。这篇论文介绍的Transformer架构,将在此后几年彻底改写AI的历史。
与此前主流的循环神经网络(RNN)不同,Transformer通过"自注意力机制"(Self-Attention)处理序列数据,能够同时"看到"输入序列的所有位置,并自动学习哪些位置之间存在关联。这一设计突破了序列长度的瓶颈,让模型可以处理更长的文本,也让并行计算成为可能——模型训练速度大幅提升。
2018年,OpenAI发布了GPT(Generative Pre-trained Transformer),一个基于Transformer的语言模型。GPT-1只有1.17亿个参数,在当时看来已经相当庞大。但它真正的革命性在于"预训练+微调"的范式:先在海量无标注文本上学习语言规律,再针对具体任务进行微调。
2019年,GPT-2来了,参数量达到15亿。OpenAI以"担心被滥用"为由,一度拒绝公开完整模型——这个举动本身就说明了AI能力的质变。
2020年6月,GPT-3横空出世。1750亿参数,训练数据涵盖几乎整个互联网。它不再需要针对特定任务微调,只要在提示词(prompt)中给出几个例子,就能举一反三地完成各种任务:写文章、编代码、翻译、问答、甚至创作诗歌和剧本。
科技界炸了。
人们突然意识到:所谓的"通用人工智能"(AGI),或许不再是科幻小说里的概念,而是正在逼近的现实。
规模效应(Scaling Laws)被验证:只要模型更大、数据更多、算力更强,性能就会持续提升,而且是以一种令人不安的可预测性提升。这不是量变,而是质变的前兆。
当GPT-3在大洋彼岸掀起波澜时,中国的AI产业正处于一个微妙的历史节点。
2014年至2018年,中国AI领域经历了一轮资本驱动的狂欢。商汤、旷视、云从、依图——这四家计算机视觉公司被媒体冠以"AI四小龙"的称号,估值纷纷突破数十亿美元。它们的技术底色高度相似:基于深度学习的图像识别,应用场景则聚焦于安防监控、金融风控、手机美颜等领域。
商汤科技是其中估值最高的一家。2021年底,商汤在港交所上市,市值一度突破1500亿港元。作为"AI独角兽之王",它承载着中国资本市场对AI产业的最大期待。
但问题正在浮现。
第一,技术同质化严重。 "AI四小龙"做的事情本质上大同小异——都是用深度学习处理图像。技术门槛不高,护城河不深。一位投资人私下感叹:"你仔细看它们的PPT,换个Logo基本分不清是谁家的。"
第二,商业化路径狭窄。 安防是最大的市场,但安防市场的甲方是政府。政府项目周期长、账期长、定制化需求多、毛利率却不高。更重要的是,安防市场终究是有限的——当渗透率达到一定程度后,增长必然放缓。
第三,ToB的诅咒。 这些公司本质上都是"卖技术给企业"的ToB公司。ToB意味着漫长的销售周期、复杂的客户关系、低效的规模扩张。与互联网公司"赢者通吃"的网络效应相比,ToB公司很难实现指数级增长。
第四,资本泡沫的代价。 在融资驱动的增长模式下,估值越来越高,但利润却遥遥无期。投资人开始失去耐心。2020年至2021年,多家AI公司冲击IPO,但上市后股价纷纷破发。市场在用脚投票:你们讲的故事很好听,但我不买账了。
2021年,当商汤在港股上市时,闫俊杰正站在人生的十字路口。他在商汤待了七年,从实习生做到研究院副院长、智慧城市事业群CTO,亲历了这家公司从初创到巅峰的全过程。他比任何人都清楚"四小龙模式"的天花板在哪里。
他也在思考一个更根本的问题:AI到底应该是什么?
是卖给企业的一个"技术环节"?还是直接面向亿万用户的"产品本身"?
是服务于少数精英客户的昂贵工具?还是每一个普通人都能使用的日常基础设施?
GPT-3的成功揭示了一个朴素但深刻的道理:规模(Scale)就是力量。
更大的模型、更多的数据、更强的算力,就能带来更好的效果。这被称为"Scaling Laws"(规模定律)。OpenAI的研究表明,模型性能与参数量、数据量、算力之间存在幂律关系——投入增加十倍,性能提升就可预测。
这意味着什么?
意味着AI不再是一个"小巧精妙"的技术问题,而是一个"规模投入"的工程问题。谁能堆砌更多的GPU、训练更大的模型、喂养更多的数据,谁就更有可能胜出。
但这也带来了新的门槛。
训练GPT-3花费了多少钱?OpenAI没有公开,但业界估算至少在1000万美元级别。这还只是一次训练的成本。如果算上反复试错、调参、扩展,总成本可能高达数千万甚至上亿美元。
算力需求更是天文数字。GPT-3训练使用了数万张英伟达V100 GPU,运行了数周时间。而彼时,全球最先进的AI芯片几乎被英伟达垄断,价格高昂且供不应求。
2020年底,OpenAI获得了微软10亿美元的投资,并获得了Azure云计算平台的优先算力支持。这笔交易的背后逻辑很清晰:大模型是"烧钱游戏",只有科技巨头才能玩得起。
中国呢?
2020年,中美科技脱钩的阴影开始笼罩AI产业。华为被列入"实体清单",高端芯片断供。虽然AI训练芯片尚未被全面封锁,但所有人都意识到:这只是时间问题。
一个尴尬的现实是:中国有庞大的应用场景、丰富的数据资源、充沛的工程人才,但在最核心的芯片和基础算法上,仍然高度依赖美国。当OpenAI在GPT-3上一骑绝尘时,中国甚至没有一家公司能够复现这个模型——不是不想做,而是做不出来。
2020年底至2021年初,中国AI创业环境呈现出一种奇特的"冰火两重天"景象。
"火"的一面是政策。 2020年3月,中央提出"新基建"战略,人工智能被列为七大领域之一。各地政府纷纷出台AI产业扶持政策,产业园区遍地开花。2021年,"十四五"规划将AI作为"战略性新兴产业"的重点方向。从国家到地方,对AI的支持力度空前。
"冰"的一面是资本。 经历了2018-2019年的投资狂潮后,一级市场开始冷却。投资人变得谨慎:AI公司估值太高、盈利遥遥无期、商业化故事越来越难讲。2020年,中国AI领域融资总额同比下降超过20%。二级市场更是惨淡:几乎所有上市的AI公司都在破发。
这是一个筛选的时刻。
那些依赖资本输血、缺乏真正技术壁垒和商业闭环的公司,开始感受到寒意。而那些真正相信技术力量、愿意做长期投入的创业者,则看到了窗口——正因为资本冷却,竞争对手减少,反而是"逆周期布局"的好时机。
2021年11月,一家名为"Minimax"的公司悄然注册成立。创始人是刚从商汤离职的闫俊杰。
彼时,几乎没有人关注这家小公司。AI投资正处于低谷,大模型赛道尚未成为共识,中国市场对"做中国OpenAI"的信心普遍不足。
但闫俊杰心中有一个清晰的判断:大模型时代已经到来,而且这一次,技术突破不会停留在实验室——它必将深刻改变每一个普通人的生活。
他在后来的访谈中回忆这个决定时说:"AI应该成为日常生活的一部分,成为普惠大众的生产力。这是我创业的初心。"
复盘历史,我们必须追问两个问题:
为什么是2021年?
答案在于时机的微妙平衡。
2021年,GPT-3已经验证了大模型的可行性,但中国市场尚无真正意义上的竞品。技术路径已经明确,但竞争尚未白热化。资本寒冬让创业成本下降,但长期主义的投资人仍然存在。政策支持力度加大,但监管尚未收紧。
这是一个"不早不晚"的窗口期。
早一年,GPT-3尚未发布,大模型的规模效应还未被验证,贸然入场风险太大。晚一年,ChatGPT横空出世,大模型赛道瞬间拥挤,竞争成本将成倍增加。
2021年恰好处于"共识形成之前、泡沫膨胀之前"的甜蜜点。对那些拥有技术判断力和战略魄力的创业者而言,这是百年难遇的时机。
为什么是闫俊杰?
答案在于能力与意愿的交汇。
从能力来看,闫俊杰具备创立大模型公司的全部要素:
- 学术积淀:数学本科(东南大学)、通信工程硕士(重庆邮电大学)、模式识别与智能系统博士(中科院自动化所)、清华博士后——这条学术路径涵盖了AI研究的底层能力。
- 工业经验:商汤七年,从一线研究员到研究院副院长、智慧城市CTO,深度参与了AI从实验室到产业落地的全过程。
- 组织能力:管理过大型技术团队,具备招聘、协调、决策的全链条经验。
- 行业网络:在商汤积累的人脉,成为组建创始团队的关键资源。
但能力只是必要条件。真正让闫俊杰与众不同的,是他的意愿——那种源自内心深处的使命感。
这种使命感有一个具体的起点:他的外公。
外公是一位想写书的老人,却因为不会打字而终究未能完成心愿。这个遗憾深深触动了闫俊杰。他意识到,技术如果只服务于少数精英,那就辜负了技术本身的潜力。AI应该帮助的,正是那些"想做某事但缺乏工具"的普通人。
"AI应该成为普惠大众的生产力"——这不是一句公关话术,而是闫俊杰创业的真正动机。
2021年,当他决定离开商汤自立门户时,他38岁,已经是功成名就的技术高管。从世俗眼光来看,这是一个"非理性"的选择:放弃稳定的高薪、期权、地位,去做一件成功概率极低的事情。
但从闫俊杰的视角来看,这是他一生中最理性的决定——因为时机到了,而他不能再等了。
-
技术革命的预兆往往被忽视。 AlphaGo引发了媒体狂欢,但真正改变世界的是默默发布的Transformer论文。对创业者而言,识别"决定性技术突破"比追逐"热点新闻"更重要。
-
规模效应重塑了AI的竞争逻辑。 大模型时代,"小巧精妙"让位于"大力出奇迹"。这既是门槛,也是机会——敢于做长期、大规模投入的团队,将获得后发者难以逾越的壁垒。
-
窗口期转瞬即逝。 2021年的Minimax赶上了"共识形成之前"的最佳时机。历史总是奖励那些在不确定性中做出正确判断的人。
-
使命感是创业的终极燃料。 技术、资本、团队都可以后天获取,但驱动创始人在黑暗中坚持的,只能是内心深处的信念。
【本章完】
1989年,闫俊杰出生于河南省一个普通的小县城。
那是一个物质匮乏的年代。改革开放刚刚起步,中国的人均GDP不到300美元,位列全球最贫穷国家之列。河南作为农业大省,工业化程度低,城镇化率不足20%。县城里的生活单调而封闭:没有互联网,没有智能手机,甚至连电视机都是稀罕物件。
但正是这种环境,塑造了闫俊杰最重要的人格底色:独立解决问题的能力。
在后来的一次访谈中,闫俊杰回忆起童年时说:"在那个环境下,很多东西需要靠自己领悟。"这句话平淡,却藏着深意。
县城不像大城市,没有名师指点,没有优质教育资源,没有丰富的课外读物。想要获取知识,只能靠自己摸索。数学题不会做?没人能教你,只能反复看课本,一遍遍推导。物理概念不理解?没有辅导班可上,只能对着实验现象苦思冥想。
这种"被迫的自学",在当时看起来是劣势,但回过头来却成了优势。它培养了一种稀缺的能力:在没有外部指导的情况下,独立拆解问题、寻找答案。
这种能力在后来的创业中体现得淋漓尽致。创业本质上就是"在没有地图的地方开路"——没有人能告诉你正确答案,你必须自己摸索。那些从小习惯了"被安排"的人,往往在面对不确定性时手足无措。而闫俊杰,从童年起就习惯了这种不确定性。
小县城还教会了他另一件事:资源有限时,创造力反而更重要。
没有昂贵的学习资料?那就把能找到的每一本书翻烂。没有名校光环?那就用成绩说话。没有人脉关系?那就靠实力敲门。
多年后,当Minimax在算力紧缺、资金有限的情况下与巨头竞争时,这种"在约束条件下寻找最优解"的思维模式,成为了公司的核心竞争力之一。
每一个伟大的创业故事背后,往往都有一个具体的、私人的起点。对闫俊杰来说,这个起点是他的外公。
外公是一位普通的老人,一生经历了战乱、饥荒、动荡,终于在改革开放后迎来了相对安稳的晚年。他有很多故事想讲,想把自己的人生经历写成一本书,留给后人。
但他不会打字。
在那个年代,写书意味着手写稿,然后找人誊录、打字、排版。对于一个生活在县城的老人来说,这个过程既昂贵又繁琐。他不知道该找谁帮忙,也不好意思给家人添麻烦。
最终,这本书从未被写出来。外公带着这个遗憾离开了人世。
这件事在闫俊杰心中留下了深刻的印记。
他意识到一个残酷的事实:技术的门槛,往往就是普通人实现梦想的障碍。
外公想表达,但没有工具;想创作,但没有途径。不是因为他不够聪明,不是因为他不够努力,只是因为他没有掌握"打字"这项在当时看来理所当然的技能。
如果当时有一个AI,能够听懂外公的话,把他的口述转化为文字,那本书是不是就能写出来?如果技术能够足够"普惠",是不是就能帮助无数像外公一样的普通人,实现他们被压抑的创造力?
这个问题,在闫俊杰心中种下了一颗种子。
多年后,当他在各种场合谈论Minimax的愿景时,反复提到一个词:"普惠"。AI不应该只是少数精英的工具,而应该成为每一个普通人的助手。让不会打字的人能够写作,让不会画画的人能够创作,让不会编程的人能够开发——这不是慈善,而是技术本该具有的使命。
"AI应该成为日常生活的一部分,成为普惠大众的生产力。"
这句话不是口号。它源自一个具体的人、一个具体的遗憾、一个具体的画面:一位老人坐在昏暗的房间里,想说却说不出,想写却写不成。
1999年,闫俊杰以优异的成绩考入东南大学数学系。
这是一个看似"没用"的专业选择。那个年代,计算机科学正在兴起,金融、法律被视为"有前途"的专业,而数学?太抽象、太理论、离就业太远。
但闫俊杰的选择自有其道理。
他喜欢数学。喜欢那种从公理出发、层层推导、最终抵达确定结论的感觉。喜欢那种"世界虽然混乱,但至少数学是干净的"确定性。
更重要的是,数学训练了他一种核心能力:将复杂问题抽象化,然后分解为可处理的子问题。
这是一种元能力——不是解决某个具体问题的技能,而是解决一切问题的思维框架。
举个例子:当你面对一个商业难题时,你可以直接凭经验拍脑袋做决定,也可以先把问题形式化——定义变量、识别约束、建立目标函数——然后用逻辑推导出最优解。前者依赖直觉,后者依赖结构化思维。数学训练的正是后者。
在后来的创业中,这种思维模式体现在Minimax的技术选择上。
为什么选择MoE(混合专家模型)架构?因为MoE在数学上具有更好的扩展性:可以在不增加推理成本的前提下扩大模型容量。
为什么关注"错误率"而非"性能跑分"?因为错误率是用户体验的真正约束条件,而跑分只是学术论文的虚荣指标。
为什么坚持多模态融合?因为世界本身是多模态的,单一模态的模型在数学上就不可能完整建模现实。
这些决策背后,是一套严谨的逻辑链条。而这套逻辑链条的根基,是东南大学数学系那四年的训练。
2003年,闫俊杰进入重庆邮电大学攻读通信工程硕士。
如果说数学是"抽象的艺术",那么通信工程就是"落地的科学"。
通信工程关心的是:如何在现实世界的约束条件下,实现信息的高效传输?信号会衰减,信道会干扰,带宽有限制,功耗有上限——如何在这些约束中找到最优解?
这是典型的工程思维:不是追求理论上的完美,而是追求现实中的可行。
在重邮的两年,闫俊杰接触到了大量产业化的课题。他开始理解:技术不是目的,技术解决的问题才是目的。
一个算法再优美,如果工程上无法实现,就只是一纸空文。一个模型再强大,如果成本过高、延迟过长,就无法大规模应用。
这种工程思维,后来成为Minimax区别于其他AI公司的一个重要特点。
很多AI创业公司是"学术驱动"的——创始人来自顶尖高校,团队充满博士,技术路线追逐最新论文。这种模式的优势是技术前沿,劣势是往往忽视工程落地。
Minimax从一开始就不同。闫俊杰关心的问题不是"我们的模型在论文里能跑多高的分数",而是"我们的产品在用户手里能有多低的错误率"。
这种差异看似微小,实则决定了公司的命运。
2005年,闫俊杰进入中国科学院自动化研究所,攻读模式识别与智能系统博士学位。
中科院自动化所是中国AI研究的"黄埔军校"。这里诞生过众多院士,培养了无数AI领域的顶尖人才。在这里,闫俊杰接受了最系统、最严格的学术训练。
模式识别是AI的核心问题之一:如何让机器"认识"世界?如何从图像中识别人脸?如何从语音中识别文字?如何从数据中识别规律?
智能系统则关心更高层次的问题:如何让机器"理解"世界?如何做出决策?如何与环境互动?
博士阶段的研究,让闫俊杰在技术上达到了相当的深度。他开始发表论文,参与国家级项目,逐渐在学术圈崭露头角。
但博士生涯也让他看到了学术界的局限性。
学术研究的激励机制是"发论文"。发顶会论文、刷榜、提升h-index——这些是评价学者的核心指标。问题是,论文与现实应用之间往往存在巨大的鸿沟。
一个在ImageNet上刷到SOTA(state-of-the-art)的模型,放到真实场景中可能一塌糊涂。一个在实验室里运行良好的算法,部署到手机上可能慢得无法忍受。
闫俊杰开始思考:技术的价值,到底应该如何衡量?
是看论文引用数,还是看用户使用量?是看学术评价,还是看商业成功?
这个问题没有标准答案。但闫俊杰隐约感觉到:他更在乎的是后者。
博士毕业后,闫俊杰进入清华大学做博士后研究。
清华博士后的这段经历,成为他从学术界向产业界跃迁的关键跳板。
在清华,他接触到了更多产业界的资源和视角。北京是中国AI创业的中心,中关村聚集了大量创业公司和投资机构。闫俊杰开始意识到:AI正在从实验室走向市场,一场产业革命正在酝酿。
与此同时,一家名为"商汤科技"的公司进入了他的视野。
商汤成立于2014年,创始人汤晓鸥是香港中文大学教授,在计算机视觉领域享有盛名。商汤的团队星光熠熠,聚集了大量来自清华、北大、港中文的顶尖AI人才。
更重要的是,商汤正在做一件当时看来极具雄心的事情:将AI技术大规模产业化。
不是发论文,不是做demo,而是真正地卖产品、签合同、赚钱。
2014年,闫俊杰以实习生的身份加入商汤。这个决定改变了他的职业轨迹,也为七年后的创业埋下了伏笔。
从2014年到2021年,闫俊杰在商汤待了整整七年。
七年,足够让一个初出茅庐的博士后成长为管理千人团队的技术高管。七年,也足够让他看清一家AI公司的全貌——技术的、商业的、组织的。
第一阶段:技术专家(2014-2016)
入职初期,闫俊杰的角色是一线研究员。他负责具体的技术攻关:如何提升人脸识别精度?如何降低模型推理延迟?如何在边缘设备上部署深度学习?
这段经历让他积累了扎实的工程经验。不是写论文的经验,而是"让东西真正跑起来"的经验。
他学会了如何在算力有限的情况下优化模型,如何与硬件团队协作,如何应对客户的各种奇葩需求。这些"脏活累活",是学术界永远学不到的。
第二阶段:管理者(2016-2019)
随着业务扩张,闫俊杰开始承担管理职责。他先后担任研究院副院长、智慧城市事业群CTO,管理的团队从几十人扩展到数百人。
管理是一门与技术完全不同的学问。技术问题可以用逻辑推导,但人的问题不行。如何招聘优秀人才?如何激励团队?如何处理冲突?如何在资源有限的情况下做出取舍?
这些问题没有公式可套,只能靠经验和直觉。
在商汤的管理实践中,闫俊杰形成了一套自己的组织哲学:
- 轻量化:保持组织结构简单,减少管理层级,让信息高效流动。
- 数据驱动:用数据评估绩效,避免主观臆断。
- 人才标准:选择能提升团队整体输出的人,而非个人能力突出但难以协作的"明星"。
这些原则,后来原封不动地移植到了Minimax。
第三阶段:战略思考者(2019-2021)
2019年之后,闫俊杰开始更多地参与公司战略层面的讨论。他的视角从"如何做好一个项目"提升到"公司应该往哪个方向走"。
这个阶段,他开始深入思考AI产业的本质问题:
- 商业模式问题:为什么AI公司普遍不赚钱?是技术不够好,还是商业模式有问题?
- 产品形态问题:AI应该是"卖给企业的技术",还是"直接面向用户的产品"?
- 竞争格局问题:中国AI公司能否在全球竞争中占据一席之地?
他看到了"四小龙"模式的天花板:ToB业务增长缓慢,商业化艰难,估值泡沫终将破裂。他也看到了另一种可能:如果AI能够像互联网一样直接触达亿万用户,商业化的故事就完全不同了。
2020年,GPT-3发布,闫俊杰看到了那个"不同的故事"的具体形态。
大语言模型不是卖给企业的"技术组件",而是可以直接与用户对话的"智能体"。它不需要复杂的销售流程,不需要繁琐的定制开发,只需要一个简单的对话框,就能为用户创造价值。
这是AI商业模式的根本性变革。
从ToB到ToC,从"卖技术"到"做产品",从"服务企业"到"服务每个人"——这是完全不同的逻辑。
闫俊杰意识到:如果不在这个时间节点入场,可能就再也没有机会了。
2021年,闫俊杰做出了一个让很多人不解的决定:离开商汤,自主创业。
从世俗角度来看,这是一个"非理性"的选择:
- 财务成本:他放弃了稳定的高薪和即将兑现的期权。商汤2021年底上市,早期员工的股票价值不菲。
- 机会成本:作为研究院副院长和事业群CTO,他在商汤的职业前景一片光明。继续待下去,未来可能是更高的职位、更大的影响力。
- 风险敞口:创业成功率不到1%。尤其是大模型赛道,资金和算力需求惊人,失败的概率远大于成功。
但从闫俊杰的内心逻辑来看,这又是一个完全"理性"的选择:
第一,时机窗口。 GPT-3已经证明了大模型的可行性,但中国尚无真正的竞品。如果等到市场成熟再入场,机会窗口就会关闭。
第二,使命驱动。 在商汤,他只能做"AI作为技术环节"的事情。但他真正想做的,是"AI作为产品本身"——直接触达用户,实现技术普惠。这在商汤的业务框架内很难实现。
第三,能力匹配。 经过七年历练,他在技术、管理、战略各方面都积累了足够的能力。如果这时候不创业,未来恐怕也不会有更好的准备。
第四,内在驱动。 在一次访谈中,闫俊杰说过一句意味深长的话:"我表面上看起来安静沉着,但骨子里是一个期待跟王者一决高下的人。"
这句话揭示了他内心深处的竞争欲望。不是为了财富,不是为了名声,而是纯粹的、近乎本能的"想要证明自己"的冲动。
在商汤,他最多是一个"将军"。但他想做的,是"帅"——自己定义战场,自己决定战略,然后赢得战争。
2021年11月,Minimax正式成立。
38岁的闫俊杰,带着从县城一路走来的独立精神,带着外公遗憾激发的普惠信念,带着数学锻造的抽象思维,带着工程磨砺的务实品格,带着商汤七年的技术与管理积累——踏上了一条充满不确定性的创业之路。
他不知道前方等待他的是什么。但他知道,这条路他必须走。
回顾闫俊杰的成长轨迹,可以清晰地看到一条思想演进的脉络:
起点:技术理想主义。
数学专业、博士研究、学术训练——这些经历塑造了他对"技术之美"的信仰。他相信技术本身具有价值,相信优雅的算法可以改变世界。这是一种纯粹的、学术式的技术理想主义。
转折:技术落地的启蒙。
商汤七年的经历让他意识到:技术的价值必须通过落地来实现。一个再美的模型,如果无法解决实际问题,就只是智力游戏。这是技术理想主义向技术实用主义的第一次修正。
升华:技术普惠主义。
外公的遗憾、GPT-3的启示、对"四小龙"困境的反思——这些因素汇聚在一起,让闫俊杰形成了一种新的信念:技术的终极价值,不在于服务少数精英,而在于普惠大众。
AI不应该只是大企业的工具,不应该只是技术专家的玩具。它应该像水和电一样,成为每个人都能使用的基础设施。让不会打字的老人能够写书,让不会画画的孩子能够创作,让不会编程的员工能够开发——这才是AI的真正使命。
这种"技术普惠主义"成为Minimax的核心价值观,也成为闫俊杰此后一切决策的出发点。
-
早年环境塑造底层能力。 县城的匮乏教会了闫俊杰独立解决问题,这种能力在创业中无可替代。对创业者而言,早年的"逆境"往往是最好的训练场。
-
个人使命往往源于具体经历。 外公的遗憾不是抽象的概念,而是具体的画面。最深刻的信念,往往源于最私人的经历。创业者应该追问自己:什么是驱动你的那个"具体的故事"?
-
跨学科训练创造认知优势。 数学的抽象思维+工程的落地能力+商业的战略视野——这种跨学科组合让闫俊杰拥有了独特的认知框架。在AI时代,单一技能正在贬值,跨界能力才是护城河。
-
大公司经历是双刃剑。 商汤七年给了闫俊杰技术、管理、人脉的积累,但也可能让他陷入"路径依赖"。关键在于:是否能够在"大公司思维"和"创业者思维"之间自由切换?
-
创业的最佳时机是"准备好了+时机到了"的交汇点。 太早创业,能力不足;太晚创业,时机已逝。2021年的闫俊杰,恰好站在两者的交汇点上。
【本章完】
如果把闫俊杰的人生比作一棵大树,那么价值观就是深埋地下的根系。树冠可以随风摇摆,枝叶可以四季更替,但根系决定了这棵树能长多高、能活多久。
通过前两章的梳理,我们可以清晰地辨识出闫俊杰价值观的四个核心支柱。这四根支柱相互支撑、彼此强化,构成了他人格的底层架构。
第一根支柱:独立解决问题的本能
这是县城成长经历留下的烙印。
在资源匮乏的环境中,等待是没有用的。没有人会主动帮你,没有现成的答案可以抄袭。你要么自己想办法,要么永远停在原地。
这种环境内化为一种行为模式:不等待资源,主动创造条件。
闫俊杰曾在访谈中透露,Minimax在早期面临严重的算力短缺。当时AI芯片一卡难求,价格飞涨,大公司凭借资金优势囤积资源,创业公司几乎无处可买。
很多创业者在这种情况下会选择等待——等投资到账,等芯片降价,等市场转好。但Minimax的做法不同:他们想尽一切办法在有限条件下推进研发。优化训练效率、精简模型架构、与芯片供应商谈判——每一个环节都在"约束条件下寻找最优解"。
这不是被动应对,而是主动创造。
这种思维模式的根源,正是闫俊杰童年时期形成的"独立解决问题"本能。当你从小就习惯了"没有人帮你",长大后就不会期待"有人帮你"。你会把所有的希望都寄托在自己身上——这既是压力,也是力量。
第二根支柱:技术民主化信念
这是外公遗憾点燃的火种。
技术应该服务于谁?这是一个看似简单、实则深刻的问题。
在硅谷的主流叙事中,技术是"精英的游戏"。最聪明的人创造最先进的技术,然后卖给最有钱的客户。这套逻辑在商业上完全成立,但在价值观上却存在缺陷:如果技术只服务于精英,那么技术就成了加剧不平等的工具。
闫俊杰的信念与此不同:技术的终极价值,在于普惠大众。
这种信念的起源是私人的——外公想写书却不会打字的遗憾。但它的延伸是普遍的:世界上有多少人因为缺乏工具而无法表达自己?有多少创意因为技术门槛而被埋没?有多少普通人因为"不会操作"而被排斥在数字世界之外?
AI是有史以来最强大的技术之一。如果这种技术只服务于少数人,那将是人类的巨大损失。如果这种技术能够普惠大众,那将是一场真正的解放。
"AI应该成为日常生活的一部分,成为普惠大众的生产力。"
这句话是Minimax的愿景宣言,也是闫俊杰创业的初心。它不是公关话术,而是深植于个人经历的真实信念。
第三根支柱:竞争驱动的成长观
这是最容易被忽视、却可能最为重要的一根支柱。
闫俊杰给外界的印象是"安静沉着"。他不是那种锋芒毕露、咄咄逼人的创业者。在公开场合,他更多展现的是温和与内敛。
但在一次与罗永浩的访谈中,他说出了内心深处的另一面:
"我骨子里是一个期待跟王者一决高下的人。"
这句话的分量不容小觑。
它揭示了闫俊杰内心深处的竞争欲望——不是为了金钱,不是为了名声,而是纯粹的、近乎本能的"想要赢"。他想和最强的对手竞争,想证明自己能够站在世界之巅。
这种竞争驱动的成长观,解释了很多看似矛盾的行为:
- 为什么放弃商汤的稳定高位去创业?——因为只有创业才能"和王者一决高下"。
- 为什么选择大模型这个巨头云集的赛道?——因为这里才有真正的"王者"。
- 为什么不满足于做"中国的OpenAI"?——因为目标从一开始就不是模仿,而是超越。
闫俊杰在同一次访谈中还说过另一句话:
"中国AI企业可以引领世界巨头。"
这不是空洞的民族主义口号。这是一个竞争者对目标的清晰定义:不是追赶,不是模仿,而是引领。
有趣的是,这种强烈的竞争欲望与他外表的温和形成了鲜明对比。这种"外柔内刚"的矛盾统一,或许正是领导力的一种高级形态:对外展现的是包容与合作,对内燃烧的是野心与斗志。
第四根支柱:长期主义的萌芽
这是商汤后期经历催生的认知升级。
在商汤的最后几年,闫俊杰亲眼目睹了"资本驱动增长"模式的困境。高估值带来高期待,高期待带来短期压力,短期压力导致动作变形。
很多AI公司在资本的裹挟下,开始追逐短期收入。签大合同、做定制项目、冲刺上市——这些动作在财务报表上很好看,但对技术积累的贡献却很有限。
闫俊杰看到了这种模式的本质:短期主义是一种慢性自杀。
当你把所有资源都用于短期变现时,长期的技术护城河就无法构建。当护城河消失时,竞争对手会轻易攻入,你的短期收益也将化为乌有。
这种认知催生了他对长期主义的坚定信念。
后来,在谈到Minimax的商业化时,闫俊杰明确表示:"商业化不是当前最重要的关注点。我们的目标是打造最好的AI产品,让技术真正造福用户。收入会随之而来,但不应该成为驱动决策的核心。"
这种态度在资本市场上显得"不合时宜"。投资人通常希望看到明确的商业化路径、可预测的收入增长、清晰的盈利时间表。但闫俊杰的立场很坚定:
"坚持创新而非短期变现。"
这不是不要商业化,而是不以牺牲长期价值为代价追求短期商业化。这是一种更高级的商业智慧:通过长期主义建立壁垒,然后在壁垒之上构建可持续的商业模式。
如果说价值观是"指南针",决定了闫俊杰往哪个方向走;那么思维模式就是"方法论",决定了他如何到达目的地。
通过分析他的教育背景和职业经历,可以辨识出三种核心思维模式的交织与融合。
第一种:数学思维
数学思维的核心是抽象化与形式化。
面对一个复杂问题,数学家的第一反应不是直接解决,而是先问:这个问题的本质是什么?能否抽象为一个更一般的形式?能否分解为若干个子问题?
这种思维方式在闫俊杰的决策中处处可见。
比如,对于"AI产品应该追求什么指标"这个问题,行业主流的答案是"性能跑分"——在各种benchmark上刷出更高的分数。但闫俊杰的视角不同。他问的是:用户真正关心的是什么?
答案是:错误率。
用户不关心你的模型在GPT-4Bench上排名第几,他们关心的是:当我用你的产品时,它会不会给我一个错误的答案?会不会编造一个不存在的事实?会不会误导我做出错误的决策?
错误率才是决定用户体验的核心变量。
在一次访谈中,闫俊杰详细阐述了这个观点:"当前大模型的错误率大概在20-30%左右。这意味着每三到五次使用,就可能有一次出错。对于日常对话来说,这或许可以接受。但对于严肃的应用场景——比如医疗咨询、法律建议、金融决策——这个错误率是致命的。"
他进一步指出:"我们的目标是把错误率降低一个数量级,从20-30%降到2-3%。当错误率达到这个水平时,AI才能真正成为可信赖的生产力工具。应用规模才会从现在的百万级扩张到亿级。"
这种"抓住核心变量、忽略次要变量"的分析方式,是典型的数学思维。它让决策变得清晰、聚焦、可执行。
第二种:工程思维
工程思维的核心是在约束条件下寻找最优解。
与数学家追求"理论最优"不同,工程师追求的是"现实可行"。资源总是有限的,时间总是紧迫的,完美方案往往是不存在的。工程师的任务是在诸多约束中找到那个"够好"的解。
Minimax的技术选择处处体现着这种工程思维。
例一:MoE架构的选择。
2021年,当Minimax决定技术路线时,市场主流是"密集模型"(Dense Model)——所有参数在每次推理时都被激活。这种架构简单直接,但有一个致命缺陷:随着模型规模增大,推理成本线性增长。
MoE(混合专家模型)提供了一种替代方案:通过"门控机制",每次推理只激活一部分"专家"模块,而不是全部参数。这意味着模型可以拥有巨大的总参数量,但推理时只使用其中一小部分,从而在性能和效率之间取得平衡。
当时,MoE仍是学术前沿,工程实现难度大,很多公司不敢尝试。但Minimax做出了激进的选择:从一开始就押注MoE。
这是工程思维的体现:清晰地识别约束条件(算力有限、成本敏感),然后选择能在约束下达到最优的技术方案。
例二:降价与效果的平衡。
2024年,大模型市场进入价格战。各家公司纷纷降低API价格,试图抢占市场份额。这对Minimax构成了巨大压力。
但闫俊杰的回应不是简单的"跟进降价"。他提出了一个更精确的目标:"降价同时保持更好效果。"
这是一个工程问题,而不是商业问题。它要求团队在技术上找到突破点:如何优化模型架构、如何提升训练效率、如何降低推理成本——同时不牺牲模型能力。
最终,Minimax通过线性注意力机制等技术创新,将效率提升了20%以上,成功实现了"降价不降质"的目标。
第三种:战略思维
战略思维的核心是跳出当前局势,从更高维度审视问题。
技术思维关心的是"如何做",战略思维关心的是"做什么"和"为什么做"。
在商汤后期,闫俊杰完成了从技术专家到战略思考者的跃迁。他开始思考一些根本性的问题:
- AI的终极形态是什么? 是卖给企业的"技术组件",还是直接触达用户的"产品"?
- 中国AI公司的定位是什么? 是追随硅谷巨头,还是走出一条不同的道路?
- 竞争的关键变量是什么? 是模型性能、数据规模、用户体验,还是生态系统?
这些问题没有标准答案,但它们决定了公司的战略方向。
闫俊杰给出的答案体现在Minimax的战略定位上:
- 不做"中国的OpenAI"——不是模仿者,而是创新者。
- 不只做API服务商——不是技术供应商,而是产品公司。
- 坚持多模态融合——不是单一能力,而是全面智能。
- C端与B端并重——不是非此即彼,而是双轮驱动。
这些选择背后,是一套连贯的战略逻辑:AI的终极价值在于直接服务用户,而直接服务用户需要完整的产品能力,完整的产品能力需要多模态的技术支撑,多模态的技术需要长期的研发投入。
整套战略是一个自洽的体系,而不是一堆孤立的决策。
理解了闫俊杰的三重思维模式,我们就能更好地理解Minimax的一系列关键决策。
决策一:为什么坚持自研大模型?
2021年创业时,市场上已经有开源的大模型可以使用。很多创业公司选择基于开源模型做应用层创新,这样可以节省大量研发成本和时间。
但Minimax的选择是从零开始自研。
这个决策背后的逻辑是什么?
- 数学思维:自研模型意味着对底层架构拥有完全的控制权。当需要针对特定场景优化时,可以从根本上调整模型结构,而不是在别人的架构上打补丁。
- 工程思维:自研模型可以根据自身的算力条件和应用场景进行定制优化,而不是被迫适应通用模型的设计取舍。
- 战略思维:在AI时代,模型能力是核心竞争力。如果依赖开源模型,就意味着在最关键的环节上没有差异化。长期来看,这是不可持续的。
决策二:为什么坚持做C端产品?
大模型商业化最直接的路径是ToB——把API卖给企业客户。这种模式现金流可预测、客户关系稳定、销售周期明确。
但Minimax从一开始就坚持做C端产品:星野、海螺AI、Talkie……这些面向普通用户的应用,消耗了大量的研发资源。
为什么?
- 价值观驱动:技术普惠信念要求AI直接触达普通用户,而不是通过企业客户间接服务。
- 数据飞轮:C端产品产生海量用户反馈,这些反馈可以直接用于模型优化,形成"产品→数据→模型→产品"的正向循环。
- 战略卡位:C端市场是"赢者通吃"的逻辑,先发优势可以转化为持久壁垒。晚进入者即使技术更好,也很难撼动已经形成的用户心智。
决策三:为什么布局海外市场?
Talkie是Minimax面向海外市场推出的AI社交应用,在157个国家和地区运营。2024年,Talkie贡献了约7000万美元的收入,成为公司最重要的收入来源之一。
为什么一家中国创业公司要在创业早期就布局海外?
- 数学思维:全球市场的用户基数是中国市场的数倍。从TAM(总可触达市场)角度看,海外市场的天花板更高。
- 工程思维:海外市场的监管环境相对宽松,产品迭代可以更快。在国内需要数月才能获批的功能,在海外可能几周就能上线。
- 战略思维:海外市场是检验产品竞争力的"试金石"。如果能在与OpenAI、Anthropic的直接竞争中胜出,就证明了技术的全球竞争力。
任何复杂的人格都存在内在张力。闫俊杰也不例外。
张力一:长期主义 vs 竞争欲望
长期主义要求耐心、沉稳、不急于求成。但竞争欲望是急切的、进取的、渴望胜利的。
这两者如何共存?
答案是:在战略目标上保持长期视野,在战术执行上保持竞争强度。
闫俊杰不会为了短期收入牺牲技术投入,但他会在每一个具体的技术攻关中追求极致。他不会被季度财报绑架,但他会被竞争对手的进展刺激。
这是一种"长期的野心家"心态:目标是十年后的胜利,但每一天都在为那个胜利而战斗。
张力二:技术理想 vs 商业现实
技术民主化信念意味着"让技术惠及所有人",但商业模式需要变现、需要利润、需要可持续。
如果AI完全免费,公司如何生存?如果收费太高,普惠如何实现?
Minimax的解法是:先建立技术护城河,再在护城河之上构建商业模式。
具体而言:
- 通过自研模型建立技术壁垒,确保产品的不可替代性;
- 通过C端产品获取海量用户,建立数据飞轮;
- 在用户规模达到一定程度后,通过增值服务、订阅付费等方式实现商业化;
- 保持基础功能的低价或免费,确保普惠性不被破坏。
这是一种"技术换时间、规模换利润"的策略。短期内牺牲商业化效率,换取长期的竞争优势和商业可能性。
张力三:独立精神 vs 团队协作
县城成长经历塑造了闫俊杰"独立解决问题"的本能。但管理一家公司需要的是团队协作、授权赋能、让别人发挥作用。
如何从"单打独斗"转向"带领团队"?
闫俊杰的做法是:把独立精神转化为组织能力。
他不是那种事无巨细亲力亲为的管理者。相反,他更愿意搭建一个让每个人都能"独立解决问题"的组织架构:
- 轻量化组织:减少管理层级,让信息直达一线,让决策权下放到最了解情况的人手中。
- 数据驱动文化:用数据而非权力来做判断,减少主观臆断和政治博弈。
- 人才选择标准:选择那些"能提升团队整体输出"的人,而非个人英雄。
这样,他的独立精神就不再是"一个人的独立",而是"一群人的独立"——每个团队成员都像他当年在县城一样,习惯于在没有指导的情况下自己找到答案。
闫俊杰的价值观和思维模式是否可以被其他人学习?
答案是:部分可以。
可以学习的:
- 独立解决问题的习惯:这可以通过刻意练习来培养。当遇到问题时,先尝试自己解决,而不是第一时间求助他人。
- 数学思维的训练:即使不是数学专业,也可以通过学习统计学、逻辑学、系统论等来培养抽象化思维。
- 工程思维的培养:通过参与实际项目,学会在约束条件下寻找可行解,而不是追求理论最优。
- 战略思维的提升:通过阅读商业案例、分析竞争格局、与不同背景的人交流,提升从更高维度看问题的能力。
难以复制的:
- 童年经历的烙印:价值观的底层是早年经历,这些经历无法被后天模拟。
- 使命感的私人起源:外公的遗憾是闫俊杰独有的故事,每个人需要找到自己的"故事"。
- 竞争欲望的强度:这种"期待与王者一决高下"的本能,似乎与生俱来,难以后天培养。
但这不意味着没有借鉴价值。相反,理解这些价值观和思维模式的形成机制,可以帮助我们反思自己的成长经历:
- 我的童年经历留下了什么"能力烙印"?
- 我有没有一个像"外公的遗憾"那样的私人故事,驱动着我的选择?
- 我的思维模式是什么?它的优势和盲区在哪里?
- 我如何在现有基础上,刻意培养缺失的能力?
这种反思本身,就是成长的开始。
-
价值观是根系,决定了人生这棵树能长多高。 闫俊杰的四重价值观——独立精神、技术普惠、竞争驱动、长期主义——构成了他决策的底层逻辑。创业者应该清晰地识别和表达自己的核心价值观。
-
思维模式是方法论,决定了如何到达目的地。 数学思维提供抽象能力,工程思维提供落地能力,战略思维提供格局视野。三者缺一不可。
-
价值观和思维模式之间存在张力,但可以统一。 长期主义与竞争欲望、技术理想与商业现实、独立精神与团队协作——这些张力不是非此即彼,而是可以在更高层次上整合。
-
原则部分可以学习,但根基难以复制。 童年经历和私人故事塑造了价值观的底层,这些无法被后天模拟。但思维模式可以通过刻意练习来培养。
-
反思自己的"认知原点",是成长的第一步。 每个人都应该追问:我的价值观从何而来?我的思维模式是什么?我如何在现有基础上进化?
【第一编完】
要理解一个创业决定,必须先理解做出这个决定的时空背景。
2021年的中国AI产业,正处于一个微妙的历史节点。多重力量在此交汇:技术范式的革命、商业模式的困境、政策环境的变化、资本市场的冷却——这些力量相互作用,创造了一个独特的"创业窗口"。
技术维度:GPT-3已验证规模效应,但中文大模型仍是空白
2020年6月,OpenAI发布GPT-3,震惊世界。这个拥有1750亿参数的语言模型,展现了令人难以置信的能力:写文章、编代码、翻译、问答、创作——几乎无所不能。
更重要的是,GPT-3验证了一个核心假设:规模就是力量(Scaling Laws)。
研究表明,模型性能与参数量、数据量、算力之间存在幂律关系。只要不断增加投入,性能就会持续提升,而且是以一种可预测的方式提升。这意味着AI不再是一个"灵光一现"的创意问题,而是一个"规模投入"的工程问题。
但在中国,这个发现尚未转化为行动。
彼时,中国最接近GPT-3的尝试是几个学术机构的研究项目——参数量在百亿级别,与GPT-3相差一个数量级。产业界的注意力仍然集中在计算机视觉、语音识别等"专用AI"领域。真正意义上的中文大语言模型,几乎不存在。
这是一片蓝海,也是一片深海。
蓝海意味着竞争者少,先发者可以获得巨大优势。深海意味着门槛极高——算力需求、数据积累、人才储备、资金投入——每一项都是天文数字。
对于那些拥有技术判断力和战略魄力的创业者而言,这是百年难遇的机会。但对于缺乏准备的冒险者而言,这是一个足以吞噬一切的深渊。
商业维度:AI"四小龙"的困境暴露了商业模式的根本缺陷
2021年底,商汤科技在港交所上市。这本该是中国AI产业的高光时刻,但资本市场的反应却出乎意料地冷淡。
上市首日,商汤股价勉强维持发行价。随后几个月,股价持续下跌,市值从最高点腰斩再腰斩。其他几家AI公司的情况也好不到哪里去:旷视上市计划一再搁置,云从上市后股价长期低迷,依图更是选择了从港股退市。
这是怎么回事?
表面原因是多方面的:地缘政治风险、疫情冲击、监管收紧……但更深层的原因是商业模式本身的缺陷。
"四小龙"本质上都是ToB公司——把AI技术卖给企业客户。这种模式有几个致命问题:
第一,销售周期长、定制化需求高。 企业客户的决策流程复杂,从接触到签单往往需要半年甚至一年。签单之后还有漫长的部署周期,以及永无止境的定制需求。
第二,客户集中度高、议价能力弱。 最大的客户往往是政府和大型企业,它们拥有强大的议价能力。AI公司不得不压低价格、延长账期、提供额外服务——利润空间被不断挤压。
第三,规模效应弱、边际成本高。 与互联网产品不同,ToB业务很难实现"赢者通吃"。每一个新客户都需要新的销售投入、新的定制开发、新的运维支持。规模扩大时,成本也在同步增长。
第四,技术壁垒低、同质化严重。 "四小龙"做的事情本质上大同小异:都是用深度学习处理图像。技术门槛不高,护城河不深。竞争者可以轻易复制,价格战不可避免。
闫俊杰在商汤的七年,亲眼目睹了这些问题。他比任何人都清楚:ToB模式有天花板,而且这个天花板比外界想象的要低得多。
如果AI永远只是"卖给企业的技术组件",那么AI公司就永远只能是"系统集成商"的命运——辛苦、低利、缺乏想象空间。
个人维度:38岁的闫俊杰面临人生的终极选择
2021年,闫俊杰38岁。
从世俗标准来看,他已经非常成功:商汤科技研究院副院长、智慧城市事业群CTO、学术与工业的双重背景、丰厚的期权与薪酬。如果继续留在商汤,未来的职业路径清晰可见:更高的职位、更大的团队、更多的财富。
但他心里始终有一个声音:这不是我想要的人生。
在商汤,他最多是一个"执行者"——执行公司既定的战略,完成董事会设定的目标。即使做到CEO,也要对投资人负责、对上市规则负责、对既有业务负责。
他想做的,是"定义者"——自己定义问题、自己选择方向、自己承担后果。
这是一种深层次的渴望,与财富无关,与地位无关。它源自那个在县城长大的少年,那个习惯了"靠自己领悟"的孩子,那个骨子里"期待与王者一决高下"的人。
38岁,在创业领域不算年轻。很多人在这个年龄已经选择"稳妥"——毕竟有家庭责任、有财务规划、有健康考量。重新出发的机会成本太高,失败的代价太大。
但闫俊杰的判断是:如果这时候不创业,以后恐怕也不会有更好的时机了。
技术窗口正在打开:大模型的可行性已经验证,但中国市场尚无强势玩家。
能力储备已经就绪:七年商汤经历积累的技术、管理、人脉,足以支撑一个创业项目。
个人状态处于巅峰:精力充沛、认知成熟、野心尚存。再等几年,这些条件可能都会改变。
2021年秋天,闫俊杰做出了决定。
每一个伟大的创业都始于一个清晰的问题意识:你看到了什么问题?为什么别人没有解决?你准备怎么解决?
闫俊杰的问题意识可以分解为三个层次:技术问题、商业问题、社会问题。
技术问题:为什么中国没有自己的GPT-3级大模型?
这是最直接的问题,也是最刺眼的现实。
GPT-3发布一年多了,中国依然没有真正可用的大语言模型。不是不想做,而是做不出来。
原因是多方面的:
- 算力瓶颈:训练GPT-3级别的模型需要成千上万张高端GPU,成本以亿计算。中国企业在算力采购上面临地缘政治风险,高端芯片随时可能断供。
- 数据挑战:高质量中文语料的规模远小于英文。互联网上的中文内容虽然数量不少,但质量参差不齐,清洗成本高昂。
- 人才缺口:真正懂得如何训练超大规模模型的人才极其稀缺。这不仅需要算法能力,还需要大规模分布式系统的工程能力。
- 信心不足:很多人不相信中国公司能做出GPT-3。"OpenAI有微软撑腰,我们拿什么比?"这种心态在业界普遍存在。
但闫俊杰的判断是:这些困难都是可以克服的。
算力可以通过多种渠道获取,虽然成本高,但不是完全不可能。数据可以通过精细化运营来积累,质量比数量更重要。人才可以培养和吸引,只要有足够吸引人的愿景。信心更是一个自我实现的预言——只有先相信能做到,才可能真的做到。
他看到的不是障碍,而是机会:正因为别人不敢做,先做的人才能获得先发优势。
商业问题:如何避免成为"API供应商",做出真正的C端产品?
这是闫俊杰对"四小龙困境"的深层反思。
AI公司有两种商业模式:
模式一:做技术供应商。 把AI能力封装成API或SDK,卖给企业客户。客户用这些能力去构建自己的产品。
模式二:做产品公司。 直接面向最终用户,提供完整的AI产品或服务。
"四小龙"走的是模式一。它们把人脸识别、图像分析、语音识别等能力卖给银行、安防公司、手机厂商。这些企业再把这些能力集成到自己的产品中。
这种模式的问题在于:价值被中间商截取了。
最终用户为银行的人脸识别功能付费,但这笔钱大部分被银行赚走,AI公司只拿到很小一部分。更糟糕的是,AI公司与最终用户之间隔着一层"客户",无法直接获取用户反馈,无法建立用户心智,无法形成数据飞轮。
闫俊杰想走模式二。
他相信,大语言模型的出现改变了游戏规则。以前的AI是"能力",需要被嵌入到其他产品中才能发挥作用。但大语言模型是"智能体",可以直接与用户对话,直接解决用户问题,直接创造价值。
换句话说,大模型让AI第一次有可能成为"产品本身",而不只是"产品的一部分"。
这是一个根本性的范式转变。抓住这个机会,就有可能打造出"AI时代的微信"或"AI时代的抖音"——直接面向亿万用户的超级应用。
社会问题:如何让AI从"少数精英的工具"变为"普惠大众的生产力"?
这是最深层的问题,也是闫俊杰创业的真正动机。
回顾AI产业过去十年的发展,有一个令人遗憾的规律:最先进的AI技术,总是首先服务于最有钱的客户。
企业级AI解决方案价格昂贵,只有大公司用得起。消费级AI产品功能有限,往往只是噱头。普通人对AI的感知,仅限于手机上的语音助手和推荐算法——这些"AI"与GPT-3展示的能力相比,简直是天壤之别。
为什么会这样?
因为AI公司需要赚钱,而"有钱的客户"更容易付费。在商业逻辑的驱动下,AI技术的普惠性被牺牲了。
但闫俊杰认为这是一个错误的取舍。
他相信,AI技术的真正价值,恰恰在于它的普惠性。当AI足够便宜、足够易用、足够可靠时,它可以帮助每一个普通人:
- 帮助不会打字的老人写作
- 帮助没有受过专业训练的人创作
- 帮助语言不通的人沟通
- 帮助知识有限的人学习
- 帮助资源匮乏的人创业
这不是慈善,而是技术的使命。外公的遗憾,正是这种使命的具象化。
Minimax的愿景从一开始就很清晰:让AI成为每个人的生产力工具。
不是少数精英的特权,而是普通大众的日常。不是昂贵的企业解决方案,而是人人用得起的基础设施。
创业决定不是在真空中做出的。它涉及无数的对话、争论、权衡、妥协。还原这些场景,可以帮助我们理解决策的真实质感。
场景一:与罗永浩的访谈——初心的公开表达
2024年,闫俊杰接受了罗永浩《十字路口》节目的专访。这是他少有的深度公开访谈之一。
在访谈中,罗永浩问了一个直接的问题:"你创业的初心是什么?"
闫俊杰的回答没有任何官话套话:
"我外公是一位想写书的老人,但他不会打字。我小时候就在想,如果有一个AI能帮他,那该多好。后来我意识到,世界上有无数像我外公一样的人——他们有表达的欲望,却缺乏表达的工具。AI应该帮助这些人。"
"我骨子里是一个期待跟王者一决高下的人。我相信中国AI企业可以引领世界巨头,而不只是追随。"
这两段话揭示了闫俊杰创业动机的双重结构:
- 使命驱动:让AI普惠大众,帮助那些被技术门槛拦住的普通人。
- 竞争驱动:与全球最强的对手竞争,证明中国公司能够站在世界之巅。
这两重动机看似矛盾(普惠 vs 精英,谦逊 vs 野心),实则统一:只有成为最强者,才能真正实现普惠的使命。
场景二:内部路线之争——"中国OpenAI" vs "差异化创新"
Minimax成立初期,团队内部曾有过一场重要的路线之争:
一派主张"做中国的OpenAI"——紧跟OpenAI的技术路线,复刻GPT的成功,在中国市场占据位置。这条路线相对清晰,风险可控,投资人也更容易理解。
另一派主张"差异化创新"——不做简单的复刻,而是根据中国市场的特点和自身的优势,走一条不同的道路。这条路线充满不确定性,但如果成功,护城河更深。
闫俊杰的选择是后者。
他的理由很清晰:
"如果只是做中国的OpenAI,那我们永远只能跟在别人后面。OpenAI有微软的资金、有全球最顶尖的人才、有先发优势——我们在同一条赛道上很难超越。"
"但如果我们找到一条不同的路,情况就不一样了。中国有独特的用户需求、独特的数据资源、独特的应用场景。这些是我们的优势,也是差异化的基础。"
最终的战略定位是:不做"中国OpenAI",而是"AI时代的微信/抖音"。
这个定位意味着几个关键选择:
- 产品形态:不只是API,而是完整的C端产品。
- 用户对象:不只是企业客户,而是亿万普通用户。
- 技术路线:不只是语言模型,而是多模态融合。
- 市场范围:不只是中国,而是全球。
场景三:创业前的最后犹豫
据内部人士透露,在正式离职创业前的最后几周,闫俊杰曾经历过一段犹豫期。
商汤即将上市,他的期权价值不菲。如果再等几个月,财务自由近在眼前。
但他最终还是选择了离开。
一个重要的考量是:时间窗口不等人。
大模型赛道的竞争正在升温。几乎每周都有新的创业公司成立,几乎每月都有新的融资消息传出。如果等到商汤上市、期权兑现再行动,可能已经晚了半年甚至一年。
在一个技术迭代极快的领域,半年可能意味着一代产品的差距。
另一个考量是:心态的保持。
一旦财务自由,人的心态很容易改变。"反正不差钱,何必冒险?"这种想法会逐渐侵蚀创业的动力。
闫俊杰担心,如果现在不走,以后可能就没有勇气走了。
最终,他选择了在商汤上市前离开,放弃了可预见的财务回报,换取了一个不确定但充满可能性的未来。
清晰的问题意识只是起点,真正的挑战是将其转化为可执行的行动纲领。
闫俊杰的问题意识如何落地为Minimax的战略框架?
从"为什么中国没有GPT-3"到"我们要做什么样的模型"
问题:GPT-3验证了规模效应,但中国在算力和数据上有劣势。直接复刻GPT-3的路线未必可行。
解法:选择更适合自身条件的技术路线。
具体决策:
- 架构选择:采用MoE(混合专家模型),在算力有限的情况下最大化模型容量。
- 训练策略:注重数据质量而非数量,在中文语料上做精细化处理。
- 优化目标:不追求论文跑分,而是关注实际应用中的错误率。
从"避免成为API供应商"到"我们要做什么样的产品"
问题:ToB模式有天花板,C端产品才有更大的想象空间。但C端产品需要更强的产品能力和用户洞察。
解法:从一开始就同时发展技术和产品,用产品反馈驱动技术迭代。
具体决策:
- 产品矩阵:同时开发多款C端应用(星野、海螺AI、Talkie),覆盖不同场景和用户群。
- 迭代方式:建立用户共创机制,将真实用户反馈快速转化为模型优化。
- 商业模式:探索订阅付费、增值服务等多种变现方式,不依赖单一的API收入。
从"让AI普惠大众"到"我们要服务什么样的用户"
问题:普惠意味着服务那些通常被忽视的用户群体。他们的需求是什么?如何触达他们?
解法:从"陪伴"和"创作"两个切入点,设计低门槛、高情感价值的产品。
具体决策:
- 产品定位:不只是工具,更是陪伴。让用户感受到AI的温度,而不只是效率。
- 用户画像:关注年轻人、学生、创作者等对新技术接受度高、对AI有情感需求的群体。
- 全球视野:通过Talkie等产品进入海外市场,服务全球用户。
回顾闫俊杰的创业动机,可以看到一个清晰的演化过程:
起点:"我想要"
最初的动机是个人的:想要证明自己、想要与王者竞争、想要做一些不一样的事情。这些是创业的原始燃料,没有这些动力,不会有人愿意放弃安稳去冒险。
转化:"我能做"
接下来是能力的匹配:我有这个技术背景、有这个行业经验、有这个人脉网络,我具备创业的条件。这是从"想要"到"可行"的桥梁。
升华:"世界需要"
最终的动机是超越个人的:世界需要普惠的AI、需要真正的智能助手、需要技术民主化。创业不只是为了自己,而是为了实现一个更大的使命。
这种从"个人欲望"到"社会使命"的升华,是伟大创业者的共同特征。
马斯克创立SpaceX,表面上是对火箭的痴迷,深层是让人类成为多行星物种的愿景。
乔布斯创立苹果,表面上是对产品的执着,深层是用技术改变人们生活方式的信念。
闫俊杰创立Minimax,表面上是对AI的热情,深层是让技术普惠每一个普通人的使命。
当个人动机与社会需求对齐时,创业就获得了超越个人的意义。这种意义感是长期坚持的源泉——当困难来临、当质疑声起、当前路迷茫时,只有那些拥有超越性使命的创业者,才能坚持走下去。
-
创业时机是多重因素的交汇点。 技术窗口、商业机会、个人准备——这些因素必须同时满足,才能构成理想的创业时机。2021年的Minimax,恰好站在这个交汇点上。
-
问题意识是创业的起点。 清晰地定义问题,往往比解决问题更重要。闫俊杰的三重问题意识——技术、商业、社会——构成了Minimax战略的基础。
-
路线选择决定命运。 "中国OpenAI" vs "差异化创新"的争论,不是对错之分,而是道路之选。选择不同的道路,就选择了不同的竞争格局、不同的成功概率、不同的公司命运。
-
动机的升华是长期坚持的关键。 从"我想要"到"世界需要"的转化,让创业获得了超越个人的意义。这种意义感是面对困难时最强大的支撑。
-
行动纲领是问题意识的延伸。 问题意识必须转化为具体的决策——做什么样的模型、做什么样的产品、服务什么样的用户。没有这种转化,问题意识只是空谈。
【本章完】
请输入"继续"以开始第五章:初始团队的形成
2021年深秋,上海某个不起眼的写字楼里,Minimax的初创团队正在召开第一次全员会议。
与会者不过十几个人,挤在一间临时租用的办公室里。没有豪华的装修,没有气派的会议桌,甚至连公司logo都还没设计好。唯一醒目的是白板上密密麻麻的技术路线图,以及每个人眼中燃烧的热情。
闫俊杰站在白板前,用平静但坚定的语气说道:
"我们要做的,是让AI成为每个人的生产力工具。这可能需要五年、十年,甚至更长时间。在座的每一位,都需要做好长期战斗的准备。"
这就是Minimax的起点。没有隆重的发布会,没有铺天盖地的媒体报道,只有一群相信同一个愿景的人,聚在一起,准备做一件难以想象的事情。
技术核心:商汤系的号召力
Minimax的创始团队有一个显著特征:浓厚的商汤血统。
闫俊杰在商汤工作七年,从实习生做到研究院副院长、智慧城市事业群CTO。这段经历不仅积累了技术能力,更积累了宝贵的人脉资源。
当他决定创业时,第一批追随者大多来自商汤。
这不是偶然。
首先,商汤培养了中国最优秀的一批AI人才。能在商汤做到核心岗位的人,技术水平毋庸置疑。
其次,闫俊杰在商汤的口碑极好。他不是那种高高在上的领导,而是真正和团队一起解决问题的人。很多曾经的下属愿意跟随他,不仅因为相信他的能力,更因为信任他的人品。
最重要的是,这些人都经历过商汤从创业到上市的完整周期。他们见过AI公司的辉煌,也见过其中的问题。他们知道什么是可行的,什么是陷阱。这种经验是无价的。
但"商汤系"也有其局限性。
商汤本质上是一家ToB公司,擅长的是把技术卖给企业客户。而Minimax的目标是ToC——直接面向消费者。这是两种完全不同的能力集。
技术出身的团队,往往在产品设计、用户体验、市场营销等方面存在短板。如何弥补这些短板,是Minimax成立初期面临的重要挑战。
互补短板:寻找缺失的拼图
闫俊杰很清楚团队的局限性。他没有假装"技术万能",而是主动寻找互补的人才。
产品能力:技术团队擅长"做出功能",但不一定擅长"设计体验"。Minimax需要有产品sense的人,能够从用户视角思考问题,把复杂的技术翻译成简洁的产品。
市场洞察:大模型是新事物,用户需求还不清晰。需要有人能够深入用户群体,理解他们的痛点和期待,指导产品方向。
融资能力:创业公司需要资金,而融资是一门专业技能。需要有人能够与投资人沟通,讲好公司的故事,在关键时刻拿到关键的资源。
这些能力不是一开始就到位的。早期的Minimax更像是一个"技术作坊"——一群技术极客凑在一起,先把模型跑起来再说。
但闫俊杰从一开始就有意识地在这些方向上布局。他利用自己的人脉网络,不断接触各类人才,寻找合适的加入时机。
这种"边跑边补"的策略是务实的。初创公司没有资源一步到位地搭建完美团队,只能在发展过程中不断迭代、不断完善。关键是创始人要清醒地认识到短板在哪里,并且持续努力去弥补。
创业公司最大的挑战之一,是如何吸引顶尖人才。
优秀的人通常不缺选择。他们可以去大厂拿高薪,可以去成熟公司享受稳定,可以去其他创业公司博更大的机会。凭什么选择Minimax?
闫俊杰在这方面有自己的方法论。
第一,用愿景吸引,而非用薪酬竞争
创业公司在薪酬方面很难与大厂竞争。如果拼待遇,永远拼不过腾讯、阿里、字节。
但创业公司有大厂没有的东西:参与历史的机会。
闫俊杰在招聘面谈时,从不回避公司的风险和不确定性。他会坦诚地告诉候选人:我们可能失败,我们的待遇不如大厂,我们要面对无数困难。
但他也会分享自己的愿景:我们要做的是AI时代最重要的事情——让每个人都能使用真正智能的AI。如果成功,我们将改变数十亿人的生活。如果你想参与这件事,现在是最好的时机。
这种坦诚反而增加了可信度。那些被愿景打动的人,往往是最坚定的追随者。
第二,用专业赢得尊重
顶尖人才最看重的,是与同样优秀的人共事的机会。
闫俊杰本人就是最好的"招牌"。他的学术背景(中科院博士、清华博后)和工业经验(商汤七年)都是顶级的。当他与候选人交流技术问题时,对方很快就能感受到他的专业深度。
"跟这个人共事,我能学到东西。"——这种感觉,比任何薪酬承诺都更有说服力。
第三,给予真正的空间和信任
大厂的问题是层级太多、流程太长。优秀的人才往往被困在繁琐的会议和汇报中,无法发挥真正的创造力。
Minimax从一开始就承诺:这里没有官僚主义,每个人都可以直接参与核心决策。你的想法会被认真对待,你的贡献会被清晰看到。
这种承诺不是空话。Minimax早期的组织结构极其扁平,闫俊杰几乎和每一个团队成员保持直接沟通。决策过程透明、反馈周期短、试错空间大。
对于那些渴望做出impact的人来说,这种环境比高薪更有吸引力。
第四,坦诚面对不确定性
很多创业公司在招聘时喜欢"画大饼"——夸大前景、隐藏风险、承诺过高的回报。这种做法短期内可能有效,但长期会损害信任。
闫俊杰的风格完全不同。他会清晰地告诉候选人:
- 这件事非常难,失败的概率很高
- 前两年可能看不到明显的成果
- 我们的资源有限,必须非常高效地使用
- 但如果成功,这将是一件改变世界的事情
这种坦诚反而建立了更深的信任。候选人知道自己在做什么决定,知道将面对什么困难,也知道为什么值得去做。
一家公司的组织文化,往往在创立初期就已经定型。就像人的性格在童年时期形成一样,公司的"性格"也在最初几年被塑造。
Minimax在成立之初就确立了几条核心的组织原则,这些原则后来成为公司文化的基石。
原则一:轻量化组织
"保持组织结构简单,注重研发效率。"
这是闫俊杰反复强调的一点。他在商汤见过太多因为组织臃肿而导致效率低下的案例。当公司变大时,管理层级增加、会议变多、决策变慢——这些都是创新的大敌。
Minimax的应对之道是:永远保持"小公司心态"。
即使团队在扩张,也要尽可能保持扁平的结构。减少不必要的中间层级,让信息能够高效流动。让做事的人有决策权,而不是把决策权集中在不了解一线情况的管理者手中。
在实践中,这意味着:
- 小团队作战:将大项目拆分成小团队,每个团队拥有清晰的目标和充分的自主权
- 直接沟通:鼓励跨层级的直接交流,避免信息在传递过程中失真
- 快速决策:对于大多数问题,快速做出"够好"的决定,而不是追求"完美"的决定
原则二:科学方法
"采用数据科学快速识别有效路径。"
AI公司天然具有数据驱动的基因,但真正将这种思维应用到管理决策中的公司并不多。
Minimax的做法是:把管理问题也当作"优化问题"来处理。
任何决策,都需要有清晰的评估指标。任何行动,都需要能够衡量其效果。不靠拍脑袋,不靠权威,而是靠数据说话。
这种方法论渗透到了公司运营的各个层面:
- 技术方向选择:不是谁声音大谁说了算,而是用实验结果来验证假设
- 产品迭代:不是凭感觉设计功能,而是通过用户数据发现真正的需求
- 人员评估:不是看谁更会表达,而是看实际的产出和贡献
原则三:人才标准
"选择能提升团队整体输出的人,而非单打独斗的明星。"
这是一个微妙但重要的区分。
很多公司在招聘时,倾向于选择那些个人能力极强的"明星"——履历光鲜、成就突出、面试表现惊艳。但这些"明星"并不总是团队的最佳选择。
有些人个人能力很强,但合作能力差。他们可能完成自己的任务,但会让周围人的工作变得更困难。
有些人喜欢"独占功劳",不愿意分享知识和资源。他们的存在会破坏团队的信任氛围。
有些人"政治能力"强于"专业能力",擅长向上管理但不擅长真正做事。他们会侵蚀组织的务实文化。
闫俊杰的选择标准是:"1+1>2"。
一个人加入团队后,团队的整体产出是否会提升?如果答案是肯定的,这个人就是好的选择。如果一个人个人能力虽强,但会让团队其他人的产出下降,那就不是好的选择。
这个标准听起来简单,但执行起来需要克服很多诱惑。当一个履历漂亮的候选人出现时,很难抵抗将其招入的冲动。但如果严格按照这个标准,就需要仔细评估:这个人的性格、沟通方式、合作态度是否与团队兼容?
创业公司永远面临资源约束。钱不够、人不够、时间不够——这些都是常态。Minimax也不例外。
2021年底成立时,公司面临三大核心资源的短缺:算力、数据、资金。如何在这些约束下生存并发展?
算力困境:一卡难求的2021年
训练大模型需要大量的GPU算力。2021年,全球正处于芯片短缺的高峰期,AI芯片尤其供不应求。
英伟达的A100是当时最先进的AI训练芯片,价格高达数万美元一张,而且有钱也未必买得到。大公司凭借资金优势囤积芯片,创业公司几乎无处可买。
雪上加霜的是,中美科技脱钩的阴影正在逼近。虽然A100当时尚未被禁售,但所有人都意识到:这只是时间问题。
Minimax的应对策略是多管齐下:
- 多渠道采购:利用各种渠道获取芯片,包括云服务商、分销商、二手市场
- 优化训练效率:在算力有限的情况下,尽可能提高每一张卡的利用效率
- 架构选择:MoE架构的一个优势是推理时只激活部分参数,对算力的需求相对较低
- 借力云服务:与主流云服务商合作,按需租用算力,避免一次性的大额资本开支
这些策略并不能完全解决问题,但足以让公司在困境中生存下来。
数据挑战:高质量中文语料的稀缺
大模型的效果很大程度上取决于训练数据的质量。OpenAI可以利用整个英文互联网,但中文语料的情况要复杂得多。
中文互联网上的内容虽然数量庞大,但质量参差不齐。社交媒体上的碎片化表达、低质量的营销文案、大量的重复内容——这些"噪音"会严重影响模型的学习效果。
更麻烦的是,高质量的中文内容(如学术文献、专业书籍、优质新闻)往往受到版权保护,无法直接使用。
Minimax的策略是:质量优先于数量。
与其盲目扩大数据规模,不如专注于提升数据质量。具体措施包括:
- 建立严格的数据清洗流程,过滤低质量内容
- 与优质内容提供商合作,获取授权数据
- 利用模型自身的能力进行数据增强和质量评估
- 针对特定领域(如教育、医疗、法律)收集高质量垂直数据
这种策略意味着短期内数据规模可能落后于竞争对手,但长期来看,高质量数据带来的模型优势是可持续的。
融资困难:天使轮的艰难与关键抉择
2021年底,AI投资正处于低谷。
前几年的"AI泡沫"刚刚破裂,投资人对AI公司普遍持谨慎态度。商汤上市后股价低迷,更是打击了市场信心。
在这种环境下融资,Minimax面临很大的挑战。
很多投资人对"大模型"这个概念感到陌生。他们习惯的是计算机视觉、语音识别这些"看得见摸得着"的应用。大语言模型听起来太抽象、太遥远、太不确定。
也有投资人担心竞争格局。OpenAI有微软撑腰,谷歌、Meta等巨头也在入场,一家中国创业公司凭什么能赢?
但也有少数投资人看到了机会。他们相信大模型是下一个时代的基础设施,而中国市场需要自己的大模型公司。他们愿意在别人恐惧时贪婪,在不确定性中下注。
这些投资人成为Minimax早期的关键支持者。他们不仅提供资金,还提供资源、人脉和战略建议。
融资过程中,闫俊杰做了一个重要的选择:不为了估值牺牲条款。
有些投资人愿意给更高的估值,但要求更多的控制权。有些投资人催促更快的商业化,但可能损害长期发展。闫俊杰宁愿接受较低的估值,也要保持公司的独立性和战略自主权。
这个决定在当时看起来是"亏了",但长期来看是正确的。保持对公司的控制权,让Minimax能够坚持自己的战略,而不是被资本裹挟。
一个创始团队能否成功,不仅取决于每个成员的个人能力,更取决于他们之间的"化学反应"。
Minimax的早期团队有几个特点,这些特点决定了团队的独特气质。
共同的技术信仰
团队成员大多是技术背景出身,对AI有着近乎宗教式的热情。他们相信AI将改变世界,相信自己正在参与历史。
这种共同的信仰创造了强大的凝聚力。即使面对困难和挫折,大家也能相互支撑,因为每个人都知道:我们是为了同一个目标在战斗。
互补的能力结构
虽然都是技术背景,但团队成员的专长各有不同:有人擅长模型训练,有人擅长系统工程,有人擅长数据处理,有人擅长产品设计……
这种互补让团队能够覆盖大模型开发的各个环节,而不是在某些方面严重缺失。
相似的工作风格
Minimax的早期成员普遍具有几个共同特征:
- 务实:不追求虚名,只关心实效
- 高效:珍惜时间,快速执行
- 坦诚:有问题直说,不藏着掖着
- 长期主义:不急于求成,愿意做困难但正确的事
这种相似的风格让沟通变得简单,减少了很多内耗。
健康的冲突处理
任何团队都会有分歧和冲突。Minimax的处理方式是:鼓励争论,但尊重决定。
在重大问题上,团队成员可以充分表达不同意见,甚至激烈争论。但一旦做出决定,所有人都会执行,不会"阴奉阳违"。
这种文化让团队既能获得多元视角的好处,又不会因为分歧而陷入瘫痪。
坦诚地说,Minimax的早期团队并不完美。
技术导向过重:团队大多是技术出身,在产品、市场、运营等方面存在明显短板。早期的产品决策有时过于"工程师思维",不够贴近用户真实需求。
大厂思维残留:虽然离开了大厂,但大厂的工作习惯不会一夜之间消失。有时候决策流程过长,有时候过于追求完美而忽视速度。
资源分配失误:在资源有限的情况下,早期也做过一些错误的资源分配决策——投入过多精力在某些最终证明不成功的方向上。
但创业团队的特点就是:在发展中成长,在错误中学习。
重要的不是一开始就完美,而是能够快速识别问题、承认错误、做出调整。
Minimax的团队展现了这种能力。当发现产品能力不足时,主动引入产品背景的人才;当发现决策流程过慢时,简化会议机制;当发现资源分配错误时,快速止损并重新聚焦。
这种自我迭代的能力,比起始的完美更加重要。
-
创始团队不需要一开始就完美。 "边跑边补"是创业的常态。关键是创始人要清醒认识短板,并持续努力弥补。
-
用愿景吸引人才比用薪酬竞争更可持续。 顶尖人才寻找的不只是收入,更是意义和成长。能够清晰表达愿景的创业公司,有独特的吸引力。
-
组织文化在早期就会定型。 轻量化、数据驱动、团队优先于个人——这些原则应该从一开始就确立,而不是等公司变大后再试图改变。
-
资源约束是创业的常态,也是创新的催化剂。 算力不足逼迫Minimax优化效率,数据稀缺倒逼质量优先。约束往往是最好的老师。
-
团队的"化学反应"比个人能力更重要。 一群能够良好协作的"A-"级人才,往往胜过一群无法合作的"A+"级明星。
-
保持战略自主权比获得高估值更重要。 在融资时不为估值牺牲条款,是保持长期发展空间的关键。
【本章完】
请输入"继续"以开始第六章:技术方向与产品定位的早期抉择
创业如同在迷雾中行走。每一个岔路口都意味着不同的命运,而你无法预知哪条路通向成功,哪条路通向深渊。
2021年末至2022年初,Minimax面临一系列关键的技术和产品决策。这些决策将在此后几年深刻影响公司的发展轨迹。
回过头来看,这些决策大多是正确的。但在当时,每一个决策都充满不确定性,都需要在信息不完整的情况下做出判断。理解这些决策的背景和逻辑,对于任何创业者都有借鉴价值。
让我们逐一还原这些关键抉择。
背景:两种技术路线的对峙
2021年,大语言模型的主流架构是"密集模型"(Dense Model)。
密集模型的特点是:所有参数在每次推理时都被激活。GPT-3就是典型的密集模型——1750亿参数,每处理一个token都要调用全部参数进行计算。
这种架构简单直接,工程实现相对容易。但它有一个致命的缺陷:计算成本与参数量线性增长。
模型越大,推理成本越高。当参数量达到千亿级别时,推理一次的成本已经相当可观。如果要服务数百万甚至数亿用户,算力开支将是天文数字。
另一种架构是MoE(Mixture of Experts,混合专家模型)。
MoE的核心思想是:将模型分成多个"专家"模块,每次推理时只激活其中一部分。通过一个"门控网络"(Gating Network)来决定:对于当前输入,应该使用哪些专家?
这意味着:模型可以拥有巨大的总参数量(代表强大的知识容量),但每次推理只使用其中一小部分(控制计算成本)。
举个具体的例子:一个拥有1万亿参数的MoE模型,如果每次只激活其中的10%,那么推理成本大致相当于一个1000亿参数的密集模型。但它的知识容量却是后者的十倍。
Minimax的选择:激进地押注MoE
在2021年,MoE仍然是学术前沿,工程实现难度大。很少有公司敢于在生产环境中使用MoE架构。
谷歌的Switch Transformer论文刚刚发表不久,证明了MoE在大规模训练中的可行性。但从论文到产品,中间还有巨大的鸿沟。
大多数创业公司选择了"稳妥"路线:先用密集模型做出产品,等MoE技术成熟后再考虑迁移。
但Minimax做出了不同的选择:从一开始就全面采用MoE架构。
这是一个激进的决定。它意味着更高的技术风险、更长的研发周期、更多的工程挑战。但闫俊杰认为,这个风险值得冒。
决策逻辑分析
闫俊杰的判断基于几个核心洞察:
第一,推理成本将成为决胜因素。
大模型的商业化必然面临成本问题。如果推理成本过高,就无法大规模服务用户,就无法实现"普惠"的愿景。
密集模型在这一点上有天然的劣势。随着模型规模增大,推理成本会线性增长,最终达到无法承受的程度。
而MoE架构可以在保持性能的同时控制推理成本,是实现规模化服务的必要条件。
第二,先发优势在技术积累上尤为重要。
MoE的工程实现涉及大量know-how:如何设计门控网络?如何平衡各专家的负载?如何在分布式环境中高效训练?这些都是需要时间积累的工程经验。
如果等别人把MoE做成熟再跟进,就会在这些关键技术上落后。不如从一开始就投入,在实践中积累经验,建立技术壁垒。
第三,技术路线一旦确定,迁移成本极高。
如果先用密集模型开发产品,后续再迁移到MoE,需要重新训练模型、重新优化系统、重新调试产品。这个迁移成本可能比从头开始还高。
不如一步到位,避免将来的技术债务。
工程实现的艰辛
选择MoE是正确的战略决策,但执行层面的困难超出预期。
早期的训练经常出现各种问题:
- 负载不均衡:某些专家被过度使用,其他专家几乎闲置
- 训练不稳定:门控网络的梯度波动大,导致训练过程震荡
- 分布式通信瓶颈:专家分布在不同机器上,通信开销显著
团队投入了大量精力解决这些工程问题。经过无数次失败和调试,最终在2022年推出了abab 6——国内首个基于MoE架构的大语言模型。
这个"首个"的意义不仅在于时间上的领先,更在于技术能力的验证。它证明了中国团队也能在最前沿的架构上做出可用的产品。
背景:单模态 vs 多模态的争论
2021-2022年,大模型领域的主流是"单模态"——专注于文本处理的语言模型。GPT-3、BERT、T5等明星模型都是纯语言模型。
但也有少数团队在探索"多模态"——将文本、图像、语音、视频等多种模态融合在一个统一的框架中。
多模态的诱惑是显而易见的:人类理解世界的方式本来就是多模态的。我们同时使用眼睛看、耳朵听、嘴巴说,各种感官信息在大脑中融合处理。如果AI要真正理解世界,也应该具备类似的能力。
但多模态的挑战也是巨大的:
- 技术复杂度:不同模态的数据表示方式完全不同,如何统一?
- 训练难度:多模态数据的获取和对齐都更加困难
- 资源消耗:处理多种模态意味着更大的计算开销
- 产品定义:多模态能力应该如何呈现给用户?
很多公司选择了"先单模态,后多模态"的渐进策略:先把语言模型做好,再逐步添加其他模态。
Minimax的选择:从一开始就布局多模态
Minimax的策略不同。闫俊杰坚持从创业初期就同时推进多种模态的研发:
- 文本到文本:基础的语言理解和生成能力
- 文本到语音:让AI能够"说话"
- 文本到视觉:让AI能够"创作图像"
- 语音到文本:让AI能够"听懂"
这是一个资源消耗极大的策略。对于一家初创公司来说,同时推进四个方向似乎过于分散。
但闫俊杰的判断是:多模态不是"增值功能",而是"核心能力"。
决策逻辑分析
第一,AGI必须是多模态的。
真正的通用人工智能(AGI)必须能够理解真实世界,而真实世界是多模态的。一个只能处理文本的AI,无论文本能力多么强大,都无法称为AGI。
如果Minimax的愿景是打造真正的智能助手,那么多模态就不是可选项,而是必须项。
第二,产品体验依赖多模态。
从用户角度来看,最自然的交互方式是多模态的:用语音发出指令,用图像展示结果,用文本记录信息……
单模态的产品体验天然受限。如果想要打造"AI时代的微信",就必须支持多种交互方式。
第三,早期布局建立技术壁垒。
多模态融合的技术难度很高,需要长期的研发积累。如果等市场成熟后再进入,就会面临激烈的竞争。
早期布局虽然资源消耗大,但可以在竞争对手反应过来之前建立领先优势。
"三位一体"的技术架构
基于这个判断,Minimax构建了"三位一体"的多模态技术架构:
- 语言模型核心:以大语言模型为中枢,负责理解用户意图和组织输出内容
- 感知模块:语音识别、图像理解等模块,将多模态输入转化为语言模型可处理的表示
- 生成模块:语音合成、图像生成等模块,将语言模型的输出转化为多模态内容
这三层架构相互配合,形成一个完整的多模态AI系统。
在后来的产品中,这种架构的优势得到了充分体现:
- 海螺AI可以用语音与用户对话,用图像辅助解释
- 星野可以根据文本描述生成视觉内容
- Talkie可以以多种形式与用户互动
如果没有早期的多模态布局,这些产品特性都无法实现。
背景:ToB vs ToC的经典争论
大模型商业化有两条主要路径:
路径一:先做API(ToB)
将模型能力封装成API接口,卖给企业客户。客户基于这些API开发自己的应用。
这条路径的优势是:
- 商业模式清晰,按调用量收费
- 客户获取相对容易,企业客户有明确的采购预算
- 不需要自己做产品,专注于技术
劣势是:
- 陷入"API供应商"的定位,缺乏用户心智
- 受制于客户的产品决策,无法直接获取用户反馈
- 容易陷入价格战
路径二:先做C端应用(ToC)
直接面向消费者,开发完整的AI应用产品。
优势是:
- 直接触达用户,建立用户心智
- 获取一手用户反馈,形成数据飞轮
- 如果成功,可以形成"赢者通吃"的格局
劣势是:
- 产品开发难度大,需要技术、设计、运营等多种能力
- 用户获取成本高,市场教育周期长
- 短期内难以盈利
大多数大模型创业公司选择了"先ToB,后ToC"的渐进策略:先通过API赚到现金流,再逐步拓展C端市场。这是一条相对稳妥的路。
Minimax的选择:技术与产品并重
Minimax的策略更加激进:从一开始就同时推进API和C端应用。
这意味着同时承担两条战线的压力:既要保持技术研发的强度,又要投入资源做产品开发。对于一家资源有限的创业公司来说,这是巨大的挑战。
但闫俊杰认为这种"激进"是必要的。
决策逻辑分析
第一,用户反馈是最宝贵的数据。
大模型的优化高度依赖用户反馈。只有让真实用户使用产品,才能发现模型的真正问题在哪里。
如果只做API,用户反馈被企业客户隔离,公司无法直接获取。这意味着模型优化将失去最重要的信号来源。
C端产品可以直接收集用户行为数据:哪些回答用户喜欢?哪些回答用户不满意?用户在什么场景下使用产品?这些数据对于改进模型至关重要。
第二,C端市场是"赢者通吃"的。
在消费者市场,先发优势极为重要。一旦某个产品占据了用户心智,后来者即使技术更好也很难撼动。
微信不是第一个即时通讯软件,但它成功占据了用户心智后,后来的竞争对手无论技术多强都无法撼动。
如果等技术成熟后再做C端产品,可能已经晚了。最好的策略是:一边迭代技术,一边培养用户。
第三,"技术-产品"闭环是核心竞争力。
真正的竞争壁垒不是单纯的技术,也不是单纯的产品,而是"技术-产品"的完整闭环。
技术驱动产品创新,产品反馈驱动技术优化,两者相互促进、螺旋上升。只做API的公司缺乏产品能力,只做应用的公司缺乏技术深度。两者兼具的公司才能建立真正的壁垒。
资源分配的艺术
当然,"技术与产品并重"不意味着资源平均分配。Minimax的做法是:
- 核心资源(高端人才、算力)优先投入底层技术研发
- 产品团队保持��简高效,专注于"验证假设"而非"追求完美"
- 快速迭代,用最小可用产品(MVP)获取用户反馈,然后快速改进
这种策略确保了技术研发不受影响,同时又能通过产品获取宝贵的用户数据。
背景:两个市场的不同逻辑
AI大模型的市场可以粗略分为国内和海外两部分。
国内市场的特点:
- 用户基数大,中国有超过10亿互联网用户
- 文化和语言熟悉,产品设计和运营更容易
- 竞争激烈,字节、腾讯、百度等巨头都在入场
- 监管复杂,AI应用需要备案、内容审核等
海外市场的特点:
- 用户分散在多个国家,语言和文化差异大
- 运营难度高,需要本地化团队
- 竞争格局相对分散,巨头的优势不那么明显
- 监管相对宽松(因地区而异),产品迭代可以更快
很多中国科技公司的策略是"先国内,后海外":先在国内市场站稳脚跟,再向海外扩张。这是一条相对稳妥的路径。
Minimax的选择:国内海外同步布局
Minimax采取了不同的策略:在专注国内市场的同时,早期就布局海外。
这一策略的最突出体现是Talkie——一款面向海外市场的AI社交应用。
Talkie在2023年上线,迅速在海外市场获得关注。到2024年,Talkie已经在157个国家和地区运营,年收入达到约7000万美元,成为Minimax最重要的收入来源之一。
决策逻辑分析
第一,海外市场是检验竞争力的"试金石"。
在国内市场,本土公司有天然优势:语言、文化、政策、渠道……这些因素可能掩盖产品本身的竞争力问题。
海外市场则不同。在那里,Minimax需要与OpenAI、Anthropic等全球顶尖公司直接竞争。如果能在这样的竞争中胜出,就证明了技术和产品的真正实力。
第二,海外市场的商业环境更友好。
在国内,AI应用面临严格的内容审核和备案要求。某些功能可能需要数月才能获得批准,产品迭代速度受到影响。
海外市场(尤其是美国、欧洲)的监管环境相对宽松,产品可以更快地迭代和试错。这对于一个需要快速学习和调整的创业公司来说非常重要。
第三,海外市场分散竞争压力。
国内AI市场的竞争极为激烈。字节、腾讯、百度等巨头都在大力投入,创业公司面临巨大的压力。
海外市场虽然也有强劲对手,但竞争格局相对分散。尤其是在某些垂直领域和区域市场,创业公司有更多的突破机会。
Talkie的战略意义
Talkie的成功不仅是收入贡献,更重要的是战略意义:
- 验证产品能力:证明Minimax能够做出全球用户喜爱的产品
- 获取多元数据:海外用户的反馈可以帮助优化模型,避免单一市场的偏见
- 建立全球品牌:为未来的全球化扩张奠定基础
- 分散风险:降低对单一市场的依赖
当然,海外布局也带来了额外的挑战:需要组建本地化团队,需要理解不同市场的文化差异,需要应对各国不同的法规要求。这些都是持续投入的领域。
战略决策需要通过产品来落地。Minimax的早期产品迭代充满了探索与试错。
abab 6:技术突破的里程碑
2022年,Minimax发布了abab 6——国内首个基于MoE架构的大语言模型。
这个发布具有多重意义:
- 技术验证:证明了MoE架构在中文大模型中的可行性
- 能力基线:为后续产品开发提供了底层支撑
- 市场宣示:向行业展示了Minimax的技术实力
abab 6的发布并不完美。早期版本存在各种问题:回答有时不够准确,推理有时不够稳定,某些领域的知识存在明显缺陷。
但这些问题正是产品迭代的起点。通过收集用户反馈,团队不断识别问题、分析原因、优化模型。每一个版本都比上一个版本更好一点。
星野:从工具到陪伴的产品哲学
星野是Minimax面向国内市场推出的C端应用之一。
与很多"工具型"AI产品不同,星野的定位更加独特:不只是帮用户完成任务,更是提供情感陪伴。
这个定位源于闫俊杰对用户需求的洞察:
"很多人使用AI,不仅是为了提高效率,更是为了获得某种情感连接。他们想要一个能够理解自己、陪伴自己的存在。"
星野的产品设计围绕这个洞察展开:
- AI角色有独特的"人格",不是冷冰冰的工具
- 对话风格温暖、有趣,能够产生情感共鸣
- 用户可以与AI建立长期的"关系",产品有记忆和连续性
这种定位在市场上引起了共鸣,尤其是在年轻用户群体中。
海螺AI:多模态能力的产品化
海螺AI是Minimax多模态技术的产品化载体。
与纯文本的聊天机器人不同,海螺AI可以:
- 用语音与用户对话
- 理解用户上传的图片
- 生成图像、音频等多模态内容
这些能力的背后,是多年的多模态技术积累。早期"三位一体"的技术架构,在这里得到了充分的应用。
海螺AI的推出,让用户体验到了"真正的多模态AI"是什么样子。它不仅能理解文字,还能看图、听话、说话——就像一个真正的智能助手。
用户共创的实践
Minimax的产品迭代有一个核心理念:用户共创。
这不是一句空洞的口号,而是具体的实践方法:
第一,建立反馈渠道。
在产品中内置反馈功能,让用户可以方便地报告问题、提出建议。不是那种藏在角落的"客服入口",而是显眼的、鼓励使用的反馈机制。
第二,分析用户行为。
通过数据分析,理解用户实际如何使用产品。哪些功能最受欢迎?用户在哪里遇到困难?什么样的回答让用户满意?这些洞察指导产品改进的方向。
第三,快速响应。
用户反馈的问题,要快速得到响应。不是"我们会考虑",而是"我们已经修复"。这种快速响应建立了用户信任,也鼓励更多用户参与反馈。
第四,社区运营。
建立用户社区,让核心用户参与产品的设计讨论。这些"超级用户"往往有最深刻的洞察,他们的意见值得认真对待。
闫俊杰在访谈中强调:"用户共创不是口号,是生存方式。没有用户反馈,我们就是闭门造车。"
站在今天回看2021-2022年的这些决策,大多数被证明是正确的:
- MoE架构:如今已成为大模型的主流选择,Minimax的早期积累转化为技术优势
- 多模态布局:产品的多模态能力成为差异化竞争点
- ToC优先:C端产品积累了大量用户和数据,形成了数据飞轮
- 海外布局:Talkie的成功验证了全球化的可行性
但也有一些教训:
资源分散的代价
同时推进太多方向,确实带来了资源分散的问题。某些项目因为资源不足,进展缓慢。团队有时候感到"什么都在做,什么都没做好"。
解法是更加严格的优先级管理:每个季度明确最重要的1-2个目标,确保核心目标有足够资源。
速度与质量的平衡
早期为了"快速验证",有些产品发布得过于仓促。用户体验不够好,影响了口碑。
教训是:速度很重要,但不能以牺牲基本质量为代价。MVP可以功能简单,但已有功能必须可用。
技术到产品的鸿沟
技术团队做的东西,产品团队有时不知道怎么用。产品团队想要的功能,技术团队有时觉得不重要。
解法是加强两个团队的融合:让技术人员理解用户需求,让产品人员理解技术可能性。定期的跨团队会议、联合项目、人员轮岗都是有效的手段。
从Minimax早期的这些决策中,可以提炼出一套决策框架:
框架一:长期价值 > 短期便利
MoE架构难做,但长期价值高;多模态投入大,但是必须走的路;C端产品风险高,但是真正的护城河。
每一个决策都优先考虑长期价值,而不是短期便利。
框架二:用户价值 > 技术指标
不追求论文跑分,关注用户实际体验。不追求功能全面,聚焦用户真正需要。
技术是手段,用户价值是目的。
框架三:验证 > 假设
不在会议室里争论谁的假设正确,而是快速做出原型、投放市场、收集反馈。
让用户告诉我们答案,而不是自己猜测答案。
框架四:聚焦 > 分散
资源有限的情况下,必须做出取舍。宁可在少数方向上深入,不可在太多方向上浅尝辄止。
聚焦带来深度,分散导致平庸。
框架五:差异化 > 模仿
不做"中国的OpenAI",而是找到自己的独特价值。竞争的关键不是"比别人做得好一点",而是"做别人没做的事"。
差异化是生存的基础。
-
架构选择决定技术上限。 MoE vs 密集模型不只是技术细节,而是关乎公司能否实现规模化服务的战略选择。激进的技术路线有风险,但也有可能带来决定性优势。
-
多模态是AGI的必由之路。 一个只能处理文本的AI,无论文本能力多强,都不是真正的通用智能。多模态布局应该尽早开始,而不是等到"有余力"时。
-
C端产品是数据飞轮的发动机。 只有直接面对用户,才能获取最真实的反馈,才能形成"产品→数据→模型→产品"的正向循环。API生意赚钱容易,但建立壁垒困难。
-
全球视野从一开始就要建立。 海外市场不是"国内成功后再考虑"的备选项,而是验证竞争力、分散风险、获取多元数据的重要战场。
-
用户共创不是口号,是生存方式。 最好的产品不是设计出来的,而是与用户一起迭代出来的。建立有效的用户反馈机制,比任何天才的产品直觉都更重要。
-
决策框架比单次决策更重要。 正确的决策框架可以持续指导未来的选择,而单次正确的决策可能只是运气。创业者应该花时间提炼和完善自己的决策框架。
【第二编完】
请输入"继续"以开始第三编第七章:2023-2024年——技术狂飙与商业化试错
2022年11月30日,OpenAI发布了ChatGPT。
这一天,世界发生了不可逆转的改变。
在此之前,大语言模型主要是技术圈的话题。普通用户对GPT-3的印象模糊——听说过这个名字,但不太清楚它能做什么,更没有亲自使用过。
ChatGPT改变了一切。
通过一个简洁的对话界面,任何人都可以与世界上最先进的AI进行对话。你可以让它写诗、编程、翻译、解题、创作故事……它几乎无所不能,而且完全免费。
上线仅五天,ChatGPT的用户突破100万。两个月后,月活用户超过1亿,创下了消费级应用增长的历史纪录。
整个科技行业为之震动。
硅谷的巨头们如梦初醒。谷歌内部拉响"红色警报",紧急调集资源应对。微软宣布向OpenAI追加数十亿美元投资,并将ChatGPT整合进Bing搜索。Meta、亚马逊、苹果纷纷加大AI投入。
中国科技界的反应同样剧烈。百度宣布将推出"文心一言",阿里巴巴启动"通义千问"项目,腾讯、字节跳动、华为等巨头纷纷宣布大模型计划。
一时间,"大模型"从一个小众的技术术语,变成了全社会热议的话题。资本市场为之疯狂,A股和港股的AI概念股连续涨停。
对于Minimax来说,这既是机遇,也是挑战。
机遇在于:市场教育完成了。在ChatGPT之前,向用户解释"大语言模型是什么"需要很大的成本。现在,几乎每个人都知道AI能做什么,都渴望使用这样的产品。市场需求瞬间爆发。
挑战在于:竞争骤然加剧。原本稀疏的赛道一夜之间挤满了选手。不仅有互联网巨头携资金和流量入场,还有无数创业公司蜂拥而至。Minimax的先发优势面临被稀释的风险。
2023年初,闫俊杰召集核心团队开会,分析形势,制定应对策略。
他的判断是:这是一场马拉松,不是百米冲刺。短期内会有无数玩家涌入,但大多数无法持续。真正的较量在于谁能在技术上持续领先,在产品上持续迭代,在战略上保持定力。
会议最后,他在白板上写下一行字:
"保持节奏,不被带偏。"
2023-2024年是Minimax技术狂飙的两年。模型能力以惊人的速度迭代升级。
abab 6.5:万亿参数的突破
2023年下半年,Minimax发布了abab 6.5——一个拥有万亿级参数的混合专家模型。
这是一个里程碑式的成就。
回想2021年创业之初,团队训练的第一个模型只有数十亿参数。两年时间,参数量增长了两个数量级。
更重要的是,万亿参数不是简单的"数字游戏"。参数量的增加带来了能力的质变:
- 知识广度:模型掌握了更多领域的知识,回答问题时更加全面准确
- 推理深度:面对复杂问题时,模型能够进行更长链条的推理
- 语言流畅性:生成的文本更加自然、连贯、有逻辑
- 指令遵循:更好地理解和执行用户的指令
abab 6.5的性能在多个评测中达到了国际领先水平,部分指标接近甚至超越了GPT-4。
这一成就的背后是对Scaling Laws的坚定信仰和执行。闫俊杰多次在内部强调:
"规模是通向更好模型的必要条件。在这个阶段,我们不应该过度担心效率问题。先把模型做大、做强,效率问题可以后续优化。"
当然,万亿参数也意味着巨大的资源消耗。训练一次需要数千张GPU运行数周时间,电费账单都是天文数字。这种投入只有真正相信长期价值的公司才能承受。
线性注意力机制:效率革命
技术进步不仅体现在规模上,更体现在效率上。
2024年,Minimax推出了MiniMax-01系列模型,首次大规模应用了线性注意力机制。
传统的Transformer架构使用"软注意力"(Softmax Attention),计算复杂度与序列长度的平方成正比。这意味着当处理长文本时,计算开销会急剧增加。
线性注意力机制通过数学上的近似,将复杂度降低到与序列长度成线性关系。这一改进带来了显著的效率提升:
- 推理速度提升20%以上
- 长文本处理能力大幅增强
- 算力成本显著降低
这个技术突破的战略意义在于:它让Minimax能够在保持性能的同时降低成本,从而在价格战中保持竞争力。
闫俊杰后来在采访中总结道:"效率提升不是可选项,而是必须项。未来的竞争一定是'性能/成本'的竞争,而不是单纯的性能竞争。"
错误率攻坚战:从20-30%到个位数
在技术迭代中,有一个指标被Minimax视为"生命线":错误率。
所谓错误率,是指模型给出的回答中,包含事实错误、逻辑谬误或有害内容的比例。
2023年初,主流大模型的错误率大约在20-30%左右。这意味着每三到五次交互,就可能有一次出错。对于日常聊天来说,这或许可以接受。但对于严肃的应用场景——比如医疗咨询、法律建议、教育辅导——这个错误率是无法容忍的。
闫俊杰在多个场合强调这一点:
"错误率必须降低一个数量级,从20-30%降到2-3%。只有达到这个水平,AI才能真正成为可信赖的生产力工具。应用规模才会从现在的百万级扩张到亿级。"
这不是一个容易实现的目标。降低错误率需要多管齐下:
- 数据质量:清洗训练数据中的错误和噪音
- 模型架构:引入更好的事实核查机制
- 后处理:在输出前进行额外的校验
- 用户反馈:利用用户标注的数据持续优化
2024年,经过持续努力,Minimax的模型错误率已经显著下降,在多个测试集上达到了行业领先水平。虽然距离"个位数"的目标还有距离,但进步是显著的。
技术的突飞猛进令人振奋,但商业化的探索却充满曲折。
2023-2024年,Minimax在商业模式上经历了多次试错和调整。
ToB的尝试:高济神农系统
2023年,Minimax与高济健康合作,推出了"高济神农"AI诊疗辅助系统。
这是Minimax在医疗领域的重要尝试。高济健康是中国最大的连锁药房企业之一,拥有数千家门店和数百万会员。通过将Minimax的大模型能力嵌入高济的业务系统,可以为消费者提供智能化的健康咨询服务。
这个合作具有标杆意义:
- 证明了Minimax的模型能够应用于专业领域
- 展示了与行业巨头合作的能力
- 开辟了ToB商业化的路径
但ToB业务也暴露出固有的问题:
第一,销售周期长。 与大企业的合作需要经历漫长的接触、评估、谈判、签约、实施过程,往往需要半年甚至一年时间。
第二,定制需求多。 每个企业都有独特的业务场景和数据环境,需要大量的定制开发工作。这消耗了宝贵的研发资源。
第三,规模化困难。 ToB业务的增长与销售团队规模成正比,很难实现"赢者通吃"的网络效应。
Minimax并没有放弃ToB业务,但逐渐意识到:ToB可以是收入来源之一,但不应该是公司的核心战略。
ToC的突破:Talkie的收入奇迹
与ToB的艰难形成鲜明对比的是ToC业务的爆发式增长。
Talkie在2024年实现了约7000万美元的年收入,成为Minimax最重要的现金牛。
这个数字在中国AI创业公司中极为罕见。大多数公司还在烧钱阶段,Talkie已经实现了可观的收入规模。
Talkie的成功有几个关键因素:
第一,产品定位精准。 Talkie不是一个通用的聊天机器人,而是专注于"AI社交"场景——用户可以与各种AI角色进行互动,获得情感陪伴和娱乐体验。这个定位切中了年轻用户的真实需求。
第二,海外市场选择正确。 Talkie主打欧美市场,避开了国内激烈的竞争和复杂的监管。海外用户对AI产品的付费意愿更强,ARPU(每用户平均收入)更高。
第三,运营精细化。 团队在用户获取、留存、付费转化各个环节都进行了精细化运营。通过A/B测试和数据分析,持续优化产品体验和商业效率。
第四,快速迭代。 海外市场的监管环境相对宽松,产品可以快速迭代。Talkie几乎每周都有更新,不断根据用户反馈改进功能。
Talkie的成功验证了Minimax"ToC优先"战略的正确性。它证明了:AI产品可以直接面向消费者变现,而且可以实现相当的规模。
开源 vs 闭源:DeepSeek的冲击
2024年下半年,另一个变量开始显现:开源大模型的崛起。
DeepSeek是其中最引人注目的一个。这家公司由量化交易巨头幻方量化孵化,拥有充裕的资金和顶尖的技术人才。更重要的是,DeepSeek选择了完全不同的战略路线:全面开源。
2025年1月,DeepSeek发布了DeepSeek-R1系列模型。这个模型的性能接近OpenAI的o1,但训练成本据称只有几百万美元,是o1的几十分之一。
这一消息在全球科技界引发震动。
OpenAI精心构建的技术护城河似乎一夜之间被攻破。如果一家中国创业公司能用如此低的成本训练出顶尖模型,那么大模型的"高门槛"神话就被打破了。
对于Minimax来说,DeepSeek的冲击是多层次的:
技术层面:DeepSeek的成功证明了低成本训练的可行性。这意味着在算法和工程上还有巨大的优化空间。Minimax需要审视自己的训练效率是否有提升余地。
商业层面:如果顶尖模型可以免费获取,那么模型本身还能成为竞争壁垒吗?商业化的价值将更多转移到应用层。
战略层面:坚持闭源还是拥抱开源?这个问题变得更加紧迫。
闫俊杰对此有清醒的认识。他在内部会议上分析道:
"DeepSeek的成功是真实的,但不意味着开源是唯一正确的路线。我们需要思考的是:我们的核心竞争力到底是什么?是模型本身,还是'模型+产品'的组合?"
他的结论是:Minimax的优势在于'模型-产品'的一体化能力,而不是单纯的模型能力。
开源模型可以被任何人使用,但将模型转化为亿万用户喜爱的产品,需要产品设计、用户洞察、运营能力——这些是无法开源的。
Talkie的成功就是明证。使用Minimax模型的竞争对手可能很多,但能做出Talkie这样成功产品的,只有Minimax自己。
2024年,中国大模型市场进入了惨烈的价格战。
起因是字节跳动旗下的"豆包"大幅下调API价格,将市场均价拉低了一个数量级。其他玩家不得不跟进,否则就会失去客户。
一时间,"降价"成为行业主旋律。每家公司都在比谁的价格更低、谁的成本控制更好。
对于Minimax这样的创业公司来说,价格战是危险的。与巨头相比,创业公司的资金储备有限,无法承受长期的亏损竞争。
闫俊杰的应对策略是:"降价同时保持更好效果。"
这不是一句口号,而是具体的技术目标。它要求团队在两个维度同时努力:
维度一:提升效率,降低成本
通过技术优化降低推理成本。具体措施包括:
- 线性注意力机制的应用,降低计算复杂度
- 模型量化技术,减少显存占用
- 推理引擎优化,提高硬件利用率
- MoE架构的持续改进,在保持性能的同时减少激活参数
这些技术努力在2024年取得了显著成效。Minimax的推理成本降低了约50%,这意味着可以在保持利润的同时大幅降低定价。
维度二:提升效果,保持差异化
价格战的一个风险是"同质化"——如果所有产品都差不多,那就只能拼价格。
Minimax的对策是保持技术领先和产品差异化:
- 持续迭代模型能力,确保在核心指标上领先
- 发挥多模态优势,提供竞争对手没有的功能
- 优化用户体验,让产品更加易用、有趣
- 深耕垂直场景,在特定领域建立专业优势
这种"效率+效果"的双轮驱动策略,让Minimax在价格战中保持了竞争力,没有被拖入纯粹的烧钱游戏。
技术和业务的快速发展,推动了组织的迅速扩张。
2021年成立时,Minimax只有十几个人。到2024年,员工数量已经增长到数百人。
这种增长速度带来了一系列管理挑战。
挑战一:文化稀释
创业早期的团队有着强烈的使命感和紧密的协作关系。每个人都知道公司要做什么、为什么这么做。
但随着人员快速扩张,这种文化共识开始被稀释。新加入的员工未必理解公司的创业初心,可能带着在大公司养成的习惯和预期。
如果不主动干预,公司可能逐渐失去独特的文化DNA,变成一家"普通的科技公司"。
Minimax的应对方式是:
- 强化入职培训:每一位新员工都要接受公司历史、愿景、价值观的培训
- 创始人直接沟通:闫俊杰定期与新员工面对面交流,传递文化信念
- 老员工mentor制度:让早期员工"带教"新人,传承文化基因
- 案例分享:定期分享体现公司文化的正面和反面案例
挑战二:决策效率下降
人多了,会议就多了。层级多了,信息传递就慢了。很多曾经一个小时能敲定的决策,现在需要开几轮会议、走一圈流程。
这对于需要快速迭代的AI公司来说是致命的。
Minimax的应对方式是坚持"轻量化组织"的理念:
- 控制管理层级:尽可能保持扁平,避免过多的中间层
- 授权一线:将决策权下放给最了解情况的人,而不是层层上报
- 减少会议:取消不必要的会议,必须开的会议控制时长
- 异步沟通:鼓励通过文档、邮件等异步方式沟通,减少对面对面会议的依赖
挑战三:人才梯队断层
快速扩张往往导致人才梯队的断层:高层大多是早期创始团队成员,基层大多是新招聘的员工,中间层却严重缺乏。
这会导致执行力的瓶颈:高层的战略意图无法有效传达到一线,一线的问题也无法及时反馈到高层。
Minimax的应对方式是有意识地培养中层管理者:
- 从内部提拔表现优秀的早期员工担任中层管理
- 在外部招聘有管理经验的人才,填补中层空缺
- 为中层管理者提供系统的领导力培训
- 建立轮岗机制,让中层管理者了解不同业务线
挑战四:保持创新活力
组织变大后,创新活力往往下降。流程变多了,试错空间变小了,"革命性"的想法更难获得资源。
这对于AI公司来说尤其危险,因为AI领域的竞争本质上是创新的竞争。
Minimax的应对方式是刻意保护创新空间:
- "20%时间":鼓励员工用20%的工作时间探索个人感兴趣的项目
- 内部孵化:为有潜力的创新项目提供独立的资源和空间
- 容错机制:接受创新项目的失败,不惩罚善意的尝试
- 扁平化反馈:任何人都可以直接向高层提出创新建议
2023-2024年,中国AI大模型市场的竞争格局经历了剧烈变化。
"百模大战"的洗牌
2023年初,ChatGPT引爆市场后,无数玩家涌入大模型赛道。据不完全统计,一度有超过100家公司宣称在做大模型。
但到了2024年下半年,格局已经明显收窄。
量子位智库发布的报告显示,中国AI大模型市场形成了**"6+2"格局**:
- "6"指六家主要玩家:字节跳动、阿里巴巴、百度、腾讯、华为、智谱AI
- "2"指两家创业公司:Minimax和月之暗面
能够进入这个名单,对于Minimax来说是重要的认可。它意味着在残酷的市场竞争中,Minimax成功存活下来,并成为头部玩家之一。
但挑战依然严峻。"6"家公司都是巨头,拥有Minimax无法比拟的资金、流量和人才储备。创业公司要在巨头的夹缝中生存,必须找到自己的独特价值。
差异化竞争策略
Minimax的差异化策略可以总结为几个关键词:
多模态:与大多数竞争对手专注于语言模型不同,Minimax从一开始就布局多模态。语音、图像、视频的生成和理解能力,成为产品的差异化卖点。
ToC优先:当很多公司还在ToB市场厮杀时,Minimax已经在ToC市场建立了用户基础。Talkie的成功证明了这条路线的可行性。
全球化:通过Talkie的海外布局,Minimax的用户分布在全球157个国家和地区。这种全球化能力是大多数国内竞争对手不具备的。
"技术+产品"一体化:不只是做模型,也做产品;不只是卖API,也直接服务用户。这种端到端的能力是竞争壁垒。
与竞争对手的比较
在"6+2"格局中,每个玩家都有自己的定位和优势:
- 字节跳动(豆包):依托强大的流量分发能力和资金实力,以低价策略抢占市场份额
- 阿里巴巴(通义千问):深耕电商和云计算场景,ToB能力强
- 百度(文心一言):搜索入口优势,积累了大量的知识图谱
- 腾讯(混元):社交生态优势,与微信深度整合
- 华为(盘古):硬件优势,专注于政企市场
- 智谱AI:学术背景深厚,在科研和教育领域有优势
- 月之暗面(Kimi):以超长文本能力著称,在特定场景有突破
与这些竞争对手相比,Minimax的独特优势在于**"多模态+ToC+全球化"的组合**。这是一个相对独特的定位,不直接与任何一家正面竞争。
2024年末,闫俊杰组织核心团队进行了一次深度的战略复盘。
成就回顾:
- 技术层面:abab 6.5达到万亿参数,线性注意力机制成功应用,模型能力进入全球第一梯队
- 产品层面:Talkie年收入突破7000万美元,用户覆盖157个国家和地区
- 组织层面:团队规模扩大数倍,但保持了创业公司的活力和效率
- 融资层面:完成A+轮融资,估值达到25亿美元
问题识别:
- 国内ToC产品的增长不如预期,受到监管和竞争的双重压力
- ToB业务收入增长缓慢,销售周期和定制成本仍是瓶颈
- 开源模型的崛起对闭源策略构成挑战
- 算力成本仍然较高,对利润率形成压力
战略调整:
基于这次复盘,Minimax对2025年的战略进行了调整:
- 继续加大海外投入:Talkie的成功证明了海外市场的潜力,应该加大投入
- 强化多模态优势:这是差异化的核心,不能被竞争对手追平
- 提升训练效率:借鉴DeepSeek的经验,优化训练流程,降低成本
- 产品矩阵优化:聚焦最有潜力的产品线,砍掉不赚钱的项目
- 组织效率提升:在规模扩大的同时保持高效,避免大公司病
-
外部冲击是检验战略定力的试金石。 ChatGPT的爆发让无数玩家涌入赛道,但真正能够坚持自己节奏、不被带偏的公司才能笑到最后。
-
技术进步需要持续投入。 从abab 6到6.5,从万亿参数到线性注意力,每一次突破背后都是巨大的资源投入和团队努力。没有捷径可走。
-
错误率是AI产品的生命线。 用户能接受不完美的AI,但无法接受经常犯错的AI。降低错误率的努力值得持续投入。
-
商业化需要多元探索。 ToB和ToC各有利弊,没有绝对正确的路线。关键是找到适合自己的组合。
-
价格战中,效率是唯一的护城河。 降价是必然趋势,但只有在保持效果的同时降低成本,才能在价格战中生存。
-
组织扩张需要主动管理。 文化稀释、效率下降、梯队断层——这些问题不会自动解决,需要有意识地投入精力应对。
-
开源不是终结者,产品才是。 DeepSeek的开源冲击证明了模型本身的价值在下降,但"模型+产品"的一体化能力仍然是稀缺的竞争力。
【本章完】
请输入"继续"以开始第八章:2025年——重大转折点与危机时刻
2025年的第一天,闫俊杰站在办公室的落地窗前,眺望着上海的天际线。
过去的三年多时间里,Minimax从一间狭小的办公室起步,成长为估值25亿美元的独角兽。团队从十几个人扩展到数百人,产品服务着全球数千万用户。
但他心里清楚:真正的考验才刚刚开始。
2024年的成绩单看起来不错——Talkie收入突破7000万美元,技术能力跻身全球第一梯队,在"6+2"格局中占据一席之地。但表面的光鲜背后,隐忧正在积累。
算力成本持续高企,虽然效率在提升,但绝对投入仍然惊人。竞争对手的追赶越来越紧,差异化优势正在被蚕食。国内市场的监管环境日趋复杂,某些产品功能的迭代受到限制。更重要的是,开源模型的崛起正在动摇整个行业的商业逻辑。
新年刚过,一场出乎所有人意料的风暴即将来袭。
2025年1月:震惊世界的发布
2025年1月20日,DeepSeek发布了DeepSeek-R1系列模型。
这个发布在全球科技界引发了一场地震。
R1的性能接近OpenAI最新发布的o1模型——后者被认为是当时世界上最强大的推理模型。但更令人震惊的是R1的训练成本:据DeepSeek披露,整个训练过程的成本仅为约600万美元。
这个数字太过惊人,以至于很多人最初不敢相信。
OpenAI训练GPT-4的成本估计在1亿美元以上。即使是最乐观的估计,训练一个顶级大模型也需要数千万美元。而DeepSeek声称只用了600万美元?
但随后公开的技术细节证实了这一点。DeepSeek在训练效率上做了大量创新:
- 更高效的训练算法:减少了不必要的计算冗余
- 数据工程优化:用更少但更高质量的数据达到同等效果
- 硬件利用率提升:最大化每块GPU的产出
- 架构创新:MoE架构的进一步优化
更重要的是,DeepSeek选择了完全开源。任何人都可以免费下载和使用R1模型,包括商业用途。
这一举措彻底打破了大模型领域的既有格局。
全球市场的连锁反应
DeepSeek-R1的发布引发了一系列连锁反应:
美国股市:英伟达股价单日暴跌17%,市值蒸发近6000亿美元。投资者担心:如果训练大模型不再需要天量算力,英伟达的AI芯片生意还能持续吗?
OpenAI:据报道,OpenAI内部紧急召开会议,评估DeepSeek的技术路线。此前被视为"不可逾越"的技术护城河,似乎一夜之间被攻破。
中国科技股:与美股的恐慌相反,中国科技股迎来普涨。市场认为,DeepSeek证明了中国AI公司可以在芯片受限的情况下另辟蹊径。
全球AI创业公司:无数创业公司开始重新评估自己的战略。如果顶级模型可以免费获取,那么还有必要自己训练模型吗?
Minimax的内部震动
对于Minimax来说,DeepSeek-R1的冲击是多层次的。
第一层:技术自信的动摇。
Minimax一直以技术领先为核心竞争力。但DeepSeek证明了:用远低于Minimax的成本,也可以训练出顶级模型。这不禁让人怀疑:Minimax的训练效率是否有问题?是否存在巨大的优化空间?
第二层:商业模式的挑战。
如果模型本身可以免费获取,那么"卖模型能力"的商业模式还能成立吗?Minimax的API业务、ToB业务,都建立在"模型能力稀缺"的假设之上。这个假设正在被动摇。
第三层:人才市场的竞争。
DeepSeek的成功让它成为AI人才眼中的明星公司。一些原本有意向加入Minimax的候选人,开始转向DeepSeek。甚至有少数在职员工动了跳槽的念头。
1月下旬,闫俊杰召集核心团队,召开了一次紧急战略会议。
会议室里气氛凝重。白板上写满了问题:
- 我们的训练效率差距到底有多大?
- 开源模式会成为主流吗?
- 我们是否应该调整闭源策略?
- 如何向投资人和员工解释形势?
闫俊杰让每个人充分发表意见。有人建议加大开源力度,有人建议聚焦应用层,有人建议加大效率优化投入,也有人认为应该保持定力、不被带偏。
讨论持续了整整一个下午。
最后,闫俊杰总结了自己的判断:
"DeepSeek的成功是真实的,我们不应该否认或低估。但我们也不应该恐慌。让我们分析一下,DeepSeek真正证明了什么,以及我们的核心竞争力到底是什么。"
他在白板上画了一个图表:
模型能力 × 产品能力 × 运营能力 = 用户价值
DeepSeek的优势:模型能力(开源可获取)
Minimax的优势:模型能力 + 产品能力 + 运营能力
"DeepSeek开源的是模型,但模型只是创造用户价值的一部分。把模型转化为用户喜欢的产品,需要产品能力。把产品推广给亿万用户,需要运营能力。这些是无法开源的。"
"Talkie的成功不只是因为我们的模型好,更是因为我们理解用户、懂得产品、擅长运营。使用DeepSeek开源模型的公司可能有很多,但做出Talkie这样成功产品的,只有我们。"
"所以,我的结论是:我们要学习DeepSeek的效率创新,但不必放弃我们的核心战略。模型+产品+运营的一体化能力,仍然是我们的护城河。"
会议最后,团队达成了共识:
- 成立专项小组,研究DeepSeek的技术路线,寻找效率提升空间
- 继续坚持闭源策略,但保持灵活性,不排除未来部分开源
- 加大产品和运营投入,强化"模型→产品"的转化能力
- 主动与投资人和员工沟通,稳定军心
2025年6月:绝地反击
面对DeepSeek的冲击,Minimax没有选择防守,而是选择了进攻。
2025年6月,Minimax举办了一场大型发布会,一口气发布了五款重磅产品。这场"五连发"被业界视为Minimax的绝地反击。
产品一:新一代基座模型
首先发布的是新一代基座模型,在多个关键指标上取得突破:
- 推理能力大幅提升,在复杂推理任务上接近o1水平
- 训练效率显著改善,单位性能的成本下降约40%
- 错误率进一步降低,在关键应用场景接近人类水平
这个发布证明了:Minimax有能力快速响应技术变革,在效率和性能上都能保持竞争力。
产品二:多模态大模型升级
第二个发布是多模态能力的全面升级:
- 视觉理解能力达到新高度,可以分析复杂的图表、图像和视频
- 语音交互更加自然流畅,延迟降低到难以察觉的水平
- 视频生成能力首次公开展示,画面质量和时长都有突破
多模态一直是Minimax的核心优势领域。这次升级进一步拉大了与竞争对手的差距。
产品三:智能体(Agent)平台
第三个发布是全新的智能体平台:
- 用户可以创建自定义的AI智能体,设定其性格、知识和行为模式
- 智能体可以访问外部工具和数据源,完成复杂的任务
- 智能体之间可以协作,形成多智能体系统
智能体被视为大模型应用的下一个重要方向。这个平台的发布,让Minimax在这个领域占据了先机。
产品四:开发者工具套件
第四个发布面向开发者社区:
- 更易用的API,降低接入门槛
- 丰富的SDK,支持主流编程语言和开发框架
- 完善的文档和示例代码
- 免费额度和创业公司扶持计划
这个发布旨在扩大Minimax的开发者生态,让更多的应用构建在Minimax之上。
产品五:企业解决方案升级
第五个发布针对企业客户:
- 私有化部署选项,满足数据安全需求
- 行业定制模型,针对金融、医疗、教育等垂直领域
- 企业级服务保障,包括SLA、技术支持和定制开发
这个发布是对ToB业务的加强,试图在这个领域获取更多收入。
发布会的效果
"五连发"在业界引起了巨大反响:
媒体评价:多家科技媒体给予高度评价,认为Minimax展示了强大的技术储备和产品能力。
资本市场:投资人对Minimax的信心有所恢复,公司估值在发布会后有所上涨。
竞争对手:其他大模型公司感受到了压力,纷纷加快自己的产品发布节奏。
开发者社区:开发者工具套件获得了积极反馈,API注册量在发布后的一个月内翻倍。
但"五连发"也带来了巨大的资源压力。
同时推进五条产品线,意味着人力、算力、资金的全面吃紧。每条产品线都需要持续投入,而公司的资源是有限的。
发布会后的几个月里,团队陷入了高强度的交付压力。bug修复、功能完善、客户支持……每个团队都在超负荷运转。
这种状态是否可持续?这是一个待解的问题。
在技术竞争的喧嚣中,Talkie的表现却稳如磐石。
2025年上半年业绩回顾
2025年上半年,Talkie的业务数据持续向好:
- 月活用户突破1500万,同比增长超过80%
- 付费用户转化率稳定在8%左右,远高于行业平均
- 用户日均使用时长超过40分钟,粘性极强
- 收入继续保持高速增长,全年有望突破1亿美元
这些数字在中国AI创业公司中几乎是独一无二的。大多数公司还在苦苦寻找商业模式,Talkie已经证明了AI产品可以赚钱,而且可以赚大钱。
成功要素深度分析
Talkie的成功不是偶然的,而是多个要素共同作用的结果:
要素一:产品定位的精准
Talkie的核心定位是"AI社交"——不是让AI帮你完成任务,而是让AI陪伴你、与你互动。
这个定位切中了一个真实而巨大的需求:情感连接。
现代社会中,越来越多的人感到孤独。尤其是年轻一代,虽然在网络上有无数"好友",但真正能够交心的人却很少。AI恰好可以填补这个空白——它永远有时间、永远有耐心、永远不会评判你。
Talkie的产品设计围绕这个需求展开:
- 用户可以与各种AI角色互动,这些角色有独特的性格和故事
- 对话风格温暖、有趣、有深度,能够产生情感共鸣
- 产品有记忆和连续性,用户与AI之间可以建立"关系"
要素二:海外市场的选择
Talkie选择主攻欧美市场,这是一个关键决策。
与国内市场相比,欧美市场有几个优势:
- 付费意愿强:欧美用户习惯为数字内容付费,ARPU更高
- 监管宽松:产品迭代更快,不需要等待漫长的审批流程
- 竞争格局分散:虽然有ChatGPT等强劲对手,但在"AI社交"这个细分领域,竞争相对较弱
当然,海外运营也有挑战:文化差异、语言本地化、时区问题、支付渠道……但Talkie团队通过精细化运营,逐一克服了这些挑战。
要素三:运营的精细化
Talkie的运营团队在用户获取、留存、付费各个环节都做了大量精细化工作。
用户获取:
- 在TikTok、Instagram等平台投放精准广告
- 与网红和KOL合作,借助其影响力推广
- 应用商店优化(ASO),提高自然流量
- 口碑传播激励,鼓励用户分享和邀请
用户留存:
- 新用户引导流程优化,降低流失率
- 推送策略优化,召回沉默用户
- 定期更新内容和角色,保持新鲜感
- 社区建设,增强用户归属感
付费转化:
- 定价策略优化,找到用户愿意接受的价格点
- 付费功能设计,让用户感受到付费的价值
- 促销活动,刺激付费转化
- 订阅模式,建立稳定的收入来源
每一个环节,都有详细的数据监控和持续的优化迭代。这种运营能力是Talkie成功的重要因素,也是竞争对手难以复制的壁垒。
要素四:技术与产品的融合
Talkie的成功离不开Minimax强大的技术支撑。
- 多模态能力让AI角色可以"说话"、"表达表情",交互更加自然
- 低延迟推理让对话流畅无卡顿,用户体验更好
- 长期记忆能力让AI记住与用户的互动历史,关系更加真实
- 安全机制保护用户不受有害内容的侵害
这些技术能力是Talkie产品体验的基础。很多试图模仿Talkie的竞争对手,因为技术能力不足,只能停留在"功能相似、体验平庸"的阶段。
要素五:组织的专注
Talkie有独立的产品、运营、技术团队,专注于这一个产品的成功。
这种专注是很多公司做不到的。大公司往往资源分散,每个项目都只能获得有限的关注。创业公司则往往受到创始人精力的限制,难以同时照顾多条产品线。
Minimax的做法是给Talkie足够的自主权和资源,让团队能够全身心投入。这种组织设计是Talkie成功的重要保障。
光鲜的业绩数字背后,是巨大的压力和代价。
2025年,Minimax经历了创业以来最严峻的挑战时刻。
算力危机
2025年,AI芯片的供应问题再次恶化。
美国政府加强了对华芯片出口管制,英伟达最新的H系列芯片被全面禁售。虽然之前的A100和H100可以继续使用,但新增采购变得极其困难。
与此同时,国产替代芯片的性能和生态还不成熟,无法完全填补空缺。
这对Minimax的影响是直接的:
- 训练计划被迫调整,某些实验因算力不足而延期
- 推理服务的扩容受到限制,影响用户体验
- 算力成本进一步上升,侵蚀利润
团队不得不采取一系列应对措施:
- 加大效率优化力度,让每块芯片发挥更大价值
- 与多家云服务商合作,分散算力来源
- 探索国产芯片的应用,为未来做准备
- 调整产品规划,优先保障核心业务
这场算力危机让团队深刻认识到:自主可控的算力供应是长期竞争力的关键。
人才流失
DeepSeek的崛起和行业的激烈竞争,带来了人才市场的动荡。
2025年上半年,Minimax经历了几次重要的人才流失:
- 一位核心算法研究员被DeepSeek高薪挖走
- 一个资深工程师团队被字节跳动整体收编
- 两位产品经理接受了创业公司的联合创始人邀请
每一次人才流失都对团队士气造成冲击。更重要的是,核心人才的离开带走了宝贵的知识和经验,需要很长时间才能弥补。
闫俊杰对此有清醒的认识:
"人才流失是正常的,我们不可能留住每一个人。关键是两点:第一,确保核心团队稳定;第二,建立知识传承机制,避免关键能力随个人流失。"
为了应对人才危机,公司采取了多项措施:
- 重新评估核心人才的薪酬和激励,确保竞争力
- 加强内部沟通,让员工了解公司的战略和前景
- 改善工作环境和福利,提升员工满意度
- 加大人才招聘力度,补充新鲜血液
- 推进知识管理,减少单点依赖
资本压力
25亿美元的估值是一把双刃剑。
高估值意味着投资人的高期待。他们期望看到与估值相匹配的增长速度和商业化进展。如果达不到预期,后续融资将面临困难,估值可能被迫下调("down round")。
2025年,Minimax面临着这种压力:
- 部分投资人对商业化进度表达了担忧
- 有传言称某些投资人在寻求出售股份
- 后续融资的谈判进展缓慢,估值预期存在分歧
闫俊杰需要花费大量时间与投资人沟通,解释公司的战略和进展。这些时间本可以用于产品和技术的推进。
在一次投资人会议上,他这样阐述自己的观点:
"我们的目标不是短期内实现盈利,而是建立长期的竞争优势。Talkie已经证明了我们可以赚钱。现在的问题不是'能不能赚钱',而是'如何在赚钱的同时保持技术领先'。如果为了短期收入牺牲长期投入,我们会失去真正的护城河。"
这番话说服了大部分投资人,但也有人持保留意见。创始人与投资人之间的张力是永恒的主题。
战略质疑
在公司内部,也有一些质疑的声音。
质疑主要集中在两个方面:
质疑一:"技术优先"是否还对?
有人认为,公司在技术上投入过多,在商业化上投入不足。模型能力固然重要,但如果不能转化为收入,再强的技术也没有意义。
他们建议:减少基础研究的投入,把资源集中在已经验证的商业化方向上(比如Talkie),尽快实现盈利。
质疑二:产品线是否太分散?
有人认为,公司同时推进太多产品线,资源过于分散。不如砍掉一些不成功的项目,把资源集中在最有希望的方向上。
这两种质疑都有一定道理。在资源有限的情况下,每一笔投入都有机会成本。如果把资源集中在商业化最成功的方向上,短期内确实可以更快盈利。
但闫俊杰的判断是不同的:
"如果我们只看短期收入,最理性的选择是All in Talkie,放弃其他所有项目。但Talkie的成功建立在我们的技术能力之上。如果停止技术投入,两年后Talkie的竞争力也会下降。"
"我们需要的是平衡——在保持技术领先的同时推进商业化。这很难,但这是正确的方向。如果只是为了短期变现,我当初就不会选择创业。"
这种坚持需要勇气,也需要说服力。闫俊杰花了大量时间在内部沟通上,解释战略的逻辑,回应团队的疑虑,凝聚共识。
2025年是对闫俊杰领导力的极限考验。
面对技术冲击、人才流失、资本压力、内部质疑,他需要在多个战线上同时作战,保持清醒的判断和坚定的执行。
保持冷静的能力
在风暴中,领导者最重要的品质是冷静。
当DeepSeek的消息传来时,很多人陷入恐慌:我们是不是落后了?我们是不是选错了路?我们应该怎么办?
闫俊杰的反应却是有条不紊地分析:DeepSeek真正证明了什么?这对我们意味着什么?我们应该学习什么,应该坚持什么?
这种冷静不是无动于衷,而是在承认问题的同时保持理性思考的能力。
他在内部多次强调:
"恐慌没有用,自我怀疑没有用。我们需要的是准确地理解形势,然后做出正确的应对。"
做出艰难决定的魄力
危机时刻需要做出艰难的决定。
2025年上半年,闫俊杰做了几个困难但必要的决策:
- 砍掉某个投入大但前景不明的产品线:这意味着承认之前的判断失误,也意味着一些团队成员需要转岗或离开
- 调整组织架构:合并一些功能重叠的部门,提高效率,但也意味着一些管理岗位被取消
- 暂缓海外某地区的扩张计划:资源有限,需要更聚焦,但这让已经投入的团队成员感到失望
每一个决定都有人受到影响,都有人不满意。但作为创始人,他必须做出取舍。
闫俊杰的原则是:决策可以艰难,但过程必须透明。
每一个重大决策,他都会向团队解释背景、逻辑和考量。即使有人不同意结论,至少能理解为什么这样决定。这种透明度有助于维持信任。
激励团队的持续投入
在困难时刻,团队的士气容易低落。这时候需要领导者的激励。
闫俊杰的激励方式不是喊口号、画大饼,而是让团队看到真实的进步和希望。
他定期与团队分享公司的进展:
- Talkie的用户增长和收入数据,证明商业化是可行的
- 技术团队的突破性成果,证明我们在技术上仍然领先
- 用户的真实反馈和故事,证明我们的产品在帮助真实的人
这些真实的证据,比任何激励演讲都更有说服力。
他也坦诚面对困难:
- 我们确实面临挑战,这些挑战不会自动消失
- 但挑战是每一个成功公司都经历过的,我们也会度过
- 每一次危机都是淬炼,让我们变得更强
这种"坦诚+希望"的组合,帮助团队在困难时刻保持了信心和凝聚力。
自我反思的习惯
危机时刻,领导者最容易犯的错误是固执己见。
当外部环境剧变时,过去正确的判断可能不再适用。如果领导者不能反思和调整,就会带着团队走向错误的方向。
闫俊杰保持着自我反思的习惯:
- 定期回顾之前的决策,评估哪些是对的,哪些需要调整
- 主动征求团队的反对意见,避免"一言堂"
- 与外部顾问和行业专家交流,获取不同视角
- 阅读和学习,保持认知的更新
2025年,他对自己的一些假设进行了修正:
- 对开源模式的看法:之前认为开源模式难以商业化,DeepSeek的成功让他重新思考开源的战略价值
- 对训练效率的重视:之前认为规模是第一位的,现在更加重视效率优化
- 对组织效率的反思:公司增长过程中确实出现了一些大公司病,需要主动治理
这种自我反思和调整的能力,是领导者在不确定环境中保持正确方向的关键。
2025年末,经过一年的风风雨雨,闫俊杰对公司的战略进行了重新梳理。
核心判断的更新
判断一:模型能力正在商品化,应用层成为关键战场
DeepSeek和其他开源模型的崛起证明,基础模型能力正在快速扩散。虽然顶尖模型仍有差距,但差距在缩小。
这意味着:单纯的模型能力难以形成持久的竞争优势。真正的护城河在于"模型+产品+运营"的一体化能力。
Minimax应该继续保持技术领先,但更重要的是把技术转化为用户价值。
判断二:效率优化与规模扩张同等重要
之前的策略偏重规模——更大的模型、更多的参数、更强的能力。
DeepSeek的成功证明,效率优化可以带来巨大的成本优势。在算力受限的环境下,效率优化尤其重要。
未来的竞争不只是比谁的模型大,更是比谁的模型"性价比"高。
判断三:聚焦优于分散
2025年的"五连发"虽然展示了公司的技术储备,但也造成了资源分散。
未来应该更加聚焦:识别最有价值的方向,集中资源投入,而不是追求面面俱到。
战略调整的方向
基于这些判断,Minimax对2026年的战略进行了调整:
方向一:Talkie作为核心,海外市场作为重心
Talkie已经验证了商业模式,应该进一步加大投入。海外市场的空间更大、竞争相对较弱,应该成为增长的重心。
方向二:多模态保持差异化
多模态是Minimax的核心优势,应该继续保持领先。但投入应该更加聚焦在高价值场景,而不是追求全面覆盖。
方向三:效率驱动的技术策略
技术投入的重点从"规模扩张"转向"效率优化"。目标是在保持性能的同时大幅降低成本。
方向四:组织精简和效率提升
停止盲目扩张,甚至适当收缩。把资源集中在核心团队和核心项目上,提高人均产出。
方向五:开放合作的态度
在适当的条件下,不排除部分开源或技术合作。用更开放的心态参与行业生态。
-
外部冲击是检验战略韧性的终极测试。 DeepSeek的冲击让整个行业震动,但真正考验的是每家公司应对变化的能力。恐慌无用,理性分析和快速调整才是正道。
-
开源不是终结者,但确实改变了游戏规则。 模型能力正在商品化,应用层的竞争变得更加关键。"模型+产品+运营"的一体化能力是新的护城河。
-
效率与规模同等重要。 在算力受限的环境下,效率优化可以带来显著的竞争优势。"性价比"正在成为核心指标。
-
危机时刻的领导力体现在冷静、决断和激励。 保持冷静地分析问题,果断地做出决定,持续地激励团队——这是穿越风暴所需的领导力素质。
-
自我反思是领导者的必备习惯。 环境在变,之前正确的判断可能不再适用。能够反思和调整的领导者,才能带领团队持续向前。
-
聚焦优于分散。 资源有限时,与其追求面面俱到,不如集中力量在最有价值的方向上实现突破。
-
商业化的成功需要产品和运营的积累。 Talkie的成功不只是因为技术好,更是因为产品设计、用户洞察和精细化运营。这些能力同样是核心竞争力。
【本章完】
请输入"继续"以开始第九章:与资本、市场、竞争对手的博弈
创业公司与资本的关系,从来都是一场复杂的博弈。
资本是燃料,没有它,火箭无法升空。但资本也是枷锁,一旦接受,就必须按照某种节奏起舞。如何在获取资源的同时保持战略自主,是每一个创始人都要面对的核心命题。
闫俊杰从创业第一天起,就对这个命题有清醒的认识。
早期融资:在怀疑中起步
2021年末Minimax成立时,AI投资正处于低谷。
ChatGPT尚未问世,大语言模型还是小众话题。投资人普遍对"大模型创业"持怀疑态度:
- "OpenAI有微软撑腰,你们凭什么竞争?"
- "训练大模型要烧多少钱?你们烧得起吗?"
- "商业化路径在哪里?怎么赚钱?"
这些质疑不无道理。当时确实没有人能给出确定的答案。
闫俊杰的应对策略是坦诚+信念:
坦诚地承认不确定性——是的,我们不知道最终能不能成功,这是一个高风险的赌注。
但坚定地表达信念——大模型是未来,中国需要自己的大模型公司,我们有能力、有决心做这件事。
这种态度筛选出了一批真正理解长期价值的投资人。他们不是被短期回报吸引,而是被愿景打动。这种"价值观筛选"在后来证明是正确的——在困难时刻,这些投资人确实表现出了更多的耐心和支持。
早期融资的另一个原则是:不为估值牺牲条款。
有些投资人愿意给更高的估值,但要求更多的控制权:董事会席位、一票否决权、对赌协议……
闫俊杰拒绝了这些条款。他宁愿接受较低的估值,也要保持对公司的控制。
这个决定在当时看起来"亏了"——同样稀释一定比例的股权,拿到的钱更少。但长期来看是正确的:保持控制权让Minimax能够坚持自己的战略节奏,而不是被资本意志绑架。
A+轮:25亿美元独角兽的诞生
2023-2024年,随着ChatGPT引爆市场,AI投资迅速升温。Minimax的融资环境发生了戏剧性的变化。
之前追着投资人解释"大模型是什么",现在是投资人追着问"你们还接受投资吗"。
这种变化带来了机遇,也带来了风险。
机遇是显而易见的:可以用更高的估值融到更多的钱,为长期发展储备弹药。
风险则是隐蔽的:过高的估值会带来过高的期待,如果业绩达不到预期,后续融资将面临困难。
闫俊杰在这轮融资中保持了审慎:
- 没有追求最高的估值,而是选择了合理的估值区间
- 优先选择理解长期价值的投资人,而非只看短期回报的
- 保留了足够的股权空间,为未来融资和员工激励预留余地
- 拒绝了某些投资人的"对赌"要求
最终,Minimax完成A+轮融资,估值达到25亿美元,正式跻身"独角兽"行列。
这个估值在当时的市场环境下是合理的,但也意味着巨大的责任。投资人投入了真金白银,期待看到与估值相匹配的回报。如何平衡增长与可持续性,成为闫俊杰必须面对的新课题。
资本压力的真实面貌
25亿美元估值带来的压力,在2025年变得尤为明显。
投资人的期待体现在多个维度:
收入增长:Talkie的7000万美元收入虽然亮眼,但相对于25亿估值,市销率仍然很高。投资人希望看到收入继续高速增长,证明商业模式的可扩展性。
用户增长:用户规模是衡量ToC公司价值的核心指标。投资人密切关注月活、日活、留存率等数据,任何下滑都会引发担忧。
技术领先:投资人投资Minimax,很大程度上是相信其技术实力。如果在与竞争对手的比较中落后,投资逻辑就会动摇。
盈利路径:虽然不要求立刻盈利,但投资人希望看到清晰的盈利路径。"什么时候能盈亏平衡?"是每次董事会必问的问题。
这些期待本身是合理的,但同时满足所有期待几乎是不可能的。创始人必须在其中做出取舍。
闫俊杰的策略是:主动沟通,管理预期。
他定期与主要投资人进行深度沟通,分享公司的真实状况——不只是好消息,也包括挑战和困难。这种透明建立了信任。
他也清晰地表达自己的判断和优先级:
"我们的首要目标是保持技术领先和产品创新。短期收入很重要,但不应该以牺牲长期竞争力为代价。我相信,如果我们能成为最好的AI产品公司,商业回报自然会到来。"
这种沟通不能消除所有分歧,但至少让投资人理解了创始人的逻辑。即使不完全同意,他们也愿意给予一定的空间和时间。
拒绝"资本炒作"
2024-2025年,AI赛道不乏"资本炒作"的案例。
有些公司为了抬高估值,夸大技术能力、虚构用户数据、制造虚假繁荣。短期内估值飙升,但很快就会暴雷。
Minimax始终与这种做法保持距离。
闫俊杰在内部明确要求:
- 对外披露的数据必须真实准确,不得夸大
- 不发布未经验证的技术声明
- 不参与纯粹为了炒作估值的"资本游戏"
这种原则在短期内可能让公司显得"不够性感"。竞争对手的估值可能更高,媒体曝光可能更多。但长期来看,诚信是最重要的资产。
DeepSeek的案例提供了一个有趣的对照。这家公司背靠幻方量化,资金充裕,但始终保持低调。创始人梁文锋几乎不接受媒体采访,公司也很少做PR。当DeepSeek-R1发布时,业界才真正意识到他们走了多远。
这种"用实力说话"的风格与闫俊杰的理念不谋而合:
"真正的竞争力不是讲出来的,而是做出来的。如果我们的产品足够好,用户和投资人自然会看到。如果产品不够好,再多的PR也没用。"
资本之外,Minimax还需要在更广阔的市场中博弈。
国内监管:在红线内创新
中国的AI监管环境日趋复杂。
2023年起,一系列针对生成式AI的法规陆续出台:
- 算法备案:提供生成式AI服务的公司,必须向监管部门备案
- 内容安全:AI生成的内容必须符合法律法规,不得传播有害信息
- 数据合规:训练数据的获取和使用必须合法,尤其是涉及个人信息时
- 标识要求:AI生成的内容必须明确标识,避免误导用户
这些监管要求给AI公司带来了显著的合规成本。
Minimax的应对策略是:积极合规,在红线内创新。
具体措施包括:
- 组建专门的合规团队,跟踪政策变化,确保公司行为符合要求
- 在产品设计中内置安全机制,过滤有害内容
- 建立数据治理体系,确保训练数据的合法性
- 主动与监管部门沟通,了解政策意图,反馈行业情况
这种积极合规的态度有时候会被视为"保守"。有些竞争对手愿意冒更大的风险,推出更"激进"的功能。但闫俊杰认为,这种激进是短视的:
"监管红线是客观存在的。踩线可能带来短期的竞争优势,但一旦被查处,代价会非常大。我们宁可走得慢一点,也不愿意走到不该去的地方。"
事实也证明了这一点。2024年,有几家AI公司因为内容安全问题被约谈或处罚,产品被迫下架整改。Minimax因为一贯的合规态度,避免了这些麻烦。
海外突破:全球化的机遇与挑战
与国内市场的复杂环境相比,海外市场展现出不同的特点。
机遇:
- 用户规模更大:全球互联网用户超过50亿,远大于中国市场
- 付费意愿更强:欧美用户习惯为数字内容付费,ARPU更高
- 监管相对宽松:很多国家对AI应用的限制较少,产品迭代更快
- 竞争格局分散:虽然有OpenAI等巨头,但在细分领域仍有机会
挑战:
- 文化差异:不同国家的用户偏好差异大,产品需要本地化
- 运营难度:需要在多个时区、多种语言环境下运营
- 地缘政治:中国公司出海面临特殊的政治风险
- 支付和合规:各国支付渠道和合规要求不同
Talkie的成功证明了Minimax的全球化能力。这款产品在157个国家和地区运营,团队积累了丰富的出海经验。
几个关键的成功要素:
本地化做到位:不只是语言翻译,而是深入理解当地用户的需求和偏好。Talkie针对不同市场有不同的内容和角色设计。
运营精细化:建立了多时区的客服和运营团队,确保用户问题能够及时响应。
合规先行:进入每个市场之前,先研究当地的法规要求,确保产品合规。
渐进式扩张:不是一下子进入所有市场,而是先在核心市场(如美国、英国)站稳脚跟,再逐步扩展。
用户心智:从"工具"到"陪伴"
在用户层面,Minimax面临的核心挑战是:如何在用户心中建立独特的位置?
AI产品很容易陷入同质化竞争。ChatGPT、Claude、Gemini、文心一言……从用户角度看,它们做的事情差不多,很难区分。
Minimax的差异化策略是:从"工具"到"陪伴"的产品哲学。
大多数AI产品定位是"工具"——帮用户完成任务、提高效率、解决问题。这个定位没有错,但竞争激烈,同质化严重。
Minimax选择了另一条路:强调AI的"陪伴"属性。
这个定位体现在多个产品中:
- Talkie:核心卖点是AI社交和情感陪伴,而非效率提升
- 星野:强调AI角色的人格魅力,让用户产生情感连接
- 海螺AI:虽然有工具属性,但交互方式更加自然、亲切
这种定位切中了一个被忽视的用户需求:人们不只需要高效的工具,也需要温暖的陪伴。
现代社会中,孤独感日益普遍。很多人尤其是年轻人,在现实中缺乏深度的社交连接。AI恰好可以填补这个空白——它永远在线、永远有耐心、不会评判你。
当然,"陪伴"定位也有其局限性。它可能不如"效率工具"那样容易变现,用户付费意愿可能不如企业客户。但Talkie的收入表现证明了这个定位的商业可行性。
在"6+2"的市场格局中,Minimax需要与多个强劲对手竞争。
智谱AI:学术派的B端深耕
智谱AI脱胎于清华大学,拥有深厚的学术背景。创始团队与学术界保持紧密联系,在科研和教育领域有天然优势。
优势:
- 学术声誉带来的品牌效应
- 在教育、科研领域的深度布局
- 与政府和国企的良好关系
- ChatGLM系列模型的技术实力
策略:
智谱AI的策略是B端深耕——与大型企业和机构合作,提供定制化的AI解决方案。
这与Minimax的ToC优先策略形成互补。两家公司在很多场景下不是直接竞争对手。
对Minimax的启示:
智谱AI的成功证明了B端市场的价值。虽然Minimax以ToC为主,但也不应该完全放弃B端机会。尤其是在那些与C端产品有协同的B端场景,可以考虑布局。
月之暗面(Kimi):长文本的突破
月之暗面是另一家进入"6+2"格局的创业公司,其产品Kimi以超长文本能力著称。
优势:
- 20万字长文本处理能力,在特定场景有突出优势
- 创始人杨植麟的技术背景和行业影响力
- 在学生和知识工作者群体中有较高知名度
策略:
月之暗面的策略是单点突破——不追求全面能力,而是在长文本这个点上做到极致。
这种策略有其道理:在资源有限的情况下,聚焦比分散更容易成功。
对Minimax的启示:
月之暗面的长文本能力确实形成了差异化。Minimax需要思考:在自己的优势领域(如多模态),是否也做到了足够的深度?单点突破和全面布局之间如何平衡?
DeepSeek:开源颠覆者
DeepSeek已经在第八章详细讨论过。这里只补充几点竞争分析。
优势:
- 充裕的资金支持(背靠幻方量化)
- 顶尖的技术团队
- 开源策略带来的生态影响力
- 成本效率的显著领先
策略:
DeepSeek的策略是开源颠覆——通过免费提供顶级模型,打破行业的既有格局。
这种策略对整个行业都是挑战。当模型能力可以免费获取时,竞争的焦点就转移到了应用层。
对Minimax的启示:
DeepSeek的成功证明了两点:一是训练效率还有巨大的优化空间,Minimax需要加大这方面的投入;二是模型本身的价值在下降,"模型+产品+运营"的一体化能力才是护城河。
巨头对比:字节、阿里、百度、腾讯、华为
与创业公司相比,巨头的竞争逻辑完全不同。
字节跳动(豆包):
- 优势:流量分发能力、资金实力、全球化经验
- 策略:低价抢市场,用C端流量导入
- 威胁:价格战可能挤压创业公司的生存空间
阿里巴巴(通义千问):
- 优势:电商生态、云计算能力、企业客户基础
- 策略:深耕电商和云计算场景,ToB为主
- 威胁:在企业市场与Minimax形成竞争
百度(文心一言):
- 优势:搜索入口、知识图谱、早期布局
- 策略:全面布局,搜索+对话+应用
- 威胁:在C端市场有一定用户基础
腾讯(混元):
- 优势:社交生态、微信入口、ToC经验
- 策略:整合微信生态,社交+AI
- 威胁:如果微信深度整合AI,对C端产品形成巨大压力
华为(盘古):
- 优势:硬件能力、政企关系、端侧AI
- 策略:政企市场、端云协同
- 威胁:与Minimax的直接竞争较少
差异化生存
面对这些强劲对手,Minimax的生存之道是什么?
闫俊杰的答案是:差异化。
不与巨头在其优势领域正面竞争,而是找到自己的独特价值:
- 多模态:在语音、视觉等模态上建立领先优势,这是很多竞争对手尚未深入的领域
- 全球化:通过Talkie等产品在海外市场建立位置,这是国内巨头相对薄弱的环节
- 情感陪伴:定位于"陪伴"而非"工具",切入被忽视的用户需求
- 垂直深耕:在特定场景(如社交、创作)做到极致,而非追求通用能力
这种差异化策略的核心逻辑是:不做巨头的小号,做自己的独特版本。
理解一个创始人的竞争观,有助于理解公司的战略选择。
"期待与王者一决高下"
闫俊杰在访谈中说过:"我骨子里是一个期待跟王者一决高下的人。"
这句话揭示了他的竞争心态:不回避竞争,而是拥抱竞争。
很多创业者面对巨头时,本能反应是"躲"——找一个巨头看不上的细分市场,悄悄发展。这种策略有其道理,但也有局限:细分市场的天花板可能很低,一旦成功又会吸引巨头入场。
闫俊杰的心态不同。他并不试图回避与巨头的竞争,而是正面迎接。当然,这不意味着鲁莽地硬碰硬,而是在差异化的基础上争取胜利。
这种心态的来源可以追溯到他的成长经历:
- 县城少年一路考进名校,习惯了在竞争中证明自己
- 商汤七年见证了一家创业公司如何与巨头竞争并成长
- 骨子里的不服输和自信,驱动着不断挑战更高目标
"中国AI企业可以引领世界巨头"
在同一次访谈中,闫俊杰还说过另一句话:"中国AI企业可以引领世界巨头。"
这个判断超越了"追赶"的思维,直接定位于"引领"。
这种自信从何而来?
第一,中国市场的独特优势:
- 庞大的用户基数,提供了丰富的数据和反馈
- 多样的应用场景,可以验证技术的实际价值
- 激烈的竞争环境,逼迫公司不断进化
第二,中国人才的崛起:
- 越来越多的顶尖AI人才出现在中国
- DeepSeek的成功证明了中国团队可以在前沿领域取得突破
- 人才回流趋势正在加速
第三,不同的竞争路径:
- 不必复制硅谷的模式,可以探索自己的道路
- 开源与闭源并行、ToB与ToC结合、技术与产品融合……这些都是中国AI公司的独特探索
当然,"引领"不是口号,而是需要实力支撑。Minimax还有很长的路要走。但这种志向决定了公司的行动方向:不满足于追随,而是志在引领。
竞争中的学习与尊重
尽管强调竞争,闫俊杰对竞争对手始终保持尊重。
他多次在内部强调:
"竞争对手不是敌人,而是老师。他们的成功值得学习,他们的失败值得警醒。"
DeepSeek的成功就是一个例子。当R1发布引发震动时,Minimax没有选择贬低或否认,而是认真研究其技术路线,寻找可以学习的地方。
这种心态让团队保持了开放和进取:
- 不因为自己的成绩而骄傲自满
- 不因为别人的成功而嫉妒抵触
- 专注于自己的进步,同时向一切优秀者学习
差异化选择:不是"更好",而是"不同"
在竞争策略上,闫俊杰有一个核心原则:不是做"更好的模仿者",而是做"不同的创新者"。
如果只是追求在OpenAI的路线上做得更好,Minimax永远处于追赶位置。无论多努力,资源和积累的差距短期内难以弥补。
但如果选择一条不同的道路,情况就不一样了:
- OpenAI专注于通用大模型,Minimax可以强调多模态和产品化
- ChatGPT是效率工具,Talkie是情感陪伴
- 硅谷公司服务全球英语用户,Minimax深耕多语言本地化
这种差异化不是回避竞争,而是在竞争中找到自己的生态位。
自然界的启示是:物种的生存不在于谁最强大,而在于谁最适应自己的生态位。狮子在草原称王,但鱼在水中同样是王者。关键是找到属于自己的战场。
与资本、市场、竞争对手的博弈,归根结底是一门艺术。
原则一:保持战略定力,不被短期波动干扰
市场上每天都有新闻:竞争对手融资了、某公司发布新产品了、某个指标下滑了……如果被这些短期波动牵着走,就会失去方向。
闫俊杰的做法是:设定长期目标,用长期目标检验短期行动。
每一个决策,都先问:这对我们的长期目标有帮助吗?如果答案是否定的,即使短期看起来诱人,也要拒绝。
原则二:坦诚沟通,管理预期
无论是投资人、合作伙伴还是员工,关系的基础都是信任。而信任的基础是坦诚。
与其粉饰太平,不如实话实说。短期内可能引发担忧,但长期会建立牢固的信任。
原则三:在竞争中保持学习姿态
竞争对手不是敌人,而是镜子。从他们的成功中学习,从他们的失败中吸取教训。
保持谦逊和开放,才能持续进步。
原则四:差异化是生存之道
不在红海中硬拼,而是开辟属于自己的蓝海。
差异化不是退缩,而是更高级的竞争策略。找到自己的独特价值,才能在竞争中立于不败之地。
原则五:速度和耐心的平衡
创业需要速度——市场不等人,机会稍纵即逝。
但创业也需要耐心——真正的壁垒需要时间积累,短期的胜利不等于长期的成功。
如何平衡?答案是:在战术上快,在战略上慢。
战术层面,快速试错、快速迭代、快速响应市场变化。
战略层面,保持定力、坚持长期主义、不被短期诱惑带偏。
-
资本是双刃剑,保持控制权是关键。 融资不只是拿钱,更是选择同路人。宁可估值低一点,也要保持战略自主。
-
监管是约束也是机会。 积极合规的公司会在长期获得优势。在红线内创新是正道。
-
全球化需要本地化。 出海不是把国内产品翻译一下,而是真正理解当地用户的需求和文化。
-
差异化是创业公司的生存之道。 不做巨头的小号,找到自己的独特价值。
-
竞争对手是老师。 从别人的成功和失败中学习,保持谦逊和开放。
-
"引领"而非"追随"的志向。 志向决定行动。敢于设定高目标的公司,更有可能实现突破。
-
坦诚建立信任。 无论对投资人、员工还是合作伙伴,坦诚沟通是长期关系的基础。
-
速度与耐心的平衡。 战术上快,战略上慢。这是在不确定环境中生存的艺术。
【本章完】
请输入"继续"以开始第十章:组织文化与领导力演化
如果把公司比作一台电脑,战略是应用程序,资源是硬件,那么文化就是操作系统。
操作系统决定了硬件如何运转,应用程序如何执行。一个优秀的操作系统可以让普通硬件发挥超常性能,而一个糟糕的操作系统会让顶级硬件形同废铁。
公司文化同理。
两家公司可能有相似的战略、相近的资源,但因为文化不同,最终走向完全不同的命运。文化决定了:
- 员工如何做决策
- 团队如何协作
- 冲突如何解决
- 创新如何发生
- 失败如何被对待
这些"软性"因素往往比"硬性"的战略和资源更重要。战略可以调整,资源可以补充,但文化一旦形成就很难改变。
闫俊杰从创业第一天起就意识到这一点。他把塑造文化视为创始人最重要的职责之一。
"技术可以迭代,产品可以优化,但文化是公司的DNA。DNA出了问题,什么都会出问题。"
Minimax的文化基因在创业早期就被植入,并在此后的发展中不断强化。
基因一:技术信仰
Minimax的第一个文化基因是对技术的信仰。
这不是一句空洞的口号,而是渗透到公司每一个角落的真实信念:
- 招聘标准:技术能力是第一位的,其他条件都可以妥协,技术不行不能入职
- 资源分配:研发投入始终占据最大比例,即使在资金紧张时也不妥协
- 决策依据:技术可行性是重要的决策因素,不做技术上做不到的承诺
- 晋升通道:技术专家有清晰的职业发展路径,不必走管理岗才能升职
这种技术信仰来自创始团队的背景。闫俊杰本人是技术出身,核心团队大多是技术背景,他们发自内心地相信技术的力量。
但技术信仰不等于"技术傲慢"。Minimax的技术文化有一个重要的特点:技术服务于用户价值,而非技术本身。
团队不会为了炫技而炫技,不会为了追求论文发表而忽视实际应用。每一项技术投入都要回答一个问题:这对用户有什么价值?
这种"务实的技术信仰"区别于很多技术驱动公司的"象牙塔心态"。
基因二:用户至上
Minimax的第二个文化基因是用户至上。
这听起来是老生常谈,几乎每家公司都会说"以用户为中心"。但真正做到的公司并不多。
Minimax是怎么做的?
用户反馈的直通车:
公司建立了多种渠道收集用户反馈——产品内反馈入口、社交媒体监控、用户访谈、数据分析……这些反馈不是存档了事,而是每天都有人整理、分析、跟进。
"用户故事会":
每周的全员会议上,会分享真实用户的故事——他们是谁,为什么使用产品,产品给他们带来了什么。这些故事让团队记住:自己做的不只是代码和功能,而是在影响真实的人。
快速响应机制:
用户反馈的问题,会被快速分类和响应。严重问题24小时内必须有进展,普通问题一周内必须回复。这种响应速度让用户感受到被重视。
产品经理的实地体验:
产品经理被要求定期"潜伏"在用户社区中,像普通用户一样使用产品,感受真实的体验。不是看数据报告,而是亲身体验。
闫俊杰自己也保持着与用户的直接联系。他会不定期地阅读用户反馈,甚至亲自回复一些用户的问题。
"用户是我们存在的理由。如果我们不了解用户,我们就是在闭门造车。"
基因三:长期主义
第三个文化基因是长期主义。
这个基因的形成与闫俊杰的个人经历密切相关。他在商汤见过太多为了短期业绩而牺牲长期发展的案例,深知短期主义的危害。
长期主义在Minimax体现为几个具体原则:
不追热点:
市场上经常出现各种"风口"——元宇宙、Web3、某个爆火的应用模式……很多公司会跟风追逐,希望蹭上热度。
Minimax的态度是:除非与公司的长期战略一致,否则不追热点。热点来得快去得也快,追热点只会让公司失去焦点。
不做一次性的事:
每一项工作,都要考虑是否可以复用、是否可以积累。如果只是为了应付眼前的需求,做完就扔,那就是在浪费资源。
比如,与其为每个客户做定制开发,不如把需求抽象化,开发可复用的模块。短期内可能更慢,但长期会更高效。
投资于人:
员工培养是长期投资。Minimax愿意花时间和资源培养员工,而不是只想着榨取短期价值。
这种投资包括:完善的入职培训、持续的技能提升机会、清晰的职业发展路径、有竞争力的薪酬和激励。
容忍失败:
长期主义意味着接受短期失败。创新必然伴随失败,如果对失败零容忍,就没有人敢尝试新东西。
Minimax的原则是:鼓励有意义的尝试,即使失败也不惩罚。关键是从失败中学到东西,不要犯同样的错误。
基因四:坦诚直接
第四个文化基因是坦诚直接的沟通方式。
很多公司存在"报喜不报忧"的文化——下级不敢向上级汇报问题,同事之间不敢直接提出批评。这种文化会导致问题被掩盖,直到无法收拾时才爆发。
Minimax从一开始就培养坦诚文化:
鼓励直言:
在会议上,任何人都可以直接表达不同意见,包括对创始人的决策提出质疑。这种直言不会被视为"不尊重",而是被视为"负责任"。
快速反馈:
有问题及时说,不要积累。小问题及时解决,就不会变成大问题。
对事不对人:
批评是针对事情本身,而不是针对人。讨论问题时可以激烈争论,但会议结束后不影响人际关系。
领导以身作则:
闫俊杰自己会主动承认错误,分享自己的失误和反思。这种示范让团队知道:承认错误不丢人,逃避问题才丢人。
坦诚文化的建立不是一蹴而就的,需要持续的强化和维护。每当有人因为坦诚发言而受到打压,文化就会倒退一步。只有让坦诚得到正向激励,文化才能真正扎根。
基因五:高效务实
第五个文化基因是高效务实的工作风格。
Minimax反对形式主义和官僚作风:
会议精简:
能不开会就不开会,必须开的会控制时长。会议必须有明确的目的和产出,不开"为了开会而开会"的会。
流程轻量:
流程是为了提高效率,而不是为了控制。如果某个流程增加了官僚成本却没有带来价值,就取消它。
结果导向:
评估工作不看加班时长,不看会议出席率,只看实际产出。聪明高效地完成工作比苦熬时间更值得鼓励。
快速决策:
能今天决定的事不拖到明天。不追求完美的信息才决策,而是在有足够信息时快速行动。
减少汇报层级:
信息传递层级越多,失真越严重,速度越慢。Minimax尽可能减少汇报层级,让信息高效流动。
这种高效务实的风格与创业公司的本质需求一致:资源有限,必须把每一分钱、每一分钟都用在刀刃上。
文化不是静止的,而是随着公司发展不断演进。
Minimax从十几个人成长到数百人,文化也经历了多个阶段的变化。
早期(2021-2022):技术极客文化
创业之初,团队以技术极客为主。文化特点是:
- 对技术的狂热追求
- "用代码说话"的沟通方式
- 扁平化到几乎没有层级
- 高度自组织,每个人自主安排工作
- 工作与生活界限模糊,经常熬夜攻关
这种文化在早期非常有效。小团队、高信任、共同目标,让大家可以用最直接的方式协作。
但这种文化也有局限性:
- 对非技术角色不够友好
- 缺乏正式的流程和规范
- 依赖个人英雄,而非系统能力
- 长期熬夜不可持续
成长期(2023-2024):产品导向文化
随着业务发展,团队扩大,文化开始转型。
产品导向文化的特点是:
- 从"技术驱动"转向"用户驱动"
- 引入更多产品、运营、市场背景的人才
- 建立必要的流程和规范
- 强调跨部门协作
- 关注用户反馈和市场表现
这个阶段的挑战是:如何在规模化的同时保持创新活力?
很多公司在成长过程中会逐渐变得官僚化:流程越来越多,会议越来越长,决策越来越慢。原本的创业精神被稀释,变成一家"正常"但"平庸"的公司。
Minimax的应对策略是:在制度化的同时保留灵活性。
具体做法包括:
- 建立必要的流程,但流程保持最小化
- 保留"快速通道",对紧急重要的事项可以突破常规流程
- 鼓励"内部创业",给小团队足够的自主权
- 定期清理不必要的规章制度
成熟期(2025-):长期主义文化
进入2025年,Minimax的文化进入新阶段。
这个阶段的核心是:将长期主义从口号变成日常实践。
具体表现包括:
- 更加强调持续创新,而非短期变现
- 投入更多资源于基础研究和人才培养
- 对失败有更大的容忍度,鼓励有意义的尝试
- 关注可持续发展,包括员工福祉和工作生活平衡
- 加强知识管理和能力传承,减少对个人的依赖
这个阶段的挑战是:如何在保持长期视野的同时回应短期压力?
投资人、市场、竞争对手都在施加短期压力。如何在这些压力下坚持长期主义,需要领导力的持续引导和文化的持续强化。
创始人的领导力对公司文化有决定性影响。闫俊杰如何定义和实践自己的领导力?
从"技术最优"到"综合最优"
作为技术背景出身的创始人,闫俊杰最初的决策思维是"技术最优"——什么技术方案最先进、最优雅,就选什么。
但随着公司发展,他意识到:技术最优不等于综合最优。
一个决策需要综合考虑多个因素:
- 技术可行性
- 商业价值
- 用户体验
- 团队能力
- 资源约束
- 时间窗口
- 风险控制
最优雅的技术方案可能开发时间太长,可能超出团队能力,可能市场已经不需要了。
闫俊杰学会了在这些因素之间寻找平衡:
"最好的决策不是某个维度的最优,而是综合考虑后的最优。有时候需要牺牲技术优雅性来换取开发速度,有时候需要接受商业上的妥协来保持技术领先。关键是清楚每个决策的取舍是什么。"
风险观的演进
对风险的看法也随着公司发展而改变。
早期:激进冒险
创业初期,闫俊杰的风险观是激进的:
- 选择MoE这样的前沿架构,即使工程风险很高
- 同时推进多条产品线,即使资源捉襟见肘
- 进入海外市场,即使团队没有国际化经验
这种激进是必要的。创业公司本来就是高风险赌注,如果过于保守,就会错失机会。
中期:选择性冒险
随着公司规模扩大,闫俊杰的风险观变得更加精细:
- 在核心技术上继续冒险,这是公司的生命线
- 在成熟业务上控制风险,确保现金流稳定
- 新业务采用"小步快跑"策略,验证可行再放大投入
当前:系统性风险管理
进入成熟期后,风险管理变得更加系统:
- 建立风险识别和预警机制
- 对不同类型的风险(技术、市场、财务、合规)有不同的应对策略
- 关注"尾部风险"——概率低但影响大的事件
- 在组织层面培养风险意识,不只是创始人一个人操心
时间观的变化
创始人的时间分配反映了领导力的重点。闫俊杰的时间分配经历了几个阶段的变化:
早期:全身投入执行
创业初期,闫俊杰几乎把全部时间用于具体执行:写代码、调模型、做产品决策、见投资人……事无巨细,亲力亲为。
这在早期是必要的——团队小,每个人都要顶几个人用。
中期:逐渐转向管理
随着团队扩大,他的时间开始更多用于管理:招聘、开会、协调、决策……
这是一个艰难的转变。对于技术出身的创始人来说,"管人"远不如"写代码"有成就感。但这是必须的——如果创始人不放手执行细节,团队就无法成长。
当前:聚焦战略和文化
进入成熟期后,他的时间更多用于:
- 战略思考:长期方向在哪里?如何应对竞争和变化?
- 文化塑造:公司应该是什么样子?如何让正确的价值观落地?
- 关键人才:核心团队的组建、激励和保留
- 重大决策:只参与那些真正需要创始人拍板的决策
- 外部关系:投资人、合作伙伴、行业生态
这种时间分配让他能够在更高的层次上发挥作用,而不是陷在日常事务中。
自我约束的机制
权力带来腐蚀的风险。创始人如何避免成为"昏君"?
闫俊杰有几个自我约束的机制:
机制一:建立反馈渠道
主动征求团队的反馈,包括对自己决策的批评。
这不容易——当你是老板时,很少有人敢直接说你不对。所以需要刻意建立渠道:
- 匿名反馈工具,让员工可以放心表达
- 定期的"逆向述职",让团队评价领导
- 与信任的核心成员建立坦诚的沟通关系
机制二:保持学习状态
持续阅读、学习、与外部人士交流。
避免陷入"信息茧房"——只听到自己想听的声音。
外部视角可以提供不同的观点,帮助识别自己的盲区。
机制三:授权与放手
刻意地把决策权下放,即使自己可能做得更好。
培养团队的决策能力比自己做出完美决策更重要。
接受团队会犯错——犯错是学习的代价。
机制四:承认不知道
不懂装懂是领导者最大的陷阱。
闫俊杰愿意承认自己不知道的事情,并向更专业的人请教。这种谦逊反而增加了团队的信任。
机制五:定期反思
养成定期反思的习惯:
- 每周回顾:这周做了什么决策?效果如何?
- 每月复盘:哪些事情做对了?哪些需要调整?
- 每年总结:这一年的成长在哪里?盲区在哪里?
这种反思帮助保持自我觉察,避免陷入惯性思维。
Minimax的管理风格有一个显著特点:数据驱动。
作为AI公司,团队对"用数据说话"有天然的亲和力。这种思维被延伸到组织管理中。
数据驱动的绩效评估
传统的绩效评估往往主观性很强——领导对谁印象好,谁就评分高。这种评估容易导致政治化和不公平。
Minimax的做法是尽可能用数据说话:
- 为每个岗位定义清晰的、可量化的绩效指标
- 定期追踪这些指标的完成情况
- 绩效评估时,数据是最重要的参考依据
- 当然,也考虑数据无法衡量的因素,但要明确说明
这种方法减少了主观偏见,让评估更加公平透明。
人才选择的"整体输出"标准
招聘时,Minimax有一个独特的标准:选择能提升团队整体输出的人,而非个人能力最强的人。
这意味着:
- 不只看个人技能,更看协作能力
- 不只看履历光鲜,更看文化契合
- 不只看面试表现,更看实际项目中的协作情况
有时候,一个"A级"选手可能降低团队整体产出——他可能太ego、不愿意配合、占用过多资源。这种人即使个人能力再强,也不是好选择。
反之,一个"B+级"选手如果能让周围的人都变得更好,那就是极好的选择。
这种"乘数效应"的思维改变了招聘的视角:不是在凑一群明星,而是在组建一个有化学反应的团队。
轻量化组织的坚持
随着公司规模扩大,组织臃肿的风险始终存在。
Minimax的应对是:刻意保持轻量化。
具体做法包括:
- 控制管理层级:尽可能保持扁平,不超过三到四个层级
- 控制会议数量:每增加一个固定会议,必须取消一个现有会议
- 控制流程复杂度:定期审视现有流程,删除不必要的步骤
- 控制团队规模:宁可少招一个人,也不养冗员
这种轻量化在资源充裕时尤其难以坚持——"反正有钱,多招几个人怎么了?"但正是这种时候最需要自律。
闫俊杰在内部强调:
"组织的复杂度是隐形的成本。你看不到它,但它每天都在消耗资源、降低效率。我们必须像对待技术债务一样对待组织债务——定期清理,不让它积累。"
知识管理与能力传承
创业公司经常面临一个问题:关键知识存在于个人的脑子里,一旦这个人离开,知识就丢失了。
Minimax的应对是建立系统的知识管理机制:
- 文档化:重要的决策、技术方案、项目经验都要写成文档
- 知识库:建立公司内部的知识库,方便搜索和检索
- 分享机制:定期的技术分享、经验交流会议
- 交叉培训:关键岗位有backup人员,避免单点依赖
- 离职交接:规范的离职交接流程,确保知识不会随人走
这些机制让组织的能力不再依赖于特定个人,而是沉淀在系统中。
在激烈的人才竞争中,文化本身可以成为护城河。
吸引合适的人
Minimax的文化吸引的是特定类型的人才:
- 真正热爱技术、想做有意义事情的人
- 喜欢坦诚直接、不喜欢办公室政治的人
- 看重长期成长、不只看短期待遇的人
- 愿意承担风险、不甘于平庸的人
这些人在大公司可能很难找到归属感。Minimax提供了一个让他们如鱼得水的环境。
筛选不合适的人
同样的文化也会筛选掉不合适的人:
- 只想混日子拿高薪的人
- 喜欢搞政治、拉帮结派的人
- 无法接受直接批评的人
- 只看短期利益的人
这种"自我筛选"让团队保持了较高的一致性。
留住核心人才
在人才流动频繁的行业,如何留住核心人才是永恒的挑战。
Minimax的留人策略不只是高薪高期权,更是:
- 有意义的工作:让人才感受到自己在做真正重要的事情
- 成长空间:持续的学习和发展机会
- 尊重和信任:被当作成年人对待,有足够的自主权
- 良好的团队氛围:与优秀的同事共事的乐趣
- 长期回报:期权和股权让长期付出有长期回报
这些因素加在一起,形成了单纯靠加薪无法复制的吸引力。
领导力不是一成不变的,而是需要持续修炼。
从"做事"到"做人"
早期的领导力更多是"做事"——解决问题、推进项目、达成目标。
成熟期的领导力更多是"做人"——激励人、培养人、留住人。
这个转变对技术背景的创始人尤其困难。"做事"是可以量化的、可以优化的、可以控制的。"做人"则充满模糊性和不确定性。
闫俊杰的方法是:像对待技术问题一样对待领导力问题。
观察、实验、反馈、迭代——这套方法论不只适用于产品开发,也适用于领导力提升。
从"正确"到"有效"
年轻时的领导力追求"正确"——做正确的决策、坚持正确的原则。
成熟后的领导力追求"有效"——让团队真正理解和执行,让目标真正实现。
一个决策可能是"正确"的,但如果团队不理解、不接受,执行得一塌糊涂,那就是无效的。
有效的领导力不只是做出正确决策,还包括:
- 清晰地传达决策的逻辑
- 耐心地回应团队的疑虑
- 灵活地调整执行方式
- 持续地跟进和反馈
从"个人"到"系统"
最终的领导力升级是从"个人依赖"到"系统运转"。
早期公司的成功高度依赖创始人个人——他的判断力、他的人脉、他的激励能力。
成熟公司的成功应该依赖于系统——流程、文化、制度、梯队……即使创始人不在,公司也能正常运转。
闫俊杰在这方面的努力包括:
- 培养核心管理团队,分担领导责任
- 建立制度化的决策流程,减少对个人判断的依赖
- 强化文化建设,让价值观内化于团队
- 推进知识管理,让能力沉淀在组织中
这是一个漫长的过程,也是每个创始人必须面对的修炼。
-
文化是公司的隐形操作系统。 战略可以调整,资源可以补充,但文化一旦形成就很难改变。创始人从第一天起就应该有意识地塑造文化。
-
技术信仰+用户至上是Minimax文化的核心。 相信技术的力量,但技术必须服务于用户价值。这种"务实的技术信仰"是区别于其他技术公司的关键。
-
长期主义需要持续的强化。 短期压力无处不在,只有持续强调和实践,长期主义才能真正落地。
-
坦诚文化需要领导以身作则。 如果领导不敢承认错误、不愿接受批评,坦诚文化就只是空话。
-
轻量化组织需要刻意维护。 组织臃肿的趋势是自然的,保持轻量化需要持续的自律和清理。
-
领导力是持续修炼的过程。 从"做事"到"做人",从"正确"到"有效",从"个人"到"系统"——领导力需要随着公司发展不断升级。
-
数据驱动不只适用于产品,也适用于管理。 用数据说话减少主观偏见,让管理更加公平和高效。
-
文化是护城河。 优秀的文化可以吸引合适的人才、筛选不合适的人才、留住核心人才。这是单纯靠薪酬无法复制的竞争力。
【第三编完】
请输入"继续"以开始第四编第十一章:认知结构的升级迭代
在创业的长跑中,最终决定胜负的不是资金、不是技术、甚至不是团队,而是创始人的认知能力。
资金可以融,技术可以招人来做,团队可以慢慢搭建。但创始人的认知如果跟不上公司发展的速度,一切都会崩塌。
认知决定了:
- 你能看到什么机会
- 你会做出什么决策
- 你如何理解竞争格局
- 你怎样领导一个组织
- 你面对困难时如何反应
同样一个市场变化,认知不同的人会看到完全不同的东西。有人看到威胁,有人看到机会;有人恐慌,有人兴奋;有人收缩防守,有人大胆进攻。
闫俊杰的创业历程,也是一部认知不断升级的历史。从商汤的技术专家,到Minimax的创始人,他的认知结构经历了多次根本性的跃迁。
理解这些跃迁,对于任何希望成长的创业者都有借鉴价值。
第一重跃迁:从"技术性能"到"用户价值"
在学术界和技术公司,评价一个模型好不好的标准很清晰:跑分。
在各种benchmark上刷出更高的分数,发表更多的论文,获得学术共同体的认可——这是技术人员根深蒂固的成功标准。
闫俊杰最初也是这样思考的。他的博士研究、商汤的工作,都是在这个框架下进行的。
但创业之后,他逐渐意识到一个残酷的事实:跑分高不等于产品好,论文多不等于用户满意。
一个在ImageNet上达到SOTA的模型,放到真实场景中可能完全不可用。一个在学术论文中效果惊艳的算法,部署到手机上可能慢得无法忍受。
更重要的是:用户不关心你的技术指标,只关心产品能否解决他们的问题。
用户不会问:"你的模型有多少参数?在哪个benchmark上排名第几?"
用户只会问:"这个东西好用吗?能帮我做什么?"
这个认知转变听起来简单,实践起来却非常困难。
对于技术出身的创始人来说,放弃"技术性能"的评价标准就像放弃母语一样痛苦。你必须学会一种全新的语言——用户语言。
闫俊杰的转变体现在一个具体指标的选择上:错误率。
"当前大模型的错误率大概在20-30%左右。这意味着每三到五次使用,就可能有一次出错。我们的目标是把错误率降低一个数量级。"
这个指标的选择本身就是认知跃迁的体现:
- 不是追求"论文上的SOTA分数",而是关注"用户体验中的错误频率"
- 不是比谁的模型更大更强,而是比谁的产品更可靠更可用
- 不是面向学术共同体,而是面向真实用户
第二重跃迁:从"技术价值"到"商业价值"
技术人员往往有一个隐含假设:只要技术足够好,商业价值自然会到来。
这个假设在某些情况下是对的,但在更多情况下是错的。
商业价值的创造需要一系列技术之外的能力:
- 找到愿意付费的用户
- 设计合理的定价策略
- 建立有效的销售渠道
- 控制获客成本和运营成本
- 构建可持续的商业模式
很多技术优秀的公司最终失败了,不是因为技术不行,而是因为没有找到商业化的路径。
闫俊杰在商汤的经历让他对这一点有了深刻认识。商汤技术实力毋庸置疑,但商业化始终是挑战。高估值背后是持续亏损,上市后股价长期低迷。
这段经历教会他:技术是必要条件,不是充分条件。
在Minimax,这种认知体现在"技术与产品并重"的战略选择上:
- 不只是做模型,还要做产品
- 不只是追求技术领先,还要追求商业化落地
- 不只是服务技术社区,还要服务真实用户
Talkie的成功是这种认知的最佳注脚。它不是技术最先进的产品,但它是商业化最成功的产品之一。原因在于:团队真正理解了用户需求,找到了用户愿意付费的场景,建立了可持续的商业模式。
第三重跃迁:从"个人英雄"到"系统能力"
技术专家的成功往往依赖于个人能力:你的算法水平、你的代码质量、你的论文产出。
但企业家的成功必须依赖于组织能力:团队的整体产出、系统的稳定运转、文化的持续传承。
这是一个根本性的视角转换。
作为技术专家,你的目标是让自己变得更强。
作为企业家,你的目标是让团队变得更强。
有时候,这两个目标是矛盾的。如果你事事亲力亲为,做出完美的技术决策,团队就没有机会成长。如果你不放手,就永远培养不出能够独当一面的人才。
闫俊杰的这个跃迁体现在几个方面:
人才选择标准的变化:
从"选择最强的个人"变为"选择能提升团队整体输出的人"。
一个技术能力稍弱但能让周围人变得更好的人,比一个技术能力超强但让周围人变得更差的人更值得招聘。
时间分配的变化:
从把时间花在具体的技术工作上,变为把时间花在"让团队能够做好技术工作"上。
招聘、培训、激励、协调、文化建设——这些"间接"的工作比"直接"的技术工作更重要。
成就感来源的变化:
从"我做出了一个牛逼的模型"变为"我的团队做出了一系列牛逼的产品"。
个人英雄的成就感来自于自己的产出。组织领导者的成就感来自于团队的产出。
第四重跃迁:从"单点突破"到"生态布局"
技术专家往往专注于单点问题:解决一个算法难题、优化一个系统瓶颈、攻克一个技术难关。
企业家必须思考生态问题:技术、产品、市场、组织、资本……如何形成相互支撑的体系?
这需要一种全局思维,能够看到各个部分之间的联系和相互作用。
闫俊杰的生态思维体现在Minimax的战略布局上:
- 模型能力是基础,但必须转化为产品价值
- C端产品获取用户数据,数据反哺模型优化
- 海外市场分散风险,也为技术提供多元验证
- 开发者生态扩大影响力,也为商业化创造渠道
这些元素不是孤立的,而是相互关联、相互促进的。
单点思维会问:"如何让模型更强?"
生态思维会问:"如何让模型、产品、用户、开发者形成正向循环?"
认知的升级不是线性的、渐进的,而是有一些"顿悟时刻"——某个事件或认识突然打开了新的视角。
回顾闫俊杰的创业历程,可以识别出几个关键的认知转折点。
转折点一:2021年——"技术先进性不等于商业成功"
2021年,当闫俊杰决定离开商汤创业时,他已经在这家公司工作了七年。
这七年,他见证了商汤从一个小型创业公司成长为"AI四小龙"之首,估值达到数百亿美元。但他也见证了商汤在商业化上的持续挣扎。
商汤的技术无疑是先进的。它拥有顶尖的研究团队,发表了大量顶级论文,在各种竞赛中屡获佳绩。但这些技术优势并没有转化为持续的盈利能力。
2021年商汤上市后,股价很快跌破发行价。市场用脚投票告诉所有人:光有技术是不够的。
这段经历让闫俊杰形成了一个核心认知:
"技术先进性是竞争的必要条件,但远远不是充分条件。商业成功需要技术、产品、市场、运营的综合能力。"
这个认知直接影响了Minimax的创业方向:从一开始就强调"技术与产品并重",而不是先做技术再考虑产品。
转折点二:2023年——"开源与闭源的辩证关系"
2023年,开源大模型开始崛起。LLaMA、Mistral等模型的发布,让很多人开始质疑闭源模式的可持续性。
最初,闫俊杰对开源模式持谨慎态度。他的逻辑是:
- 闭源可以保护技术优势
- 闭源可以控制产品质量
- 闭源可以支撑商业模式
但随着开源生态的发展,他开始调整认知:
开源和闭源不是非此即彼的选择,而是可以并存的策略。
开源的价值在于:
- 建立开发者生态
- 扩大品牌影响力
- 获取社区的贡献和反馈
闭源的价值在于:
- 保护核心技术优势
- 支撑高端商业化
- 控制产品质量和安全
更成熟的策略是:基础能力可以开源,差异化能力保持闭源;通用模型可以开放,垂直应用保持封闭。
这种认知的更新让Minimax在后来的竞争中更加灵活,不再固守单一的闭源立场。
转折点三:2025年——"长期主义不是不赚钱,而是不赚快钱"
2025年是Minimax面临最大压力的一年。DeepSeek的冲击、资本的质疑、内部的争论……所有这些都在考验闫俊杰的长期主义信念。
在这种压力下,他对长期主义有了更深的理解:
长期主义不是"现在不需要赚钱",而是"不为了短期利益牺牲长期价值"。
这个区分很重要。
有些人把长期主义理解为"不需要考虑商业化,专心做技术就好"。这是对长期主义的误解。如果公司无法生存,就没有长期可言。
真正的长期主义是:
- 要赚钱,但不赚损害长期竞争力的钱
- 要增长,但不追求不可持续的增长
- 要回应市场,但不被短期波动牵着走
- 要满足投资人期待,但不为了取悦投资人而牺牲战略
Talkie就是长期主义的典型案例。它在商业上是成功的,年收入达到7000万美元。但这个成功不是靠烧钱补贴换来的用户增长,而是靠真正满足用户需求、创造用户价值获得的。
这种"健康的商业化"才是长期主义的正确姿势。
认知升级不是自然发生的,而是需要刻意的努力。闫俊杰有哪些升级认知的方法?
方法一:保持"学生心态"
很多成功的人会陷入"专家陷阱"——因为在某个领域是专家,就认为自己什么都懂。
闫俊杰刻意避免这种陷阱。他始终保持学习的状态:
- 阅读大量的书籍和文章,不限于技术领域
- 与不同背景的人交流,获取多元视角
- 参加行业会议和活动,了解最新动态
- 承认自己的无知,向更专业的人请教
这种"学生心态"让他能够持续吸收新知识、新观点,而不是固守已有的认知。
方法二:建立"反馈回路"
认知的升级需要反馈。如果你从不知道自己的判断是对是错,就无法改进。
闫俊杰建立了多重反馈机制:
- 用户反馈:产品的用户数据是最直接的反馈,它告诉你用户真正需要什么
- 市场反馈:竞争格局的变化告诉你行业在往哪个方向走
- 团队反馈:核心团队的意见帮助你识别自己的盲区
- 投资人反馈:投资人的问题和质疑逼迫你更严格地审视自己的假设
- 自我复盘:定期反思自己的决策,评估效果,总结教训
方法三:接触"异见者"
最危险的认知陷阱是"信息茧房"——只接触支持自己观点的信息,只和同意自己的人交流。
闫俊杰刻意地接触不同意见:
- 鼓励团队直接表达不同看法
- 与持不同战略观点的同行交流
- 阅读批评AI行业的文章和观点
- 请教那些与自己专业背景完全不同的人
这些"异见者"可能不总是正确的,但他们提供了不同的视角,帮助你更全面地看问题。
方法四:从失败中提炼认知
成功可以增强信心,但失败才是真正的老师。
闫俊杰有一个习惯:每次重大失败后,都会进行系统的复盘:
- 发生了什么?
- 为什么会发生?
- 我当时的判断是什么?
- 为什么判断失误?
- 如何避免类似失误?
这种复盘不是为了追责,而是为了学习。失败的价值在于它揭示了你认知的盲区。如果不认真反思,同样的错误会一再发生。
方法五:将认知外化为原则
认知升级的成果需要固化下来,否则容易随时间遗忘。
闫俊杰会把重要的认知总结为简洁的原则:
- "技术服务于用户价值"
- "长期主义不是不赚钱,而是不赚快钱"
- "选择能提升团队整体输出的人"
- "保持轻量化组织"
这些原则不是抽象的口号,而是指导日常决策的具体标准。当面临选择时,这些原则提供了快速判断的依据。
任何人的认知都有边界和盲区。承认这一点本身就是一种重要的认知。
闫俊杰可能的认知盲区包括:
技术乐观主义
作为技术背景出身的创始人,他可能倾向于高估技术解决问题的能力,低估非技术因素(政治、文化、社会)的影响。
大模型的发展不只是技术问题,还涉及监管政策、社会接受度、伦理争议等复杂因素。技术乐观主义可能导致对这些因素的低估。
创业者偏见
创业成功需要极强的信念。但这种信念有时会变成"执念"——即使事实已经证明某条路走不通,也不愿意调整。
闫俊杰对某些战略选择的坚持(如闭源策略、ToC优先)是否最终正确,需要时间来验证。保持开放的心态,愿意根据新证据调整判断,是克服这种偏见的关键。
幸存者偏差
成功的创业者容易陷入幸存者偏差——以为自己成功的方式就是普遍正确的方式,忽视了那些用同样方法但失败了的人。
Minimax的成功有多少是因为正确的战略和执行,有多少是因为运气和时机?这个问题没有确定的答案,但保持谦逊的态度是必要的。
如何应对认知盲区
承认盲区的存在是第一步。更重要的是建立机制来发现和弥补盲区:
- 多元化团队:不同背景的团队成员可以提供不同视角
- 外部顾问:独立的外部人士可以提供客观的评估
- 数据驱动:用数据而非直觉来验证假设
- 预设机制:在重大决策前,指定专人提出反对意见
- 定期审视:定��回顾过去的判断,评估是否需要修正
在AI时代,技术更新极快,商业模式迅速迭代。什么是真正持久的竞争优势?
闫俊杰的答案是:认知护城河。
技术可以被复制,产品可以被模仿,但一个组织的认知能力——快速学习、准确判断、高效决策的能力——是很难复制的。
Minimax的认知护城河体现在几个方面:
对技术趋势的判断能力
2021年选择MoE架构、坚持多模态布局——这些决策背后是对技术趋势的准确判断。
这种判断能力不是一两个人的天才,而是整个组织的能力:持续追踪前沿研究、快速评估新技术、果断做出战略选择。
对用户需求的洞察能力
Talkie的成功源于对用户情感需求的准确洞察。很多竞争对手还在做"效率工具",Minimax已经看到了"情感陪伴"的巨大市场。
这种洞察能力同样是组织的能力:深入用户的机制、快速迭代的文化、从数据中发现模式的方法论。
快速学习和调整的能力
DeepSeek冲击后的快速响应,展示了Minimax的学习能力:
- 快速理解DeepSeek的技术路线
- 准确评估对自身的影响
- 迅速调整策略和资源配置
这种学习速度是竞争优势。在快速变化的市场中,谁学得更快,谁就能活得更久。
将认知转化为行动的能力
有正确的认知不等于能够执行。很多公司知道应该怎么做,但做不到。
Minimax的执行能力——将战略认知转化为产品、将产品转化为用户价值、将用户价值转化为商业回报——是认知护城河的关键组成部分。
-
认知是创始人的核心资产。 资金、技术、团队都可以获取,但认知决定了你如何使用这些资源。认知的差距最终会变成结果的差距。
-
从工程师到企业家需要多重认知跃迁。 从技术性能到用户价值、从技术价值到商业价值、从个人英雄到系统能力、从单点突破到生态布局——每一重跃迁都是根本性的视角转换。
-
关键认知往往在"顿悟时刻"形成。 某个事件或认识打开新的视角,带来认知的质变。这些时刻值得被识别和总结。
-
认知升级需要刻意的方法。 保持学生心态、建立反馈回路、接触异见者、从失败中学习、将认知外化为原则——这些方法可以帮助持续升级认知。
-
承认认知盲区是智慧的表现。 每个人都有盲区,建立机制来发现和弥补盲区比假装没有盲区更重要。
-
认知护城河是最持久的竞争优势。 技术可以被复制,但组织的认知能力——判断、洞察、学习、执行——很难被复制。
【本章完】
请输入"继续"以开始第十二章:失败、挫折与自我修正
在公开叙事中,成功的创业者往往被描绘成"一路开挂"的天才:每个决策都是正确的,每个困难都被轻松克服,每个机会都被精准抓住。
这种叙事是危险的。
它创造了一种幻觉:成功是线性的、可预测的、必然的。只要你足够聪明、足够努力,就一定能成功。
但真实的创业世界完全不是这样。
真实的创业充满了失败:战略判断失误、产品上线遇冷、关键人才流失、融资谈判破裂、竞争对手突袭……这些不是例外,而是常态。
成功的创业者不是不犯错的人,而是能够从错误中快速恢复、持续学习的人。
闫俊杰也不例外。Minimax的发展历程中有高光时刻,也有至暗时刻。正视这些挫折,才能真正理解这家公司是如何走到今天的。
由于Minimax是未上市公司,很多内部信息无法公开。但基于公开资料和行业通用经验,我们可以合理推断一些技术层面的挫折。
挫折一:早期模型训练的"灾难性遗忘"
大语言模型训练中有一个著名的问题:灾难性遗忘(Catastrophic Forgetting)。
当模型学习新知识时,可能会"忘记"之前学过的内容。这在持续训练和微调过程中尤其常见。
Minimax在早期的模型训练中,几乎必然遭遇过这个问题。
想象这样的场景:团队花了数周时间训练了一个模型,在中文任务上表现出色。然后,为了增强英文能力,用英文数据进行微调。结果发现:英文能力提升了,但中文能力大幅下降。
几周的努力,似乎白费了。
这种情况在早期创业团队中尤其痛苦——资源有限,每一次训练都是巨大的投入。当结果不如预期时,挫败感是真实的。
解决灾难性遗忘需要大量的技术探索:
- 调整学习率和训练策略
- 设计更好的数据混合比例
- 引入正则化技术防止过度拟合
- 采用持续学习的专门算法
这些解决方案不是一次就能找到的,需要反复试错。每一次失败的训练都是学费,换来的是对问题更深的理解。
挫折二:MoE架构的工程挑战
选择MoE架构是Minimax的一个大胆决定。但大胆的决定往往伴随着巨大的工程挑战。
MoE架构的问题不在于理论,而在于实现:
负载均衡问题:
在理想情况下,每个专家应该被均匀地使用。但实际训练中,往往会出现"热门专家"和"冷门专家"——某些专家被过度使用,其他专家几乎闲置。
这导致模型的有效容量远低于理论容量。你有1万亿参数,但实际使用的可能只有10%。
解决这个问题需要设计复杂的负载均衡机制,而这些机制本身可能引入新的问题。
训练稳定性问题:
MoE模型的训练比密集模型更不稳定。门控网络的梯度可能出现极端值,导致训练崩溃。
团队可能经历过这样的场景:训练进行到一半,loss突然飙升,模型完全失效。之前的计算全部白费,必须重新开始。
分布式通信问题:
大规模MoE模型需要分布在多台机器上训练。不同专家位于不同的机器,每次计算都需要跨机器通信。
通信开销可能成为瓶颈,严重影响训练效率。优化这个问题需要深入理解分布式系统和网络拓扑。
这些工程挑战没有一劳永逸的解决方案,需要持续的优化和迭代。每一次遇到问题、解决问题,都是团队能力的积累。
挫折三:多模态融合的技术难关
多模态是Minimax的核心优势之一,但实现这个优势的过程充满挑战。
模态对齐问题:
不同模态的数据表示方式完全不同。文本是离散的符号序列,图像是连续的像素矩阵,音频是时序的波形信号。
如何让模型理解这些不同模态之间的关系?如何让它知道一张狗的图片对应"狗"这个词?
这需要精心设计的对齐机制和大量的多模态配对数据。
数据获取问题:
高质量的多模态数据非常稀缺。图文配对数据相对容易获取,但音频-文本、视频-文本的高质量配对数据要稀缺得多。
团队可能尝试过多种数据获取方式:爬取网络数据、购买商业数据、自己标注数据……每种方式都有各自的问题。
效果评估问题:
多模态模型的效果如何评估?没有像ImageNet或GLUE那样成熟的benchmark。
团队可能需要自己设计评估标准,而这些标准是否真正反映了用户体验,本身就是一个问题。
技术能力是基础,但技术不等于产品。将技术转化为用户喜爱的产品,是另一个充满挫折的过程。
挫折四:某款C端产品的市场反响不及预期
Minimax推出过多款C端产品:星野、海螺AI、Talkie……
并非每一款产品都像Talkie那样成功。基于公开信息和行业规律,可以合理推断:某些产品的市场反响是不及预期的。
这种情况在产品开发中非常常见:
团队认为自己理解了用户需求,花费大量资源开发产品。上线后发现:用户的反应很冷淡,数据远低于预期。
可能的原因包括:
- 需求判断失误:团队以为用户需要A,但用户实际需要B
- 产品形态问题:需求判断正确,但产品形态不对,用户不买账
- 竞争环境变化:开发期间市场发生变化,原本的机会窗口关闭了
- 执行问题:方向正确但执行不到位,产品体验有缺陷
面对这种情况,团队需要做出艰难的决定:
- 是继续投入,相信产品最终会成功?
- 还是果断止损,把资源投入到更有希望的方向?
这种决定没有标准答案,需要创始人的判断力。但无论如何选择,失败的沮丧是真实的。
挫折五:产品功能的用户接受度问题
即使是成功的产品,也会有失败的功能。
团队花费大量精力开发了一个新功能,认为用户一定会喜欢。上线后发现:使用率很低,用户根本不care。
这种情况可能发生过多次。
原因可能是:
- 功能设计脱离用户真实需求:团队沉浸在技术能力中,做了技术上很酷但用户不需要的功能
- 功能入口设计不合理:功能本身有价值,但用户找不到或不理解如何使用
- 功能与核心体验不一致:功能破坏了产品的核心体验,用户反感而非喜欢
这些失败的功能是学习的机会。它们教会团队:
- 不要假设用户需要什么,要真正去了解
- 功能上线只是开始,需要持续观察和迭代
- 有时候"少即是多",砍掉功能比增加功能更重要
挫折六:国内市场的增长困境
Talkie在海外市场取得了亮眼成绩,但国内市场的情况可能没那么乐观。
国内市场面临独特的挑战:
- 监管限制:AI应用需要备案,内容需要审核,某些功能无法上线
- 竞争激烈:字节、腾讯、百度等巨头都在这个市场,流量和资源优势明显
- 用户习惯:国内用户对AI产品的付费意愿相对较低
这些因素导致国内产品的增长可能低于预期。
团队可能尝试过多种策略:
- 调整产品功能以适应监管要求
- 与平台合作获取流量
- 探索不同的变现模式
但结果可能参差不齐,需要持续的探索和调整。
创业不只是技术和产品的挑战,也是组织和人的挑战。
挫折七:核心团队成员的离开
在Minimax的发展过程中,几乎必然经历过核心成员的离开。
这种离开可能有多种原因:
- 更好的机会:被巨头或其他创业公司高薪挖走
- 理念分歧:对公司方向有不同看法,无法达成共识
- 个人原因:家庭、健康或其他个人因素
- 创业冲动:想要自己创业,追求更大的舞台
无论原因是什么,核心成员的离开对公司都是冲击:
- 知识流失:这个人掌握的关键知识可能没有被传承
- 士气影响:团队其他成员可能受到影响,产生动摇
- 工作中断:离开者负责的工作需要交接和重新安排
更深层的影响是情感上的。创始人与早期核心成员之间往往有深厚的信任和感情。当这些人离开时,失落感是真实的。
闫俊杰如何应对这种情况?
基于他的价值观和领导风格,可以推断几点:
- 尊重个人选择:不强留,理解每个人有自己的路要走
- 做好交接:确保知识和工作得到传承
- 保持关系:即使离开,也保持良好的个人关系
- 反思原因:思考是否有公司自身的问题导致了离开
- 加强梯队:更加重视人才梯队建设,减少单点依赖
挫折八:组织扩张中的管理失误
从十几人扩张到数百人的过程中,管理失误几乎是不可避免的。
可能的失误包括:
招聘失误:
招了不合适的人,浪费了时间和资源,还可能对团队造成负面影响。
有些人面试时表现很好,但实际工作中完全不同。有些人技术能力强,但无法融入团队文化。
识别和处理这些问题需要时间和精力。
晋升失误:
提拔了不合适的人担任管理岗位,导致团队效能下降。
优秀的技术专家不一定是好的管理者。把技术高手提拔为经理,可能既失去了一个好工程师,又得到了一个差经理。
组织设计失误:
组织结构不合理,导致协作困难、决策缓慢。
部门之间职责不清、接口不畅,各自为政。简单的事情需要协调多个部门,效率低下。
文化稀释:
随着人员扩张,早期的文化被稀释。新员工带来的习惯和预期与原有文化产生冲突。
坦诚直接的氛围变得微妙复杂,高效务实的风格变得繁文缛节。
这些管理失误不是因为创始人不够聪明,而是因为管理本身就是复杂的。没有人能在第一次就做对所有事情。
关键是:能否快速识别问题、承认错误、做出调整?
挫折九:融资过程中的估值分歧
融资是创业公司的生命线,但融资过程充满了博弈和挫折。
在Minimax的融资历史中,几乎必然经历过估值分歧:
- 公司认为自己值X亿美元,投资人只愿意给0.7X
- 某个投资人给了心仪的估值,但条款不可接受
- 谈判进行到最后阶段,投资人突然改变主意
这些情况都会造成挫败感。融资是漫长的过程,每一次失败的谈判都消耗时间和精力。更重要的是,融资失败可能危及公司生存。
闫俊杰的融资原则在这些挫折中得到了检验:
- 不为估值牺牲条款:宁可估值低一点,也要保持控制权
- 选择合适的投资人:不只看钱,也看理念是否契合
- 保持多个选择:不把鸡蛋放在一个篮子里
- 坚持长期主义:不为短期融资压力改变战略
这些原则让Minimax在融资中保持了主动权,但执行这些原则的过程充满了取舍和煎熬。
面对挫折,真正重要的是:如何从挫折中学习、修正、成长?
Minimax建立了一套自我修正机制,帮助公司持续进化。
机制一:数据驱动的复盘
"采用数据科学快速识别有效路径"——这是Minimax的核心原则之一。
这个原则不只适用于技术开发,也适用于错误识别和修正。
具体做法包括:
项目复盘:
每个重要项目结束后,都会进行系统的复盘:
- 目标是什么?达成了吗?
- 哪些做法是有效的?
- 哪些做法是无效的?
- 如果重新做一次,会有什么不同?
复盘的结果会被记录下来,成为组织的学习资产。
数据监控:
关键指标被持续监控。当数据出现异常时,会触发分析和响应:
- 为什么这个指标下降了?
- 是暂时波动还是趋势变化?
- 需要采取什么行动?
A/B测试:
重大变更通过A/B测试来验证,而不是凭直觉决定。
测试结果提供了客观的反馈,帮助识别什么有效、什么无效。
机制二:外部视角的引入
内部视角有其局限性。团队可能陷入"群体思维",看不到自己的问题。
Minimax通过多种方式引入外部视角:
投资人视角:
投资人不参与日常运营,但对公司有深入了解。他们的问题和质疑往往能揭示内部看不到的问题。
闫俊杰与投资人保持定期沟通,认真对待他们的反馈。
顾问视角:
聘请行业专家担任顾问,提供独立的观点和建议。
这些顾问可能是技术专家、商业专家或管理专家,他们从各自的专业角度提供反馈。
用户视角:
用户是最真实的外部视角。他们不关心公司的内部逻辑,只关心产品好不好用。
通过用户访谈、社区互动、数据分析,持续获取用户反馈。
竞争对手视角:
研究竞争对手的做法,思考他们为什么做那些选择。
有时候,竞争对手的成功可以揭示自己的盲区。
机制三:组织层面的持续创新
"通过组织调整克服能力边界"——这是闫俊杰处理组织问题的方式。
当现有组织结构无法支撑战略执行时,需要进行调整:
结构调整:
根据业务需要调整部门设置和汇报关系。
比如,当多模态成为战略重点时,可能需要成立专门的多模态团队,赋予足够的资源和权限。
流程优化:
识别低效的流程,进行简化或重新设计。
定期审视现有流程,问:"这个流程真的必要吗?能不能更简单?"
人员调整:
根据业务需要调整人员配置。
有些岗位需要增加,有些岗位需要调整,有些岗位可能需要取消。
这些调整往往是痛苦的,因为涉及到人。但如果不做调整,组织就会僵化。
机制四:领导者的自我反思
最重要的自我修正机制是创始人自己的反思习惯。
闫俊杰保持着定期反思的习惯:
每周反思:
这周做了什么重要决策?决策的逻辑是什么?结果如何?
每月复盘:
这个月的关键目标达成了吗?遇到了什么问题?如何解决的?
每年总结:
这一年的成长在哪里?有什么重大的认知升级?还有什么盲区?
这种反思不是形式主义的自我检讨,而是真正的思考和学习。
每一次挫折都是学费,关键是能从中学到什么。
基于Minimax的经历,可以提炼出几条重要的原则:
原则一:"错误率是AI产品的生命线"
这个认知来自于无数次用户投诉和数据分析的教训。
早期可能过于关注模型的"能力上限"——模型能做什么?表现最好的时候有多强?
但用户体验的决定因素是"能力下限"——模型最差的时候有多差?犯错的频率有多高?
一个偶尔表现惊艳但经常犯错的模型,不如一个表现稳定但不那么惊艳的模型。
这个原则指导了后来的技术优先级:降低错误率比提升峰值性能更重要。
原则二:"用户共创不是口号,是生存方式"
这个认知来自于多次产品失败的教训。
早期可能过于自信,认为自己理解用户需求。结果发现:很多假设是错的。
唯一了解用户需求的方式是:让用户参与进来。
- 在产品规划阶段就征求用户意见
- 在开发过程中持续收集用户反馈
- 在上线后密切关注用户行为数据
- 把用户当作合作伙伴,而非被动的消费者
这种"用户共创"不是营销噱头,而是产品成功的必要条件。
原则三:"技术深度是护城河,但产品化是桥梁"
这个认知来自于技术能力与商业成功之间差距的反思。
Minimax在技术上一直保持领先,但技术领先不自动转化为商业成功。需要产品化这座桥梁。
产品化意味着:
- 把技术能力转化为用户可以理解和使用的功能
- 把复杂的系统封装成简洁的体验
- 把技术价值翻译成用户价值
这座桥梁的建设需要产品能力、设计能力、运营能力——这些与技术能力同等重要。
原则四:"快速失败,快速学习"
这个认知来自于漫长而昂贵的失败经历的反思。
早期可能追求"一次做对"——花很长时间规划和准备,希望避免失败。
但现实是:失败不可避免。问题不是"如何避免失败",而是"如何更快地失败、更快地学习"。
快速失败意味着:
- 用最小的投入验证假设
- 不追求完美,追求速度
- 敢于尝试,不怕犯错
快速学习意味着:
- 从每次失败中提炼教训
- 建立反馈机制,及时获取信号
- 调整方向,避免重复犯错
这种"快速失败、快速学习"的理念贯穿于Minimax的产品开发和组织运营中。
原则五:"坦诚面对问题是解决问题的第一步"
这个认知来自于逃避问题导致问题恶化的教训。
早期可能有过这样的情况:发现了问题,但不愿意面对。希望问题会自己消失,或者等到"更好的时机"再处理。
结果往往是:问题没有消失,反而越积越大,最后不得不付出更大的代价来解决。
教训是:发现问题就要面对,不要逃避。
- 承认问题的存在
- 分析问题的原因
- 制定解决的方案
- 执行并跟进
这需要勇气,但这是唯一正确的方式。
站在今天回顾这些挫折,它们的意义是什么?
挫折是能力的淬炼
没有经历过算力短缺的公司,不会知道如何在约束条件下优化效率。
没有经历过产品失败的团队,不会真正理解用户需求。
没有经历过人才流失的组织,不会认真建设人才梯队和知识传承。
每一次挫折都是对能力的淬炼。熬过挫折的公司,变得更加强大。
挫折是认知的来源
最深刻的认知往往来自于最痛苦的教训。
"错误率是生命线"这个认知,可能来自于无数次用户投诉带来的挫败感。
"技术不等于产品"这个认知,可能来自于技术很强但市场不买账的失落。
没有这些挫折,这些认知不会如此深刻。
挫折是文化的检验
一家公司真正的文化,不是顺境时说的话,而是逆境时做的事。
当挫折来临时,坦诚文化是否还能保持?长期主义是否还能坚持?团队是否还能团结?
挫折检验了Minimax的文化是否真实,还是只是口号。
挫折是差异化的来源
每家公司都会遇到挫折,但如何应对挫折决定了公司的差异化。
有些公司被挫折打垮,从此一蹶不振。
有些公司逃避挫折,问题越积越多。
有些公司正视挫折,从中学习,变得更强。
Minimax能够成为"6+2"格局中的一员,不是因为它没有遇到挫折,而是因为它能够从挫折中恢复和成长。
-
失败是创业的常态,不是例外。 成功的创业者不是不犯错的人,而是能够从错误中快速恢复的人。
-
技术挫折是学费,换来的是能力积累。 每一次失败的训练、每一个难解的bug,都在积累团队的know-how。
-
产品挫折是学习用户的机会。 用户不买账的产品或功能,揭示了团队对用户需求的误解。
-
组织挫折是管理成熟的代价。 招聘失误、晋升失误、文化稀释……这些问题在成长中不可避免,关键是能否识别和修正。
-
自我修正机制比避免错误更重要。 建立数据驱动的复盘、引入外部视角、推动组织创新、保持领导者反思——这些机制确保公司能够持续进化。
-
从挫折中提炼原则,形成组织智慧。 "错误率是生命线""用户共创是生存方式""快速失败、快速学习"——这些原则来自于真实的教训,指导未来的行动。
-
挫折的意义在于淬炼能力、深化认知、检验文化。 没有挫折的公司是虚弱的。经历挫折并从中成长的公司,才能走得更远。
【本章完】
请输入"继续"以开始第十三章:决策模型、风险观与长期主义
如果要用一个词来概括创始人的核心职责,那就是:决策。
每一天,创始人都面临无数的选择:
- 战略方向:做什么,不做什么?
- 资源配置:投入多少,投入到哪里?
- 人员任用:谁上,谁下?
- 产品取舍:哪个功能优先,哪个功能砍掉?
- 时机把握:现在做,还是再等等?
这些决策累积起来,决定了公司的命运。
一个正确的决策可以让公司脱颖而出,一个错误的决策可以让公司万劫不复。大多数决策的效果介于两者之间,但它们的累积效应是巨大的。
闫俊杰作为Minimax的创始人,在过去几年中做出了无数决策。这些决策的质量决定了公司今天的位置。
更重要的是,他在决策过程中形成了一套独特的决策模型。理解这套模型,对于任何需要做决策的人都有借鉴价值。
通过分析Minimax的重大决策和闫俊杰的公开言论,可以还原出他的决策框架。
这套框架包含四个核心维度:
维度一:技术可行性
第一个问题永远是:这件事在技术上可行吗?
作为技术背景出身的创始人,闫俊杰对技术可行性有敏锐的判断力。
技术可行性的评估包括:
- 理论可行性:从原理上,这件事能不能做到?
- 工程可行性:以当前的工程能力,能不能实现?
- 资源可行性:需要多少算力、数据、人才?我们有吗?
- 时间可行性:需要多长时间?市场能等吗?
2021年选择MoE架构就是一个典型案例。
当时MoE在理论上已经被证明可行(谷歌的Switch Transformer论文),但工程实现难度很大,很少有公司敢于在生产环境中使用。
闫俊杰的判断是:理论可行且符合长期趋势,工程挑战可以克服。 这个判断后来被证明是正确的。
技术可行性评估的一个关键原则是:尊重技术规律,不做违背物理定律的承诺。
有些公司为了融资或市场宣传,会做出超越技术现实的承诺。这种做法可能短期有效,但长期会损害信誉。
Minimax的做法是:只承诺有技术基础的事情,不夸大、不虚构。
维度二:商业可持续性
第二个问题是:这件事在商业上可持续吗?
技术可行不等于商业可持续。很多技术上可行的事情,商业上完全不可行。
商业可持续性的评估包括:
- 用户价值:用户会为此付费吗?付多少?
- 成本结构:实现这个价值需要多少成本?能覆盖吗?
- 竞争格局:竞争对手在做什么?我们有差异化优势吗?
- 规模效应:规模扩大后,成本会下降还是上升?
闫俊杰在采访中提到过一个核心指标:"降价同时保持更好效果。"
这句话揭示了他对商业可持续性的理解:
- 单纯降价不可持续,如果成本降不下来,降价就是在亏损补贴
- 单纯追求效果也不可持续,如果成本太高,用户无法承受
- 可持续的模式是:在保持效果的同时降低成本,从而可以降低价格、扩大用户
这种"效率驱动"的商业模式,比"烧钱补贴"的模式更加健康。
维度三:组织承载力
第三个问题是:团队能承载这个战略吗?
再好的战略,如果团队无法执行,也是空中楼阁。
组织承载力的评估包括:
- 人才储备:有合适的人来做这件事吗?
- 能力匹配:团队的能力与战略需求匹配吗?
- 文化契合:这件事与公司文化一致吗?
- 资源约束:同时进行的项目太多了吗?团队会崩溃吗?
2025年"五连发"的经历就是一个教训。
同时推出五款产品,展示了公司的技术储备,但也造成了团队的极度疲劳。事后反思,如果更加聚焦,可能效果更好。
组织承载力评估的一个关键原则是:不要让战略雄心超越组织能力。
野心勃勃的战略很诱人,但如果团队无法执行,最终只会导致挫败和疲惫。
维度四:长期价值
第四个问题是:五年后,这件事还有价值吗?
这是最容易被忽视的维度,也是最重要的维度。
很多决策在短期内看起来很有吸引力,但从长期看毫无价值:
- 追逐热点可能带来短期流量,但热点过去后一地鸡毛
- 签一个大客户可能带来短期收入,但如果需要过度定制,反而拖累未来发展
- 做一个投资人喜欢的项目可能帮助融资,但如果与核心战略不一致,是在浪费资源
长期价值的评估需要回答:
- 积累性:这件事会积累什么?技术、用户、数据、品牌?
- 可持续性:这种积累在五年后还有价值吗?还是会被淘汰?
- 战略一致性:这件事与公司的长期愿景一致吗?
- 机会成本:做这件事意味着放弃什么?值得吗?
闫俊杰在决策时,会优先考虑长期价值,而不是短期收益。
选择自研模型而非使用开源模型,短期成本更高,但长期积累更深。
选择做C端产品而非只做API,短期变现更慢,但长期护城河更高。
这种"长期优先"的决策原则,贯穿于Minimax的发展历程。
让我们用这套决策框架来分析几个具体案例。
案例一:2021年选择MoE架构
- 技术可行性:理论上已被验证,工程挑战虽大但可克服。✓
- 商业可持续性:MoE可以降低推理成本,对大规模服务至关重要。✓
- 组织承载力:团队技术能力强,有信心攻克工程难题。✓
- 长期价值:MoE是通向更大更强模型的必由之路,长期价值高。✓
四个维度都是正向的,这个决策是正确的。
案例二:2023年同时推进多款C端产品
- 技术可行性:有模型能力支撑,技术上可行。✓
- 商业可持续性:C端产品可以直接变现,商业上有潜力。✓
- 组织承载力:同时多条产品线,资源分散,团队压力大。△
- 长期价值:部分产品可能成功,部分可能失败,需要验证。△
这个决策有风险,组织承载力和长期价值都存在不确定性。事后看,Talkie成功了,其他产品表现参差不齐。如果更加聚焦,可能更好。
案例三:2024年坚持闭源策略
- 技术可行性:技术上可行,闭源不影响产品开发。✓
- 商业可持续性:闭源可以支撑高端定价,但开源竞争日益激烈。△
- 组织承载力:团队可以支撑闭源模式。✓
- 长期价值:在开源崛起的背景下,闭源的长期价值需要重新评估。△
这个决策存在争议,商业可持续性和长期价值都面临挑战。DeepSeek的冲击进一步加剧了这种挑战。Minimax后来调整了策略,变得更加灵活。
通过这些案例可以看出:决策框架不能保证每个决策都正确,但可以帮助系统性地思考问题、识别风险。
与决策框架密切相关的是风险观。如何看待和管理风险,决定了决策的风格。
闫俊杰的风险观经历了三个阶段的演进:
阶段一:激进技术冒险(2021-2022)
创业初期,闫俊杰的风险观是激进的。
典型决策:
- 选择MoE这样的前沿架构
- 同时布局多模态
- 从一开始就做C端产品
这些决策的共同特点是:技术风险高,但潜在回报也高。
激进风险观的逻辑是:
创业本身就是高风险活动。如果追求安全,就不应该创业。既然选择了创业,就应该押注于高风险高回报的方向。
保守的选择(使用成熟架构、专注单一模态、只做API)可能更安全,但也意味着更难建立差异化优势。
在这个阶段,闫俊杰愿意冒技术风险,相信团队有能力克服工程挑战。
阶段二:选择性冒险(2023-2024)
随着公司规模扩大、业务复杂化,风险观开始变得更加精细。
核心原则:在核心领域冒险,在边缘领域控制风险。
具体表现:
- 核心技术:继续保持激进,追求前沿突破
- 成熟业务:控制风险,确保现金流稳定
- 新业务:采用"小步快跑"策略,验证可行再大规模投入
这种差异化的风险策略,平衡了进取与稳健。
它的逻辑是:公司不能在所有方向上都冒险,那样会失控。但也不能在所有方向上都保守,那样会停滞。
关键是识别"在哪里值得冒险"。
阶段三:系统性风险管理(2025-)
进入成熟期后,风险管理变得更加系统化。
具体措施:
- 风险识别:定期评估各类风险——技术风险、市场风险、财务风险、合规风险、组织风险
- 风险分类:区分高概率低影响和低概率高影响的风险
- 应对预案:为主要风险制定应对预案
- 监控机制:建立早期预警指标,及时发现风险信号
- 分散策略:不把鸡蛋放在一个篮子里——产品多元化、市场多元化、收入来源多元化
这个阶段的风险观更加成熟:不是回避风险,而是理解风险、管理风险。
风险不是敌人,而是创业的伴生物。关键是:
- 承担值得承担的风险
- 避免不必要的风险
- 为可能发生的风险做好准备
特别关注:尾部风险
成熟的风险管理特别关注"尾部风险"——概率低但影响大的事件。
这类风险包括:
- 核心技术被突破,失去竞争优势
- 关键人才集体流失
- 重大合规问题导致业务停摆
- 地缘政治变化影响公司运营
- 算力供应完全断裂
这些事件发生的概率不高,但一旦发生,影响可能是致命的。
应对尾部风险的策略包括:
- 分散化:不依赖单一技术、单一市场、单一供应商
- 冗余设计:关键系统和人员有备份
- 情景规划:提前思考"如果发生X,我们怎么办?"
- 财务储备:保持足够的现金,应对突发情况
决策框架和风险观的核心,指向一个更深层的理念:长期主义。
长期主义是Minimax的核心价值观之一,但它不是一个抽象的口号,而是需要具体实践的原则。
实践一:不追逐热点
科技行业热点不断:元宇宙、Web3、NFT、ChatGPT……每隔几个月就有新的热点出现。
追逐热点很诱人:媒体关注、投资人兴奋、估值上涨……短期内可以获得很多好处。
但追逐热点的代价是:失去焦点,分散资源,积累不了真正的能力。
Minimax的做法是:除非热点与公司的核心战略一致,否则不追。
比如,当元宇宙概念火热时,Minimax没有宣布"All in 元宇宙"。当Web3概念流行时,Minimax没有发行什么Token。
这种克制在当时可能显得"不够前沿",但长期来看是正确的——那些热点已经冷却,而Minimax的核心能力在持续积累。
实践二:坚持创新投入
长期主义的一个具体表现是:即使在困难时期,也保持对创新的投入。
2025年面临DeepSeek冲击、资本压力、内部质疑……在这种情况下,有些公司会选择削减研发投入,聚焦短期变现。
Minimax的选择是:调整投入方向,但不削减创新投入。
- 加大效率优化的投入(针对DeepSeek的挑战)
- 继续保持多模态的领先(核心差异化)
- 优化产品矩阵但保持创新(聚焦但不停滞)
这种选择需要勇气。在压力下保持长期视野,是对领导力的考验。
实践三:选择理解长期价值的投资人
长期主义需要资本的支持。如果投资人只看短期回报,公司很难坚持长期主义。
闫俊杰在融资时有一个重要的筛选标准:投资人是否理解和认同长期价值?
这意味着:
- 优先选择有耐心的投资人,而非催促快速变现的投资人
- 优先选择理解技术的投资人,而非只看财务模型的投资人
- 优先选择有长期合作历史的投资人,而非短期套利的投资人
这种选择可能意味着放弃更高的估值或更好的条款,但换来的是更长远的战略空间。
实践四:建立长期激励机制
长期主义不只是创始人的选择,也需要通过机制传导到整个组织。
Minimax的激励机制体现长期主义:
- 期权激励:核心员工有期权,与公司的长期成功绑定
- 绩效评估:不只看短期产出,也看长期贡献
- 晋升标准:不只看眼前的项目结果,也看能力的积累和成长
- 文化强化:持续传达长期主义的信息,让它成为组织的共识
实践五:接受短期的"不完美"
长期主义意味着接受短期的不完美。
如果每个季度都要交出完美的成绩单,就必然会牺牲长期发展。
Minimax的做法是:设定合理的短期目标,但不让短期目标凌驾于长期目标之上。
比如:
- 接受某些季度的收入增长低于预期,只要长期趋势是健康的
- 接受某些产品尝试的失败,只要在失败中学到了东西
- 接受某些技术投入暂时看不到回报,只要它符合长期战略
这种"接受不完美"需要与投资人和团队达成共识,需要清晰地沟通背后的逻辑。
长期主义是正确的理念,但也有其边界和风险。
边界一:长期主义不是"永远不赚钱"
有人误解长期主义为"不需要商业化,专心做技术就好"。这是危险的误解。
如果公司无法生存,就没有长期可言。商业化是生存的必要条件。
真正的长期主义是:赚钱,但不赚损害长期价值的钱。
Talkie的收入证明了这一点——长期主义不妨碍商业成功,只是不用不健康的方式追求商业成功。
边界二:长期主义需要阶段性验证
完全的"等待五年后见分晓"是不现实的。
长期目标需要分解为阶段性里程碑,定期检验进展。
如果阶段性里程碑持续未达到,可能意味着方向有问题,需要调整。
长期主义不是固执,而是方向上的坚持与方法上的灵活。
边界三:长期主义需要资源支撑
长期主义需要"耐心资本"的支持。如果公司现金流紧张、融资困难,就很难坚持长期主义。
这意味着:
- 在资源充裕时要为困难时期做准备
- 保持一定的财务安全边际
- 不把资源消耗到无法回头的程度
长期主义是一种奢侈,需要有实力才能享受。
边界四:长期主义不是回避决断
有时候,"长期主义"会成为回避困难决定的借口:
"这个产品暂时表现不好,但长期会好的……"
"这个人最近表现不行,但给他更多时间……"
真正的长期主义需要区分:
- 哪些是值得等待的——方向正确,只是需要时间
- 哪些是不应该等待的——方向错误,等待只会浪费资源
这种区分需要判断力,不能用"长期主义"来逃避判断。
决策能力不是天生的,而是通过实践积累的。闫俊杰的决策智慧来自哪里?
来源一:大量的决策实践
没有捷径。只有做过大量决策,才能积累决策的直觉。
从商汤的技术决策,到Minimax的战略决策,闫俊杰有超过十年的决策实践。
这些实践中的成功和失败,都转化为决策的智慧。
来源二:系统的复盘反思
实践只是原材料,需要通过反思才能转化为智慧。
闫俊杰有系统复盘的习惯:
- 重要决策后会回顾结果,分析对错
- 定期总结决策中的规律和教训
- 将反思的成果固化为原则和框架
来源三:多元的信息输入
决策质量取决于信息质量。
闫俊杰保持着多元的信息输入:
- 阅读大量的技术和商业资料
- 与不同背景的人交流
- 关注竞争对手和行业动态
- 听取团队的不同意见
这些信息帮助他更全面地理解问题,做出更好的决策。
来源四:持续的学习更新
市场在变,技术在变,决策框架也需要更新。
DeepSeek的冲击就是一个例子。它迫使闫俊杰重新审视对开源模式、训练效率的判断,更新自己的决策框架。
这种持续学习的能力,是决策智慧的重要来源。
-
决策是创始人的核心职责。 决策的累积效应决定公司的命运。建立系统的决策框架,比凭直觉决策更可靠。
-
决策框架的四个维度:技术可行性、商业可持续性、组织承载力、长期价值。 用这四个维度评估决策,可以更系统地识别风险和机会。
-
风险观需要随公司发展而演进。 从激进冒险到选择性冒险再到系统性风险管理——不同阶段需要不同的风险策略。
-
长期主义是核心理念,但需要正确理解。 不追热点、坚持创新投入、选择理解长期价值的投资人——这些是长期主义的实践。
-
长期主义有边界:不是不赚钱,需要阶段性验证,需要资源支撑,不是回避决断。 理解这些边界,才能正确实践长期主义。
-
决策智慧来自实践、反思、信息和学习。 没有人天生就会做好决策,但通过刻意的积累,可以持续提升决策能力。
-
方向上的坚持与方法上的灵活是最佳组合。 长期目标要坚定,但实现目标的路径可以灵活调整。
【本章完】
请输入"继续"以开始第十四章:领导力与自我约束
什么是领导力?
这个问题有无数种回答。有人说领导力是影响他人的能力,有人说是设定方向的能力,有人说是激励团队的能力,有人说是做出决策的能力。
这些回答都有道理,但都只触及了表面。
闫俊杰对领导力有一个更深刻的理解:
领导力是让正确的事情发生的能力。
这个定义有三个关键词:
"正确的事情"——领导力首先是关于方向的。如果方向错了,执行力再强也没有用。
"发生"——领导力不只是想法和计划,而是实际的结果。很多人有正确的想法,但无法让它们变成现实。
"让"——领导力是通过他人实现目标,而不是单打独斗。创始人不可能亲自做所有的事,必须通过团队来实现愿景。
这个定义揭示了领导力的核心张力:
- 既要有远见,又要能落地
- 既要坚持原则,又要灵活应变
- 既要自信果断,又要谦逊学习
- 既要激励他人,又要约束自己
这些张力不是非此即彼的选择,而是需要同时把握的平衡。
闫俊杰的领导力展现出几对看似矛盾、实则统一的特质。
矛盾一:激进与克制
在技术路线上,闫俊杰是激进的:
- 选择MoE这样的前沿架构
- 从一开始就布局多模态
- 追求万亿参数的规模
- 线性注意力机制的创新
这些选择都体现了技术上的激进——愿意承担高风险,追求高回报。
但在组织扩张上,他是克制的:
- 保持轻量化组织结构
- 不盲目扩招
- 控制管理层级
- 警惕大公司病
这种"技术激进、组织克制"的组合是有意识的选择。
为什么技术上激进?
因为技术是竞争的核心。在AI领域,技术落后意味着全面落后。必须在技术上保持领先,才有生存的基础。
为什么组织上克制?
因为组织膨胀会侵蚀创新能力。人多了,会议多了,流程多了,效率就下降了。保持精干,才能保持活力。
这两者的统一逻辑是:用精干的组织追求激进的技术目标。
不是用臃肿的组织做保守的事情,也不是用精干的组织做平庸的事情,而是用最高效的方式追求最有野心的目标。
矛盾二:自信与谦逊
对AGI的未来,闫俊杰是自信的:
"AI应该成为日常生活的一部分,成为普惠大众的生产力。"
"中国AI企业可以引领世界巨头。"
这些表述展现了强烈的信念和雄心。
但对当前的差距,他也是谦逊的:
他承认模型还有20-30%的错误率,距离真正可用还有距离。
他认真研究DeepSeek的技术路线,承认其效率优势。
他持续学习,保持"学生心态"。
这种"对未来自信、对现状谦逊"的组合是成熟领导力的体现。
自信的价值:
创业需要信念。如果创始人自己都不相信能成功,怎么能说服别人?自信是激励团队、吸引人才、打动投资人的基础。
谦逊的价值:
盲目自信会导致傲慢和封闭。只有谦逊地承认不足,才能持续学习、不断进步。谦逊是保持开放心态、避免认知僵化的关键。
两者的统一逻辑是:相信目标可以实现,但不认为自己已经知道所有答案。
自信是关于方向的,谦逊是关于路径的。方向是坚定的,路径是探索的。
矛盾三:野心与耐心
闫俊杰的野心是显而易见的:
"我骨子里是一个期待跟王者一决高下的人。"
他不满足于做一家小而美的公司,而是志在成为全球领先的AI企业。
但他也展现了惊人的耐心:
不追逐短期热点,坚持长期主义。
不为短期变现牺牲长期发展。
接受某些投入需要多年才能见效。
这种"野心勃勃但不急于求成"的组合是稀缺的。
很多有野心的人缺乏耐心——他们想要快速成功,容易被短期诱惑带偏。
很多有耐心的人缺乏野心——他们满足于渐进式的改良,不敢追求根本性的突破。
两者的统一逻辑是:目标是十年后的胜利,但每一天都在为那个胜利而战斗。
野心决定了目标的高度,耐心决定了实现目标的方式。两者结合,才能在长期竞争中胜出。
权力是危险的。
随着公司的发展,创始人的权力越来越大。他的决策影响数百人的工作和生活,他的一句话可能改变公司的方向。
这种权力如果不加约束,很容易导致问题:
- 傲慢:认为自己总是对的,不听取不同意见
- 封闭:只接触同意自己的人,陷入信息茧房
- 独断:绕过流程,凭个人喜好做决策
- 失控:行为越来越偏离公司和社会的利益
历史上,无数曾经成功的创始人因为缺乏自我约束而失败。
闫俊杰如何避免这些陷阱?他建立了几个自我约束的机制:
机制一:信息隔离的防范
创始人很容易陷入信息茧房。因为:
- 下属倾向于报告好消息,隐瞒坏消息
- 周围的人倾向于迎合老板的观点
- 成功会强化既有认知,减少质疑
闫俊杰的应对措施:
多元信息渠道:不只依赖直接汇报,也通过产品数据、用户反馈、行业报告等渠道获取信息。
鼓励直言:明确表态欢迎不同意见,对敢于直言的人给予正向反馈。
定期"潜伏":有时候以普通用户的身份使用产品,直接感受用户体验。
外部视角:定期与外部人士(投资人、顾问、同行)交流,获取独立的观点。
机制二:认知更新的习惯
认知僵化是领导者的大敌。市场在变,技术在变,如果认知不更新,决策就会越来越脱离现实。
闫俊杰的应对措施:
持续学习:阅读大量资料,参加行业活动,保持对前沿的了解。
复盘反思:定期回顾自己的决策和判断,评估对错,总结教训。
承认错误:当事实证明自己判断失误时,坦诚承认,而不是找借口。
更新模型:根据新信息调整自己的决策框架,而不是固守旧框架。
DeepSeek的冲击就是一个例子。它迫使闫俊杰重新审视对开源模式和训练效率的判断,更新自己的认知模型。
机制三:权力边界的设定
创始人不应该独断一切。有些决策应该由团队做出,有些流程应该被遵守。
闫俊杰的做法是:在组织内建立"科学决策"而非"个人独断"的文化。
具体措施:
数据驱动:重大决策要有数据支撑,不是老板拍脑袋。
集体讨论:重要问题要经过核心团队的充分讨论,而不是创始人一言堂。
授权赋能:把决策权下放给更接近一线的人,而不是所有事情都要创始人批准。
流程约束:某些决策必须走流程,即使创始人也不能随意绕过。
这些措施限制了创始人的权力,但也让决策更加科学、组织更加健康。
机制四:反馈机制的建立
领导者需要反馈来校正行为,但越往高层走,真实反馈越难获得。
闫俊杰的应对措施:
匿名反馈渠道:让员工可以匿名提出意见和建议。
360度评估:不只是上级评估下级,也让下级和同级评估领导。
开放门户:任何人都可以直接向创始人反映问题。
外部教练:聘请专业的教练或顾问,提供独立的反馈和建议。
机制五:使命感的锚定
最终极的自我约束来自于使命感。
当创始人清晰地知道自己为什么做这件事、要实现什么目标时,就会自然地约束那些偏离使命的行为。
闫俊杰的使命感来自于:
- 外公的遗憾——AI应该帮助普通人表达自己
- 技术民主化的信念——AI不应该只服务于精英
- 引领世界的雄心——中国AI企业可以站在世界之巅
这些深层的信念像锚一样,把他固定在正确的方向上。
当面临诱惑时——比如为了短期利益做有害于用户的事——使命感会发出警报:这不是我们要做的事。
当面临困难时——比如压力巨大想要放弃——使命感会提供动力:我们还没有完成使命,不能停下来。
领导力不是固定的,而是需要随着公司发展而进化的。
闫俊杰的领导力经历了几个阶段的进化:
阶段一:技术领导者(2014-2020)
在商汤时期,闫俊杰主要是一个技术领导者。
核心能力:
- 技术判断力:识别有价值的技术方向
- 技术执行力:带领团队攻克技术难关
- 技术影响力:在技术社区建立声誉
领导方式:
- 以技术实力服人
- 亲力亲为参与技术工作
- 主要管理技术团队
这个阶段的领导力是"专家型"的——基于专业能力的领导。
阶段二:创业领导者(2021-2023)
创立Minimax后,领导力需要升级。
新增能力需求:
- 愿景设定:定义公司的使命和方向
- 团队构建:吸引和留住各类人才
- 融资能力:与投资人沟通,获取资源
- 产品思维:从技术到产品的转化
领导方式:
- 更多时间用于战略和管理
- 开始授权,培养核心团队
- 跨职能领导,不只是技术
这个阶段的领导力是"创业型"的——在不确定性中开创事业的领导。
阶段三:组织领导者(2024-)
随着公司规模扩大,领导力需要再次升级。
新增能力需求:
- 组织设计:构建高效的组织结构
- 文化塑造:确保正确的价值观落地
- 人才发展:培养下一代领导者
- 生态思维:管理公司与外部的关系
领导方式:
- 更多时间用于"领导领导者"
- 关注系统和机制,而非具体事务
- 成为文化的守护者
这个阶段的领导力是"组织型"的——通过组织实现使命的领导。
进化的挑战
每一次进化都是挑战。
技术领导者可能不习惯"不做技术"。当需要把时间花在融资、管理、战略上时,可能会感到不适。
创业领导者可能不习惯"不亲力亲为"。当需要通过他人来实现目标时,可能会感到失控。
这些转变需要刻意的练习和调整,不是自然发生的。
闫俊杰的自我认知帮助他应对这些挑战:
"我知道自己需要改变。技术是我的舒适区,但公司的发展需要我走出舒适区。这不容易,但必须做。"
商业传记往往把领导者描绘成完美的英雄:永远自信、永远正确、永远掌控一切。
但真实的领导力不是这样的。
真实的领导力包含脆弱。
闫俊杰也有困惑的时刻:面对DeepSeek的冲击,也会问自己"我们是不是落后了?"
面对资本压力和内部质疑,也会感到疲惫和沮丧。
面对核心成员的离开,也会有失落和自我怀疑。
这些脆弱是真实的,也是人性的。
领导力不是没有脆弱,而是能够在脆弱中保持前行。
真实的领导力包含不确定。
很多决策没有明确的对错,只能在不完整信息下做出判断。
选择MoE架构时,不知道工程挑战能不能克服。
选择ToC优先时,不知道市场是否会接受。
选择坚持闭源时,不知道开源会不会成为主流。
领导力不是总是知道正确答案,而是能够在不确定中做出决断。
真实的领导力包含妥协。
不是每个决策都能坚持原则到底,有时候需要妥协。
与投资人的谈判中,可能需要接受一些不完美的条款。
与团队的协调中,可能需要放弃一些自己偏好的方案。
与市场的互动中,可能需要调整一些原本的计划。
领导力不是永不妥协,而是知道什么时候坚持、什么时候妥协。
真实的领导力是持续的修炼。
没有人天生就是完美的领导者。领导力是在实践中学习、在失败中成长的。
闫俊杰今天的领导力,是十几年积累的结果。而这个积累还在继续——他仍在学习、仍在进化。
作为本章的结尾,让我们从闫俊杰的经历中提炼一些关于领导力的反思:
反思一:领导力是可以学习的
领导力不是天赋,而是技能。虽然有些人可能更有潜质,但任何人都可以通过学习和实践提升领导力。
关键是:保持学习的心态,愿意走出舒适区,从每一次经历中提取教训。
反思二:领导力需要与角色匹配
不同的角色需要不同的领导力。技术团队的领导者和公司的创始人,需要的能力集合不同。
随着角色变化,领导力也需要进化。固守旧模式会成为发展的瓶颈。
反思三:自我约束是领导力的核心
权力会腐蚀人。没有自我约束的领导者,最终会伤害组织和自己。
建立约束机制——信息多元化、认知更新、权力边界、反馈渠道、使命锚定——是领导者的必修课。
反思四:矛盾的统一是领导力的高级形态
激进与克制、自信与谦逊、野心与耐心……这些看似矛盾的特质,需要在更高层次上统一。
能够把握这些平衡的领导者,比只有单一特质的领导者更加成熟和有效。
反思五:真实比完美更重要
不需要假装完美。承认脆弱、不确定和妥协,反而更能赢得信任。
团队需要的不是一个神,而是一个真实的、可以信赖的领导者。
-
领导力是让正确的事情发生的能力。 它包含方向、执行和通过他人实现目标三个层面。
-
领导力的高级形态是矛盾的统一。 激进与克制、自信与谦逊、野心与耐心——能够把握这些平衡才是成熟的领导力。
-
自我约束是防止权力腐蚀的关键。 建立信息多元化、认知更新、权力边界、反馈渠道和使命锚定等机制。
-
领导力需要随角色进化。 从技术领导者到创业领导者再到组织领导者,每次转变都需要新的能力。
-
真实的领导力包含脆弱、不确定和妥协。 承认这些真实的一面,比假装完美更能赢得信任。
-
领导力是持续修炼的过程。 没有人天生完美,通过学习和实践可以不断提升。
-
使命感是最终极的自我约束。 清晰的使命像锚一样,把领导者固定在正确的方向上。
【第四编完】
请输入"继续"以开始第五编第十五章:从Minimax提炼的创业法则
在深入探讨从Minimax提炼的创业法则之前,必须先说明一个前提:法则不是公式。
创业不是数学,没有放之四海而皆准的公式。每一家公司都有其独特的背景、资源、时机和挑战。适合Minimax的做法,不一定适合其他公司。
那么,提炼法则还有价值吗?
答案是肯定的,但价值不在于"照搬",而在于"启发"。
法则的价值在于:
- 提供思考的框架,而非现成的答案
- 揭示底层的逻辑,而非表面的做法
- 呈现可能的路径,而非唯一的道路
带着这个前提,让我们从Minimax的经历中提炼五条创业法则。
法则阐述
在AI时代,技术深度是商业成功的基础。
这不是说"只要技���好就能成功"——商业成功需要技术、产品、市场、运营等多种能力的组合。但如果技术不够深,其他能力再强也难以弥补。
为什么?
第一,技术是AI产品的核心体验。
与传统互联网产品不同,AI产品的核心价值直接来自于模型能力。用户使用ChatGPT、Talkie这类产品,体验的好坏直接取决于模型的智能程度。
如果模型不够聪明、经常犯错、响应太慢,用户体验就会很差,无论界面设计得多漂亮、运营做得多精细。
第二,技术壁垒是最持久的护城河。
商业模式可以被复制,产品功能可以被模仿,但深度的技术积累很难被快速追赶。
训练一个顶级大模型需要数年的积累:团队能力、数据资产、工程经验、know-how……这些不是有钱就能买到的。
第三,技术领先带来成本优势。
在AI领域,技术领先往往意味着效率更高、成本更低。更好的模型架构可以降低推理成本,更优的训练方法可以减少算力消耗。
这种成本优势在价格战中至关重要。
Minimax的实践
Minimax从一开始就把技术深度作为战略核心:
MoE架构的选择:
2021年选择MoE是一个激进的决定。当时MoE仍是前沿,工程风险很高。但闫俊杰判断这是通向更好模型的必由之路。
事后证明这个判断是正确的。MoE现在已成为大模型的主流选择,Minimax的早期积累转化为技术优势。
持续的技术投入:
即使在资金紧张、商业化压力大的时候,Minimax也保持了对基础技术的投入。
这种投入在短期内看不到回报,但长期形成了差异化能力——多模态、线性注意力、错误率控制……
技术人才的优先级:
在人才招聘上,技术人才始终是最高优先级。公司愿意为顶尖技术人才提供有竞争力的条件。
反例分析
市场上有很多创业公司选择了不同的路线:
- 使用开源模型,专注于应用层创新
- 做轻量级的应用,避开底层技术的投入
- 追求快速商业化,研发投入让位于销售
这些路线不一定是错的,但风险在于:当技术成为瓶颈时,没有能力突破。
如果依赖的开源模型被超越,应用层的优势也会消失。
如果底层能力不足,难以做出真正差异化的产品。
如果技术团队不够强,无法应对快速变化的竞争环境。
法则的边界
技术深度重要,但不是万能的。
技术需要转化为产品:再好的技术,如果不能转化为用户喜欢的产品,也创造不了商业价值。
技术选择需要适配资源:创业公司资源有限,不可能在所有技术方向上都做到最深。需要选择最核心的领域集中投入。
技术不能脱离市场:技术方向需要与市场需求匹配。做出很强的技术但没有市场需求,是资源的浪费。
法则阐述
最好的产品不是设计出来的,而是与用户共同创造出来的。
这个法则与传统的"产品经理中心论"不同。传统观点认为,优秀的产品经理能够洞察用户需求,设计出用户喜爱的产品。
但在AI时代,这种模式面临挑战:
第一,AI产品的复杂度远超传统产品。
传统互联网产品的功能相对确定,用户需求相对明确。AI产品的能力边界模糊,用户自己也不知道可以用它做什么。
产品经理很难提前预知所有的使用场景和需求。
第二,AI产品的体验高度个人化。
同一个AI产品,不同用户的使用方式和期待可能完全不同。一刀切的产品设计难以满足多样化的需求。
第三,AI产品需要持续学习和改进。
与传统产品不同,AI产品可以通过用户数据不断优化。用户反馈不只是改进的参考,更是模型进化的燃料。
因此,用户共创不是锦上添花,而是产品成功的必要条件。
Minimax的实践
Minimax把用户共创融入了产品开发的全流程:
规划阶段:倾听用户声音
在产品规划阶段,就开始收集用户反馈:
- 通过社区了解用户的痛点和期待
- 与核心用户进行深度访谈
- 分析用户行为数据,发现潜在需求
这些信息指导产品的方向选择和功能优先级。
开发阶段:快速验证假设
不是等到产品完善了再发布,而是用最小可用产品快速验证假设:
- 小范围灰度测试,收集真实反馈
- A/B测试不同的设计方案
- 根据数据快速调整方向
运营阶段:持续迭代优化
产品上线后,迭代不停止:
- 持续监控用户行为数据
- 快速响应用户反馈的问题
- 定期发布更新和改进
社区阶段:培养共创文化
建立活跃的用户社区:
- 让核心用户参与产品讨论
- 为用户贡献(如反馈bug、提出建议)提供激励
- 把用户当作产品团队的延伸
从"闭门造车"到"用户驱动"的范式转变
传统的产品开发是线性的:
需求分析 → 产品设计 → 开发测试 → 发布上线
用户共创的产品开发是循环的:
假设 → 构建 → 测量 → 学习 → 新假设 → ...
这种循环让产品能够快速适应用户需求的变化,而不是等到下一个大版本才能调整。
建立有效用户共创机制的具体步骤
对于想要实践用户共创的公司,以下是一些具体步骤:
步骤一:建立反馈渠道
- 产品内的反馈入口(要显眼、易用)
- 社交媒体的监控和互动
- 客服渠道的问题收集
- 定期的用户调研
步骤二:建立数据基础设施
- 用户行为追踪
- 数据分析平台
- A/B测试框架
- 实时监控仪表盘
步骤三:建立快速响应机制
- 问题分类和优先级排序
- 快速修复的流程
- 与用户沟通进展的机制
- 改进效果的验证
步骤四:建立社区运营
- 核心用户群的建立和维护
- 用户贡献的激励机制
- 产品团队与用户的直接对话
- 社区氛围的培养
步骤五:建立组织保障
- 产品、运营、技术的紧密协作
- 用户声音到达决策层的通道
- 对用户反馈快速响应的文化
法则阐述
在快速变化的市场中,组织的灵活性比规模更重要。
传统的商业智慧往往强调规模:更多的人、更多的资源、更大的市场份额。但在AI时代,这种逻辑需要重新审视。
规模的代价
组织规模扩大带来的不只是能力的增长,也有成本的增加:
沟通成本:人多了,协调的难度指数级增长。10个人的团队需要45条沟通线路,100个人需要4950条。
决策成本:层级多了,信息传递变慢,决策周期延长。市场在变,公司却在开会。
创新成本:官僚化侵蚀创新文化。流程变多、审批变长、试错空间变小。
文化成本:人多了,文化稀释,核心价值观难以传承。
轻量化的价值
轻量化组织的核心不是"人少",而是"高效"。目标是:用最少的人做最大的事。
轻量化带来的优势:
速度:决策快、执行快、迭代快。在AI行业,速度就是生命。
灵活性:方向调整容易,不会被庞大的组织惯性拖累。
专注:资源集中,避免分散。每个人都在做最重要的事。
文化:容易保持创业精神和创新氛围。
Minimax的实践
Minimax在规模扩张中始终坚持轻量化原则:
控制管理层级:
即使团队扩大到数百人,管理层级也保持在三到四层。避免过多的中间层级导致信息失真和决策缓慢。
小团队作战:
大项目拆分成小团队,每个团队有清晰的目标和充分的自主权。避免大团队带来的协调成本。
精简会议:
严格控制会议数量和时长。每增加一个固定会议,必须取消一个现有会议。会议必须有明确的目的和产出。
流程最小化:
只保留必要的流程,定期清理不必要的规章制度。流程是为了提高效率,而非增加官僚。
结果导向:
评估工作看产出,不看加班时长、会议出席率等形式指标。
轻量化组织的设计原则
对于想要实践轻量化的公司,以下是一些设计原则:
原则一:层级最小化
尽可能减少管理层级。如果某个层级只是"传话筒",就没有存在的必要。
原则二:授权充分化
把决策权下放到最接近问题的人。不需要层层审批,不需要事事请示。
原则三:团队自治化
每个团队有清晰的边界和目标,在边界内有充分的自主权。团队之间通过明确的接口协作。
原则四:流程必要化
每个流程都要问:这真的必要吗?能不能更简单?如果答案是否定的,就取消它。
原则五:沟通异步化
能用文档说清楚的事不开会。能异步沟通的事不同步。减少对面对面会议的依赖。
原则六:规模克制化
招人要克制。每增加一个人,都要问:这个人能带来的价值是否大于增加的协调成本?
轻量化的挑战
轻量化不是没有挑战:
能力密度要求高:人少意味着每个人都要很强。招聘标准必须严格。
管理能力要求高:扁平化不是没有管理,而是需要更高级的管理——通过目标和文化来管理,而非通过命令和控制。
规模化的矛盾:当业务快速增长时,如何在扩张团队的同时保持轻量化?这是永恒的挑战。
但这些挑战是值得面对的。在AI时代,轻量化带来的速度和灵活性优势,往往大于规模带来的资源优势。
法则阐述
开源与闭源不是非此即彼的选择,而是可以辩证统一的策略。
这个法则来自于DeepSeek冲击后的深刻反思。DeepSeek的成功证明了开源模式的可行性,但这不意味着闭源就没有价值。
开源的价值
- 生态建设:开源可以吸引开发者,形成生态
- 品牌影响力:开源项目可以建立技术声誉
- 社区贡献:开源可以获得社区的改进和反馈
- 人才吸引:优秀的开源项目可以吸引顶尖人才
- 降低壁垒:开源降低了用户的使用门槛和担忧
闭源的价值
- 技术保护:核心技术不被竞争对手复制
- 商业化支撑:通过技术差异化支撑定价
- 质量控制:对产品质量和安全有完全的控制
- 战略灵活:保留未来开源的选项
辩证统一的策略
成熟的策略不是"全开源"或"全闭源",而是根据具体情况选择:
基础能力可以开源,差异化能力保持闭源:
基础模型能力逐渐商品化,开源可以获得生态优势。但核心的差异化技术(如多模态融合、特定场景优化)可以保持闭源,作为竞争壁垒。
通用模型可以开放,垂直应用保持封闭:
通用的基础模型可以开放给社区,但针对特定行业或场景的优化模型可以保持封闭,支撑商业化。
技术可以开源,产品保持闭源:
模型可以开源,但构建在模型之上的完整产品体验保持闭源。因为产品能力(设计、运营、数据)是很难通过开源复制的。
Minimax的调整
面对开源浪潮,Minimax调整了策略:
- 更加灵活地看待开源,不再固守纯闭源立场
- 探索在某些领域部分开源,扩大生态影响力
- 强化"模型+产品"的一体化能力,这是无论开源还是闭源都需要的竞争力
启示:技术主权与商业现实的平衡
开源与闭源的选择,最终是关于"技术主权"与"商业现实"的平衡:
- 完全闭源可能保护技术,但可能失去生态
- 完全开源可能获得生态,但可能失去商业化空间
没有唯一正确的答案,需要根据公司的战略定位、竞争格局和发展阶段来选择。
关键是:保持灵活,不被教条束缚。
法则阐述
长期主义常常被描述为一种"高尚的选择"——为了长远利益而放弃短期诱惑,这需要道德上的自律和克制。
但在AI时代,长期主义更应该被理解为一种生存策略——不是因为"应该"长期主义,而是因为"必须"长期主义。
为什么"赚快钱"在AI时代是死路?
原因一:技术积累需要时间
大模型的能力积累是以年为单位的。训练经验、数据资产、工程能力……这些都需要时间沉淀。
追求快速变现的公司,往往会把资源投入到短期能赚钱的方向,忽视长期的技术积累。几年后,技术落后,竞争力丧失。
原因二:用户信任需要时间
AI产品涉及用户的隐私、决策、工作……建立信任需要时间。
追求快速增长的公司,往往会采用激进的营销手段、过度的承诺、甚至损害用户利益的做法。短期内可能获得用户,但长期会失去信任。
原因三:人才留存需要时间
顶尖人才不只看薪酬,也看公司的愿景和文化。
追求短期利益的公司,往往无法吸引和留住最优秀的人才。没有好的人才,长期竞争力无从谈起。
原因四:市场格局需要时间形成
AI市场仍在早期,最终的格局尚未确定。
追求短期变现的公司,可能在某个细分市场获得短期成功,但错失了更大的机会。长期来看,赢家是那些在正确方向上持续投入的公司。
拒绝资本炒作,坚持模型创新
长期主义的一个具体表现是:拒绝资本炒作。
AI领域不乏炒作的案例:
- 夸大技术能力,制造虚假繁荣
- 追逐热点概念,不管实际价值
- 为了融资讲故事,不考虑能否实现
这些做法可能短期内推高估值,但长期会反噬。
DeepSeek提供了一个正面案例:低调做事,用实力说话。没有铺天盖地的PR,但当产品发布时,实力让所有人震惊。
Minimax的做法类似:专注于模型创新和产品价值,而非资本游戏。
建立长期主义决策框架
对于想要实践长期主义的公司,以下是一个决策框架:
问题一:这件事五年后还有价值吗?
如果答案是否定的,即使短期收益很高,也要谨慎。
问题二:这件事会积累什么?
好的事情会积累能力、用户、数据、品牌……积累越多,长期价值越高。
问题三:这件事会损害什么?
有些事情会损害信任、文化、人才……这些损害往往是不可逆的。
问题四:如果竞争对手在做长期投入,我们不做会怎样?
长期主义是竞争的一部分。如果别人在积累,你在消耗,时间会拉开差距。
问题五:这是恐惧驱动还是贪婪驱动?
恐惧驱动的决策(如"不赚钱会死")和贪婪驱动的决策(如"这个热点能赚一笔")往往是短视的。
这五条法则不是孤立的,而是相互关联的:
技术深度是基础——没有技术,其他都是空中楼阁。
用户共创是方法——把技术转化为用户价值的路径。
轻量化组织是保障——确保能够快速、高效地执行。
开源闭源辩证是策略——在生态与壁垒之间寻找平衡。
长期主义是心法——贯穿所有决策的核心理念。
这五条法则共同构成了一个创业的方法论框架。它不是公式,不能机械套用,但可以作为思考问题的起点。
每一个创业者都需要根据自己的情况,发展出适合自己的法则和框架。Minimax的经验是一个参考,但不是唯一的答案。
-
法则不是公式,而是思考的框架。 不能机械套用,但可以启发思考。
-
技术深度决定商业高度。 在AI时代,技术是核心体验、持久护城河和成本优势的来源。
-
用户共创是必要条件而非锦上添花。 最好的产品是与用户共同创造的,而非闭门设计的。
-
轻量化组织是创新的必要条件。 速度和灵活性比规模更重要。
-
开源与闭源可以辩证统一。 根据具体情况选择,不被教条束缚。
-
长期主义是生存策略而非道德选择。 在AI时代,短期主义是死路。
-
五条法则相互关联,构成完整的方法论框架。 技术是基础,用户是方法,组织是保障,开闭源是策略,长期主义是心法。
【本章完】
请输入"继续"以开始第十六章:创始人个人成长的底层逻辑
创业的本质是什么?
很多人会回答:创造价值、解决问题、实现愿景、获取财富……
这些答案都对,但有一个更底层的答案:创业是创始人个人成长的过程。
公司的天花板就是创始人的天花板。
如果创始人的认知、能力、格局不能持续提升,公司的发展就会触顶。反之,如果创始人能够不断成长,公司就有可能突破一个又一个瓶颈。
闫俊杰的创业历程,就是一个持续成长的故事:
- 从技术专家到创业者
- 从管理者到领导者
- 从执行者到战略家
- 从个人贡献者到组织建设者
这些转变不是自然发生的,而是通过刻意的努力、痛苦的蜕变实现的。
理解创始人成长的底层逻辑,对于任何希望成长的人都有借鉴价值。
创始人的成长,首先体现在认知的升级。
借用禅宗的经典表述,认知升级可以分为三重境界:
第一重境界:见山是山
这是初级阶段的认知状态。
在这个阶段,创始人用单一维度理解问题。对于技术背景的创始人,这个维度通常是"技术"。
典型特征:
- 相信技术可以解决一切问题
- 用技术指标衡量成功
- 对非技术因素(商业、组织、政治)不够重视
- 决策依据主要是技术可行性
闫俊杰在商汤早期可能就处于这个阶段。作为一线研究员和技术管理者,他的关注点主要是:模型性能如何提升?技术难题如何攻克?
这个阶段的优势是专注——深入钻研一个领域,建立专业能力。
这个阶段的局限是狭隘——看不到技术之外的因素,对复杂系统的理解不足。
第二重境界:见山不是山
这是中级阶段的认知状态。
在这个阶段,创始人开始意识到事物的复杂性,发现"技术"只是众多维度之一。
典型特征:
- 意识到技术不是万能的
- 开始理解商业、组织、市场的重要性
- 发现很多问题没有标准答案
- 决策需要权衡多个维度
闫俊杰在商汤后期和Minimax早期可能经历了这个阶段。他开始看到:
- 技术好不等于商业成功(商汤的商业化困境)
- 个人能力强不等于团队成功(需要组织能力)
- 做对事情不等于做成事情(需要执行和运营)
这个阶段的感受往往是困惑和迷茫——原来以为确定的东西变得不确定了,原来以为简单的问题变得复杂了。
但这种困惑是成长的必经阶段。只有承认不知道,才能开始真正的学习。
第三重境界:见山还是山
这是高级阶段的认知状态。
在这个阶段,创始人重新获得清晰和确定,但这种清晰是建立在对复杂性充分理解之上的。
典型特征:
- 能够在复杂中看到简单的本质
- 能够在众多维度中识别关键变量
- 能够在不确定中保持坚定的方向
- 决策既考虑多维度,又有清晰的优先级
闫俊杰在Minimax成熟期可能逐渐进入这个阶段:
- 技术很重要,但最终服务于用户价值
- 商业化很重要,但不能牺牲长期发展
- 组织很重要,但保持轻量化
- 竞争很重要,但走自己的路
这个阶段的特征是简洁而深刻。不是因为无知而简单,而是因为洞察而简单。
三重境界的转换不是一次性的,而是循环往复的。每进入一个新领域,都需要重新经历这个过程。
认知升级需要具体能力的支撑。创始人需要哪些关键能力?如何养成这些能力?
能力一:抽象能力
抽象能力是从具体现象中提取本质规律的能力。
为什么重要?
创业中遇到的问题千变万化,但底层的规律是有限的。能够抽象的人,可以举一反三,用有限的知识应对无限的情况。
闫俊杰的抽象能力来源:
数学训练:数学是抽象思维的最佳训练场。从公理出发推导定理,从具体数字抽象到代数符号,从二维空间推广到n维空间……
跨领域迁移:从数学到通信工程,从学术研究到产业应用,从技术管理到公司创业——每一次跨越都需要抽象出可迁移的原理。
刻意练习:面对任何问题,都习惯性地问:这个问题的本质是什么?和其他问题有什么共同点?有没有更一般的规律?
如何培养抽象能力:
- 学习数学、逻辑学、系统论等基础学科
- 阅读跨领域的书籍,寻找不同领域的共同规律
- 养成"追问本质"的思维习惯
- 尝试用简单的模型解释复杂的现象
能力二:共情能力
共情能力是理解他人感受和需求的能力。
为什么重要?
创业涉及大量的人际互动:理解用户需求、激励团队成员、说服投资人、与合作伙伴协作……共情能力是这些互动成功的基础。
闫俊杰的共情能力来源:
外公的故事:理解外公想写书却不会打字的遗憾,这是对"普通人需求"的深刻共情。
用户接触:持续与用户接触,阅读用户反馈,理解用户的真实痛点和期待。
团队互动:作为管理者,需要理解不同团队成员的动机和困难,因人而异地激励和支持。
如何培养共情能力:
- 刻意地站在他人角度思考问题
- 多与不同背景的人交流,扩大理解的范围
- 阅读文学作品,体验不同人生
- 练习倾听,而不是急于表达
能力三:抗压能力
抗压能力是在巨大压力下保持有效运作的能力。
为什么重要?
创业充满压力:融资压力、竞争压力、业绩压力、团队压力……如果无法承受压力,就无法走完创业的马拉松。
闫俊杰的抗压能力来源:
早年经历:在资源匮乏的县城成长,习惯了在困境中找到出路。
商汤历练:经历过商汤从创业到上市的完整周期,见过各种危机和挑战。
心理建设:建立了稳定的自我认知,知道自己为什么做这件事,知道困难是暂时的。
如何培养抗压能力:
- 逐步增加挑战的难度,在压力中积累经验
- 建立支持系统(家人、朋友、导师),在困难时获得支持
- 培养健康的生活习惯,保持身心状态
- 建立清晰的使命感,在困难时有锚定点
能力四:学习能力
学习能力是快速获取新知识、新技能的能力。
为什么重要?
AI领域变化极快,今天的先进技术明天就可能落后。如果不能持续学习,就会被时代淘汰。
闫俊杰的学习能力来源:
学术训练:从本科到博士后,十几年的学术训练养成了系统学习的习惯和能力。
跨界经历:从数学到通信到AI,从学术到产业,每一次跨越都是学习的过程。
主动态度:保持好奇心,主动追踪新技术、新趋势、新思想。
如何培养学习能力:
- 建立持续学习的习惯(每天阅读、定期上课、参加活动)
- 学习"如何学习"的方法论
- 保持谦逊,承认不知道
- 把每一次挑战都当作学习的机会
能力五:决策能力
决策能力是在不确定条件下做出有效选择的能力。
为什么重要?
创始人每天都要做大量决策。决策的质量直接决定公司的命运。
闫俊杰的决策能力来源:
决策实践:十几年的管理经历积累了大量决策经验。
系统框架:建立了系统的决策框架(技术可行性、商业可持续性、组织承载力、长期价值)。
反馈学习:对决策结果进行复盘,从对错中学习。
如何培养决策能力:
- 刻意练习决策,即使是小事也认真分析
- 建立决策框架,系统化地思考问题
- 复盘决策结果,积累经验
- 接受决策的不确定性,不追求完美
创始人的成长不只是能力的提升,也涉及价值观的演变。
有趣的是,价值观的演变呈现出"稳定性与适应性"的辩证关系。
价值观中不变的部分
某些核心价值观从早年形成后就保持稳定,贯穿整个创业历程:
技术普惠的初心:
从外公的遗憾到Minimax的愿景,"让AI帮助普通人"这个信念始终没变。
无论是做研究还是做产品,无论是在商汤还是在Minimax,这个初心是一贯的。
独立解决问题的精神:
从县城少年到创业者,"靠自己想办法"的精神始终没变。
遇到困难不等待救援,而是主动寻找解决方案。
追求卓越的态度:
从学术研究到公司管理,追求卓越的态度始终没变。
不满足于"够用",而是追求"最好"。
这些不变的价值观是闫俊杰的"锚"。无论外部环境如何变化,这些价值观提供了稳定的参照系。
价值观中变化的部分
另一些价值观随着经历和认知而演变:
对商业化的态度:
早期可能更偏向"技术至上",认为商业化会损害技术纯粹性。
后来认识到商业化是技术价值实现的必要路径,态度变得更加务实。
对竞争的理解:
早期可能更关注"自己做对",对竞争对手关注较少。
后来认识到竞争是市场的常态,需要持续关注和应对。
对组织的认知:
早期可能更强调个人能力和技术团队。
后来认识到组织能力是公司发展的关键瓶颈。
这些变化的价值观反映了认知的升级和适应。
如何把握稳定与变化的平衡
核心价值观需要保持稳定,因为它们是身份认同和行动指南。如果核心价值观经常变化,就会失去方向。
但具体的态度和方法需要根据环境调整,因为外部世界在变化。如果一成不变,就会与现实脱节。
判断一个价值观是"核心"还是"边缘"的标准:
- 核心价值观回答"我是谁"和"我为什么存在"
- 边缘价值观回答"我如何做事"和"我如何应对特定情况"
核心价值观要稳定,边缘价值观要灵活。
成长不是匀速的,而是有加速期和平台期。
什么因素可以催化成长?
催化剂一:关键挑战
成长往往发生在面对重大挑战的时候。
对闫俊杰而言,几个关键挑战可能催化了显著成长:
- 创业决定:离开商汤自立门户,迫使他从"执行者"转变为"创业者"
- 融资过程:与投资人博弈,迫使他学会"讲故事"和"管理预期"
- 团队管理:从几十人到几百人,迫使他学会"通过他人实现目标"
- 外部冲击:DeepSeek的崛起,迫使他重新审视战略假设
挑战越大,成长越快。当然,挑战太大也可能导致失败。关键是找到"略超能力边界"的挑战。
催化剂二:关键反馈
成长需要反馈。没有反馈,就不知道自己做对了什么、做错了什么。
有效反馈的来源:
- 市场反馈:产品的用户数据直接反映了决策的对错
- 团队反馈:核心团队的坦诚意见揭示了领导力的问题
- 投资人反馈:投资人的质疑逼迫更严格地审视假设
- 竞争对手反馈:竞争对手的成功揭示了自己的盲区
- 自我反馈:定期复盘反思自己的行为和决策
催化剂三:关键导师
导师可以显著加速成长。
导师的价值在于:
- 分享经验,避免重复犯错
- 提供视角,帮助看到盲区
- 情感支持,在困难时给予鼓励
- 网络资源,介绍有价值的连接
闫俊杰可能的导师来源:
- 商汤时期的领导和同事
- 投资人中的资深人士
- 行业中的前辈企业家
- 学术界的导师和同行
催化剂四:关键阅读
书籍是人类智慧的结晶,阅读是最高效的学习方式之一。
闫俊杰作为学术出身的创业者,阅读可能是其重要的成长来源:
- 技术领域的最新论文和研究
- 商业和管理的经典著作
- 传记和历史,学习前人的经验
- 哲学和思维方法论
催化剂五:关键失败
失败是最好的老师。
每一次失败都揭示了认知的盲区。如果能够认真反思,失败可以转化为成长。
关键是:
- 承认失败,不找借口
- 分析原因,不浮于表面
- 提炼教训,形成原则
- 应用改进,避免重蹈覆辙
与催化剂相对的,是成长的障碍。识别这些障碍,才能有意识地克服。
障碍一:成功的陷阱
成功是最危险的障碍。
成功会强化既有认知:"我之所以成功,是因为我的判断是对的。"
这种强化会导致:
- 过度自信,不再质疑假设
- 路径依赖,用老方法应对新问题
- 忽视变化,对环境变化反应迟钝
应对方法:
- 始终保持"学生心态"
- 主动寻找反对意见
- 定期回顾成功的原因,区分能力与运气
障碍二:忙碌的陷阱
创业者总是很忙。
但忙碌可能成为不成长的借口:"我太忙了,没时间学习/反思/读书。"
实际上,越忙越需要成长。不成长,忙碌就会变成无效的重复。
应对方法:
- 把学习和反思作为优先事项,而不是"有空再说"
- 建立固定的学习时间(每天30分钟、每周半天)
- 在忙碌中寻找学习机会(每个项目都是学习案例)
障碍三:舒适区的陷阱
人倾向于待在舒适区。
对技术背景的创始人,舒适区可能是技术工作。在那里,他们感到自信和掌控。
但成长发生在舒适区之外。不走出去,就无法获得新的能力。
应对方法:
- 识别自己的舒适区边界
- 刻意选择让自己不舒服的挑战
- 接受不舒服是成长的正常代价
障碍四:孤独的陷阱
创始人往往很孤独。
这种孤独可能导致:
- 没有人可以坦诚交流困惑
- 没有人提供不同视角
- 没有人给予情感支持
应对方法:
- 建立支持网络(同行创业者、导师、教练)
- 参加创业者社群
- 与家人和朋友保持连接
最后,提炼几条成长的心法:
心法一:相信可成长性
成长的前提是相信自己可以成长。
有些人持"固定心态"——相信能力是固定的,聪明就是聪明,笨就是笨。
有些人持"成长心态"——相信能力可以通过努力发展,今天不会的明天可以学会。
研究表明,持成长心态的人更愿意接受挑战、更能从失败中学习、最终成长更快。
心法二:拥抱不舒服
成长必然伴随不舒服。
学习新东西意味着承认无知,接受挑战意味着可能失败,走出舒适区意味着感受不适。
不要逃避这种不舒服,而是把它当作成长的信号。
心法三:持续而非间歇
成长是一个持续的过程,而非间歇的事件。
不是"等有空了再学习",而是"每天都在学习"。
不是"遇到问题再反思",而是"持续地反思"。
小步累积,日积月累。
心法四:整合而非割裂
成长不是抛弃旧的自己,而是整合新的能力。
技术能力不需要被抛弃,而是要与商业能力、组织能力整合。
早年的价值观不需要被否定,而是要与新的认知整合。
整合创造了更丰富、更有层次的能力结构。
心法五:服务于使命
成长不是目的本身,而是服务于更大使命的手段。
闫俊杰的成长服务于"让AI普惠大众"的使命。
这种使命导向让成长有了方向和意义,也让成长有了持续的动力。
-
创业的本质是创始人的成长。 公司的天花板就是创始人的天花板。
-
认知升级经历三重境界:见山是山、见山不是山、见山还是山。 从简单到复杂,再从复杂中看到简单的本质。
-
关键能力包括:���象能力、共情能力、抗压能力、学习能力、决策能力。 这些能力都可以通过刻意练习来培养。
-
价值观需要平衡稳定性与适应性。 核心价值观保持稳定,边缘价值观灵活调整。
-
成长的催化剂:关键挑战、关键反馈、关键导师、关键阅读、关键失败。 这些因素可以加速成长。
-
成长的障碍:成功的陷阱、忙碌的陷阱、舒适区的陷阱、孤独的陷阱。 识别并有意识地克服这些障碍。
-
成长的心法:相信可成长性、拥抱不舒服、持续而非间歇、整合而非割裂、服务于使命。 这些心法指导成长的过程。
【本章完】
请输入"继续"以开始第十七章:对年轻创业者与技术人才的启示
如果你正在考虑创业,或者已经在创业的路上,闫俊杰的经历可以提供一些有价值的参考。
但首先要声明:没有人的经历可以被复制。
闫俊杰的成功源于他独特的背景、时机、能力和选择的组合。你有你自己的背景、时机、能力和选择。你需要找到属于自己的道路。
以下的建议不是"成功公式",而是"思考的起点"。
建议一:先深后广——建立技术护城河再谈商业化
很多创业者有一种冲动:想要快速做出产品、快速获取用户、快速实现盈利。
这种冲动是可以理解的——创业有时间窗口,资金会耗尽,投资人会施压。
但在AI时代,过早追求商业化可能是一个陷阱。
为什么?
AI产品的核心价值来自于模型能力。如果模型能力不够强,产品体验就会很差。用户可能会因为好奇尝试一下,但不会留下来。
更重要的是,AI领域的竞争最终是技术的竞争。如果技术不够深,当竞争对手用更强的技术进入时,你会毫无还手之力。
Minimax的做法是:
从一开始就把技术深度作为战略核心。选择MoE这样的前沿架构,坚持多模态布局,持续投入基础研究——即使这些在短期内看不到商业回报。
这种"先深后广"的策略在早期可能显得"慢",但它建立了真正的技术壁垒。当产品推向市场时,技术优势转化为用户体验的优势,转化为持久的竞争力。
对你的启示:
- 不要急于追求商业化,先问自己:我的核心技术优势是什么?
- 在最核心的技术领域追求深度,而不是在多个领域追求广度
- 抵制"快速变现"的诱惑,这种诱惑往往以牺牲长期竞争力为代价
- 找到愿意等待的投资人,而不是催促你快速变现的投资人
建议二:用户为师——让真实需求驱动技术方向
技术人员创业有一个常见的陷阱:用技术思维定义问题。
"我有一个很酷的技术,找个场景应用一下。"
这种思路的问题在于:技术很酷不等于用户需要。很多技术上令人惊叹的产品,用户根本不买账。
正确的思路是:从用户需求出发,用技术来满足需求。
这需要一种"谦逊"的态度——承认自己不知道用户需要什么,需要去了解、去验证。
Minimax的做法是:
建立用户共创的机制:
- 在产品规划阶段就征求用户意见
- 快速发布MVP,收集真实反馈
- 持续监控用户行为数据
- 建立活跃的用户社区
Talkie的成功不是因为团队事先知道"AI社交"是正确的方向,而是通过不断地尝试和迭代,发现了这个被忽视的需求。
对你的启示:
- 放下"我知道用户需要什么"的假设,真正去倾听用户
- 尽早让用户接触产品,即使产品还不完善
- 把用户反馈当作最重要的信息来源
- 愿意根据用户反馈调整方向,即使这意味着放弃之前的假设
- 记住:用户不是来买技术的,他们是来解决问题的
建议三:组织先行——在扩张前建立可复制的创新机制
创业公司的成长往往遵循这样的模式:
早期,几个创始人凭借个人能力创造奇迹。
中期,团队扩大,但组织能力跟不上,出现混乱和低效。
后期,要么建立起组织能力,要么在混乱中衰落。
很多公司在第二阶段就栽了跟头。
为什么会这样?
因为个人能力是不可扩展的,但组织能力是可以扩展的。
当公司只有10个人时,创始人可以事事亲力亲为。当公司有100个人时,这就不可能了。如果没有建立起组织机制,公司就会陷入"创始人瓶颈"。
Minimax的做法是:
从早期就有意识地建立组织机制:
- 轻量化组织结构,避免官僚化
- 数据驱动的决策方式,减少主观臆断
- 清晰的人才标准,确保招聘质量
- 坦诚直接的文化,让问题能够浮出水面
这些机制不是等公司变大后再建立的,而是从一开始就在打造的。
对你的启示:
- 不要等公司变大后才考虑组织问题,从第一天就开始建立好的习惯
- 建立可复制的机制,而不是依赖不可复制的个人能力
- 在招聘时就考虑候选人能否融入团队,而不只是个人能力
- 有意识地培养未来的领导者,而不是把所有决策都留给自己
- 定期审视组织是否健康,及早发现和解决问题
如果你是一个技术从业者,正在考虑自己的职业发展,闫俊杰的经历也有一些启示。
启示一:在AI时代,技术深度比广度更重要
技术领域有一个永恒的争论:应该做"全栈工程师",还是做"领域专家"?
这个问题没有绝对的答案,但在AI时代,深度的价值在上升。
为什么?
AI是一个复杂的领域。从数学基础到模型架构,从训练技术到推理优化,从数据工程到产品应用——每一个环节都有大量的know-how。
表面上了解一点AI的人很多,但真正深入理解的人很少。这种深度的稀缺性,决定了它的价值。
更重要的是,AI的发展速度极快。如果只是浅尝辄止,今天学的知识明天就过时了。只有深入到底层原理,才能应对变化。
闫俊杰的路径是:
从数学本科开始,到通信工程硕士,到模式识别博士,到清华博后——每一步都在加深对智能系统的理解。
在商汤的七年,不是频繁换方向,而是在AI领域持续深耕。
这种深度的积累,让他在创业时有了技术判断力,能够做出正确的技术选择(如MoE架构)。
对你的启示:
- 选择一个有长期价值的领域,深入钻研
- 不要被"新技术"带着跑,先把基础打扎实
- 建立从理论到工程的完整能力,而不只是会用工具
- 技术深度是职业的护城河,值得持续投入
启示二:理解商业——技术价值需要商业闭环来验证
很多技术人员有一种倾向:专注于技术本身,忽视商业价值。
"我的算法效果很好"——但用户愿意付费吗?
"我的系统很优雅"——但能解决商业问题吗?
"我的论文发了顶会"——但能转化为产品吗?
这种倾向在学术界可能没问题,但在产业界会成为瓶颈。
为什么理解商业很重要?
技术的价值最终需要通过商业来实现。一个无法商业化的技术,无论多么精妙,对公司来说都是成本,而不是资产。
更重要的是,商业视角可以帮助你做出更好的技术选择。当你理解了用户需求和商业模式,你就能判断哪些技术问题真正重要,哪些只是"有趣但不必要"。
闫俊杰的转变是:
从学术研究者到产业技术专家,再到创业者,他逐渐发展出商业思维。
"技术先进性不等于商业成功"——这个认知来自于商汤的经历。
"错误率是AI产品的生命线"——这个判断来自于对用户体验的理解。
对你的启示:
- 了解你所在公司的商业模式,理解技术如何创造商业价值
- 与产品、销售、运营等非技术部门交流,理解他们的视角
- 阅读商业书籍和案例,培养商业直觉
- 思考:我的技术工作如何帮助公司赚钱?如何为用户创造价值?
启示三:保持耐心——AGI是马拉松,不是百米冲刺
AI领域充满了炒作和焦虑:
"某某公司融了巨额资金,我是不是落后了?"
"某某模型刷新了记录,我的研究是不是没用了?"
"某某热点出现了,我是不是应该跟进?"
这种焦虑可以理解,但往往是有害的。
为什么需要耐心?
AGI的实现是一个长期过程。虽然近年来进展迅速,但离真正的通用智能还有很长的路。
在这个过程中,最终胜出的不是跑得最快的人,而是跑得最稳、最持久的人。
追逐热点会消耗精力,频繁换方向会失去积累,焦虑会影响判断。
闫俊杰的态度是:
长期主义。
不追逐热点,坚持自己的技术路线。
不被短期噪音干扰,专注于长期价值。
"坚持创新而非短期变现"——这个原则指导了Minimax的战略。
对你的启示:
- 不要被每天的新闻带着跑,保持长期视角
- 选择有持久价值的方向,持续深耕
- 建立自己的判断力,而不是随波逐流
- 接受成长需要时间,不要期望一夜成功
- 把注意力放在自己能控制的事情上(学习、工作质量),而不是不能控制的事情上(市场波动、他人评价)
如果你是一个AI研究者,无论在学术界还是产业界,有一些更具体的建议。
建议一:关注错误率——从追求SOTA到追求可用性
学术界的成功标准是"SOTA"(State of the Art)——在某个benchmark上刷出最高的分数。
这个标准有其价值,但也有局限。
局限在哪里?
Benchmark不等于真实场景。一个模型在ImageNet上表现优秀,放到真实环境中可能一塌糊涂。
Benchmark会被"过拟合"。当所有人都在刷同一个benchmark时,模型可能变成了"benchmark解题机",而非真正的智能。
更重要的是,用户不关心你的排名,用户关心你的产品能不能用。
闫俊杰的关注点是:
错误率。
"当前大模型的错误率大概在20-30%左右。我们的目标是把错误率降低一个数量级。"
这个指标直接关系到用户体验。如果每三五次使用就出一次错,用户怎么敢信任?
对你的启示:
- 不要只追求benchmark分数,思考真实场景中的表现
- 关注模型的"下限"(最差情况)而不只是"上限"(最好情况)
- 研究如何降低错误率、提高可靠性,这可能比提高SOTA更有价值
- 尝试在真实场景中测试你的研究,而不只是在实验室环境中
建议二:拥抱多模态——未来属于理解真实世界的研究
当前AI研究的主流是单模态的:语言模型处理文本,视觉模型处理图像,语音模型处理音频……
但真实世界是多模态的。人类同时使用视觉、听觉、语言来理解世界。
为什么多模态重要?
单模态的AI只能理解世界的一个切片。它可能在特定任务上表现出色,但缺乏对世界的整体理解。
真正的通用智能必须是多模态的。它需要能看、能听、能说、能读——并且能够整合这些信息。
多模态也是应用的需要。用户与AI交互的方式越来越多样:语音、图像、视频……单模态的系统无法满足这些需求。
Minimax的布局是:
从一开始就坚持多模态:文本到文本、文本到语音、文本到视觉……
"三位一体"的技术架构:语言模型核心、感知模块、生成模块。
这种布局让Minimax的产品能够提供差异化的用户体验。
对你的启示:
- 如果你在单模态领域工作,考虑扩展到多模态
- 关注模态融合的研究,这是前沿也是难点
- 思考如何让AI更完整地理解真实世界,而不只是特定类型的数据
- 多模态研究有更大的应用潜力,值得投入
建议三:思考技术平权——AGI的终极形态
AI研究的最终目的是什么?
不同的人有不同的回答。有人说是创造智能,有人说是理解大脑,有人说是推动科学……
闫俊杰的回答是:让AI普惠大众。
这个回答有深刻的价值观内涵。它意味着AI不应该只服务于精英,而应该帮助每一个普通人。
为什么技术平权重要?
历史上,很多技术最初都是精英的玩具,后来才普及到大众:电脑、手机、互联网……
但技术从精英到大众的过程往往很长。如果研究者不主动考虑普惠性,技术可能长期停留在"少数人的工具"阶段。
更重要的是,技术平权是AI的社会责任。AI可能是人类历史上最强大的技术之一。如果这种技术只服务于少数人,将加剧不平等。如果它能服务于所有人,将带来巨大的社会价值。
对你的启示:
- 在研究中考虑:这项技术如何帮助普通人?
- 关注降低技术门槛的研究:更低的成本、更简单的使用方式
- 思考开源的价值:开源可以加速技术的普及
- 考虑AI的社会影响,而不只是技术指标
- 记住:最有价值的研究,是那些能够改变普通人生活的研究
最后,分享一些超越创业和技术的普遍性人生建议。这些建议来自于对闫俊杰经历的反思,但适用于任何追求成长的人。
建议一:找到你的"外公故事"
闫俊杰的创业初心来自于一个私人故事:外公想写书却不会打字的遗憾。
这个故事不是抽象的理念,而是具体的画面、真实的情感。它提供了持久的动力和清晰的方向。
你有这样的故事吗?
每个人都应该追问:是什么驱动着我?我为什么做这件事?
答案可能是一个童年经历,一次触动心灵的事件,一个你想帮助的人……
找到这个故事,它会成为你最深层的动力来源。
建议二:选择略超能力边界的挑战
成长发生在舒适区之外。
但如果挑战太大,会导致失败和挫败感。如果挑战太小,无法带来成长。
最佳的状态是:挑战略超出当前能力边界。
这意味着:会感到不舒服,但可以应对。会遇到困难,但可以克服。
如何找到这种挑战?
- 主动寻求新的项目和责任
- 不要等着被分配,主动争取机会
- 当机会来临时,不要因为"可能做不好"而拒绝
- 相信自己可以在过程中学习和成长
建议三:建立你的支持系统
创业是孤独的,成长也是艰难的。
没有人能独自完成这一切。你需要支持系统:
- 导师:能够指引方向、分享经验
- 同行:能够相互学习、相互鼓励
- 家人朋友:能够提供情感支持
- 社区:能够获取资源、扩大网络
如何建立支持系统?
- 主动寻找导师,不要等着别人来指导你
- 参与专业社区,与同行建立联系
- 维护与家人朋友的关系,不要因为忙碌而忽视
- 愿意帮助别人,支持是相互的
建议四:保持"学生心态"
成功是成长的最大敌人。
一旦成功,人就容易变得封闭:相信自己的判断,不再质疑假设,不再接受新观点。
对抗这种趋势的方法是:始终保持学生心态。
学生心态意味着:
- 承认自己不知道的比知道的多
- 对新知识保持好奇和开放
- 愿意向任何人学习,无论他们的地位
- 把每一次经历都当作学习的机会
闫俊杰至今仍在学习。DeepSeek的冲击让他重新审视对开源和效率的认知。他没有因为自己是创始人就停止学习。
建议五:长期思考,短期行动
这是长期主义的操作化表达。
长期思考意味着:
- 有清晰的长期目标和愿景
- 用长期价值来评判决策
- 不被短期波动带偏
短期行动意味着:
- 每天都在朝目标前进
- 快速执行,快速迭代
- 不空想,用行动来验证
两者的结合是:用长期目标指引方向,用短期行动积累进展。
这比"只看长期不做短期"或"只做短期不看长期"都更有效。
创业是一场冒险,成长是一生的旅程。
闫俊杰的故事提供了一个参考,但不是模板。
每个人都有自己的故事要写。你的背景、你的能力、你的时机、你的选择,都是独特的。
从他人的经历中,提取智慧;在自己的道路上,创造未来。
祝你在这场旅程中,找到属于你的意义。
-
对创业者:先深后广、用户为师、组织先行。 这三条建议涵盖了技术、产品和组织三个关键维度。
-
对技术从业者:技术深度、商业理解、保持耐心。 这三条建议帮助技术人员在职业发展中做出更好的选择。
-
对AI研究者:关注错误率、拥抱多模态、思考技术平权。 这三条建议指向有更大价值和影响力的研究方向。
-
普遍性建议:找到你的故事、选择合适的挑战、建立支持系统、保持学生心态、长期思考短期行动。 这些建议适用于任何追求成长的人。
-
每个人的道路都是独特的。 从他人经历中提取智慧,但在自己的道路上创造未来。
【本章完】
请输入"继续"以开始第十八章:对未来的理性判断
在探讨未来之前,必须诚实地承认:预测未来是困难的,甚至是不可能的。
历史上充满了失败的预测:
- 1943年,IBM主席托马斯·沃森说:"全世界可能只需要五台计算机。"
- 1995年,以太网发明者罗伯特·梅特卡夫预言互联网将在1996年崩溃。
- 2007年,微软CEO史蒂夫·鲍尔默说:"iPhone没有机会获得显著的市场份额。"
这些失败的预测来自于那个时代最聪明、最有经验的人。如果他们都会错,我们凭什么相信自己的预测是正确的?
然而,放弃预测也是不明智的。
创业需要对未来有判断。投资需要对趋势有预期。职业规划需要对市场有认知。
正确的态度是:做出预测,但保持谦逊。承认不确定性,但在不确定中行动。
本章的目的不是给出确定的答案,而是提供思考未来的框架。这些判断可能对,可能错,但思考的过程本身是有价值的。
短期(2026-2028):错误率降低,应用规模扩大
在未来两到三年内,AI技术最显著的进步可能不在于"能力上限"的提升,而在于"可靠性"的改善。
错误率降低一个数量级
闫俊杰曾预测:"我们的目标是把错误率降低一个数量级,从20-30%降到2-3%。"
这个目标在短期内有望实现。技术路径包括:
- 更好的训练数据:减少噪音,增加高质量来源
- 更强的推理能力:增强模型的逻辑一致性和事实核查能力
- 人机协作:在高风险场景中引入人类审核
- 专业化优化:针对特定领域进行深度调优
当错误率降到个位数时,AI在很多场景下将变得"可信赖"。这将打开大量之前无法触及的应用场景。
应用规模扩张两个数量级
当前AI应用的用户主要是早期采用者和技术爱好者。当可靠性提升后,主流用户将开始接受AI。
应用规模可能从当前的千万级扩张到十亿级。这不只是用户数量的增长,也是使用深度的增加——从"偶尔尝试"变为"日常依赖"。
商业模式成熟
短期内,AI商业模式将逐渐成熟:
- 订阅制成为主流变现方式
- 垂直行业解决方案出现更多成功案例
- ToB和ToC市场都找到可持续的商业模式
- 价格战趋于理性,市场进入稳定增长期
中期(2029-2032)���多模态融合成熟,AI能力接近普通个体
在五到八年的时间尺度上,更深刻的变化将发生。
真正的多模态AI
当前的多模态AI还���于早期阶段。不同模态的融合往往是"拼接式"的,而非真正的"理解式"。
中期内,多模态融合将走向成熟:
- AI能够像人类一样自然地整合视觉、听觉、语言信息
- 模态之间的推理和迁移能力大幅提升
- 真正理解物理世界的常识(物体会掉落、液体会流动……)
- 能够与物理环境进行复杂交互
AI能力接近普通个体
在很多认知任务上,AI的能力将接近甚至超过普通人:
- 写作:能够产出专业级别的文章、报告、创意内容
- 编程:能够独立完成中等复杂度的软件开发
- 分析:能够处理复杂的数据分析和商业决策支持
- 创作:能够进行高质量的艺术创作(绘画、音乐、视频)
- 对话:能够进行深度的、有洞察力的对话
这不意味着AI会在所有方面超越人类,但在日常任务上,AI将成为强大的助手甚至替代者。
深刻的社会影响
当AI能力达到这个水平时,社会影响将变得深刻:
- 很多工作岗位面临转型或消失
- 教育模式需要根本性的变革
- 创意产业的生产方式发生变化
- 人机关系需要重新定义
这些变化将带来机遇,也带来挑战。社会需要做出调整和准备。
长期(2033+):AGI实现的可能性
在十年以上的时间尺度上,最大的不确定性是:AGI是否会实现?
什么是AGI?
AGI(Artificial General Intelligence,通用人工智能)是指能够在所有认知任务上达到或超越人类水平的AI系统。
当前的AI是"专用智能"——在特定任务上很强,但缺乏通用性。AGI则是真正的"通用智能"——能够像人类一样学习任何新任务。
AGI实现的乐观预期
乐观者认为,AGI可能在2030年代实现。
理由包括:
- 规模效应(Scaling Laws)似乎没有触顶
- 算力仍在快速增长
- 大模型展现了涌现能力(Emergent Abilities)
- 研究者的能力和资源在快速积累
如果这种预期成真,AGI将成为人类历史上最重要的发明之一。它将彻底改变经济、社会、甚至人类的自我认知。
AGI实现的谨慎预期
谨慎者认为,AGI的实现还很遥远。
理由包括:
- 当前AI缺乏真正的"理解",只是模式匹配
- 规模效应可能在某个点饱和
- 一些关键能力(常识推理、因果理解)进展缓慢
- 计算资源和能源限制可能成为瓶颈
如果这种预期正确,AGI可能需要根本性的技术突破,而非当前路线的延续。
不确定性中的准备
无论AGI何时实现,为这种可能性做准备是明智的:
- 技术层面:继续推进基础研究,探索不同的技术路线
- 社会层面:开始讨论AGI的伦理、监管和治理问题
- 个人层面:发展那些AI难以替代的能力
中国AI在全球竞争中处于什么位置?有什么优势和劣势?
优势分析
用户规模
中国有超过10亿互联网用户,是全球最大的单一数字市场。
庞大的用户规模意味着:
- 丰富的数据来源
- 多样的应用场景
- 快速的反馈迭代
- 规模化变现的可能
应用场景
中国社会的数字化程度很高,从移动支付到电子商务,从社交网络到短视频——这些场景都是AI应用的沃土。
更重要的是,中国用户对新技术的接受度很高,愿意尝试新产品。这为AI应用提供了良好的市场环境。
人才储备
中国拥有大量的AI人才,尤其是在工程实现方面。
每年有大量的计算机和数学专业毕业生,有完善的人才培养体系,有吸引海外人才回流的政策和机会。
产业生态
中国有完整的产业链:从芯片制造到云计算,从数据服务到应用开发。虽然在某些环节有短板,但整体生态是完善的。
劣势分析
算力芯片
这是最明显的短板。
高端AI芯片被英伟达等美国公司垄断,而中美科技脱钩导致供应不确定。虽然国产替代在推进,但短期内差距仍然存在。
算力限制可能影响训练大规模模型的能力,迫使中国公司更加注重效率优化。
基础理论
在基础理论研究方面,中国与美国仍有差距。
Transformer、GPT、Diffusion等关键突破大多来自美国。中国在应用和工程上很强,但在原创性理论上还需要更多积累。
高端人才
虽然中国有大量AI人才,但顶尖研究者仍相对稀缺。
很多华人顶尖研究者在美国工作。虽然人才回流趋势存在,但整体上高端人才仍然是短板。
机会分析
开源生态
DeepSeek的成功展示了开源模式的可能性。
通过积极参与开源生态,中国公司可以:
- 获取最新的技术成果
- 建立国际影响力
- 吸引全球开发者
- 减少对封闭技术的依赖
垂直应用
在垂直应用领域,中国有独特的机会。
中国市场有独特的需求:中文处理、本地化场景、特定行业的痛点……这些领域是中国公司的主场。
通过在垂直领域建立优势,可以积累技术和经验,逐步拓展到更广阔的市场。
技术普惠
"技术普惠"可能成为中国AI的差异化方向。
与硅谷"技术垄断"的倾向不同,中国有机会探索"技术普惠"的模式——让AI更加平民化、更加普及、更加服务于大众。
这既是商业机会,也是社会价值。
挑战分析
地缘政治
中美科技脱钩是最大的外部挑战。
芯片供应、技术交流、人才流动、海外市场——所有这些都可能受到地缘政治的影响。
这种不确定性需要被纳入战略规划中。
监管不确定性
中国的AI监管环境仍在演变中。
这种不确定性给公司带来挑战:合规成本增加、产品迭代受限、商业模式受影响。
但从长远看,合理的监管也有助于行业健康发展。
资本耐心
AI是长周期的事业,需要资本的耐心。
当前的资本环境冷热不均。在热潮时,估值泡沫;在寒冬时,融资困难。
能够穿越周期的公司,需要找到有耐心的资本。
基于前面的分析,Minimax的未来有几种可能的情景:
乐观情景:成为全球前五的AGI公司
在最乐观的情景下:
- Minimax的技术持续领先,在多模态和效率方面建立全球优势
- Talkie和其他产品在全球市场取得巨大成功,用户规模达到数亿
- 商业化健康发展,实现大规模盈利
- 在AGI的竞赛中占据领先位置
这种情景需要多个因素的配合:技术突破、市场成功、竞争胜出、政策支持……
基准情景:在C端AI应用领域占据领先地位
在基准情景下:
- Minimax成为中国领先的C端AI应用公司
- 在全球市场某些区域和细分领域建立优势
- 多模态能力成为核心差异化
- 实现健康的盈利,但规模不及巨头
这种情景比较现实,需要公司持续执行正确的战略。
悲观情景:在竞争中落后或转型
在悲观情景下:
- 技术优势被竞争对手追平或超越
- 商业化进展不及预期,资金压力增大
- 在算力和人才方面面临严重制约
- 可能被并购或被迫转型
这种情景也是可能的,尤其是如果外部环境恶化或内部执行出现问题。
情景的决定因素
最终落入哪种情景,取决于几个关键因素:
技术创新能力:能否持续在技术上保持领先?能否应对DeepSeek等竞争对手的挑战?
商业化效率:能否将技术优势转化为商业成功?能否找到可持续的盈利模式?
组织执行力:能否保持高效的组织运转?能否吸引和留住顶尖人才?
外部环境:地缘政治、监管政策、资本市场——这些外部因素如何演变?
这些因素有些是可控的,有些是不可控的。Minimax能做的是:做好可控的部分,对不可控的部分做好准备和对冲。
站在2025年回望过去、展望未来,我们正在见证什么?
技术民主化的进程
DeepSeek的成功证明了一个重要的趋势:AI技术正在民主化。
曾经,训练顶级大模型被认为需要数亿美元的投入,只有少数巨头玩得起。DeepSeek用600万美元的成本打破了这个神话。
这意味着:
- 更多的公司和个人可以参与AI创新
- 技术的门槛在降低
- 竞争将更加激烈,也更加公平
- 创新的来源将更加多元
中国路径的探索
与硅谷的"技术垄断"模式不同,中国AI公司正在探索不同的路径:
- DeepSeek的全面开源
- Minimax的"技术普惠"愿景
- 更加注重应用场景的本地化
这种"中国路径"可能成为全球AI发展的一个重要分支。
个人使命的时刻
最重要的启示可能是:在AGI时代,每个技术从业者都有机会参与历史。
这不是一个普通的技术时代。AI可能成为人类历史上最重要的技术突破。
参与这个时代的人——无论是研究者、工程师、创业者还是投资人——都有机会对历史产生影响。
这是一种责任,也是一种机遇。
闫俊杰的选择
闫俊杰在2021年做出了他的选择:离开商汤,创立Minimax,追求"让AI普惠大众"的愿景。
这个选择不是必然的。他完全可以选择留在商汤,享受更稳定的生活。
但他选择了更难的路。为什么?
因为他看到了一个时代的机遇,看到了一个改变世界的可能。他不愿意错过这个机会。
你的选择
你的选择是什么?
你可能不会创业,可能不会成为创始人。但你仍然有选择:
- 在什么领域深耕?
- 为什么样的使命工作?
- 如何发挥自己的价值?
- 如何参与这个时代?
这些选择没有标准答案,但值得认真思考。
在本章的结尾,让我们写一封给未来的信:
致十年后的读者:
你正在阅读的这本书,写于2025年。那是一个AI快速发展的年代——ChatGPT刚刚问世两年多,大模型竞争如火如荼,每个月都有新的突破和变化。
我们不知道十年后的世界是什么样子。也许AGI已经实现,也许还在路上。也许Minimax成为了伟大的公司,也许已经成为历史。也许AI让世界变得更好,也许带来了我们今天无法想象的问题。
但有些事情我们相信是不变的:
技术应该服务于人。 无论AI发展到什么程度,它的价值最终要通过帮助人来实现。
长期主义终将获胜。 追逐热点的会被淘汰,坚持长期价值的会存活下来。
人的成长是一切的基础。 公司的天花板是创始人的天花板,时代的高度是个人成长的高度。
我们希望这本书能够提供一些有价值的参考,无论是关于创业、关于技术、还是关于人生。
但更重要的是,我们希望你在阅读之后,能够做出自己的思考和选择。
你的时代,你的故事,由你来书写。
祝你一切顺利。
2025年的作者
-
预测是困难的,但思考未来是必要的。 保持谦逊,但在不确定中行动。
-
AI技术趋势:短期错误率降低、中期多模态成熟、长期AGI可能。 这些趋势将深刻影响社会。
-
中国AI的优势在于用户规模和应用场景,劣势在于芯片和基础理论。 开源生态和垂直应用是重要机会。
-
Minimax的未来有多种可能,取决于技术创新、商业化效率、组织执行力和外部环境。
-
技术民主化正在进行,中国路径正在探索。 这是一个每个人都可以参与历史的时代。
-
最重要的问题是:你的选择是什么? 在这个时代,你将如何发挥自己的价值?
【第五编完】
请输入"继续"以开始附录部分
2021年11月
- Minimax正式注册成立
- 创始团队主要来自商汤科技
- 确立"让AI普惠大众"的企业愿景
- 选定MoE(混合专家模型)作为核心技术架构
- 开始多模态技术布局
2021年12月
- 完成天使轮融资
- 核心研发团队搭建完成
- 启动首个大语言模型训练项目
- 确立"技术与产品并重"的战略方向
2022年上半年
- 完成首个MoE架构大模型的训练
- 克服MoE工程实现中的负载均衡和训练稳定性问题
- 开始多模态数据收集和处理工作
- 启动语音合成和语音识别模块研发
2022年下半年
- abab 6发布——国内首个基于MoE架构的大语言模型
- 验证了MoE在中文大模型中的可行性
- 为后续产品开发奠定技术基础
- 启动C端产品开发
- 完成A轮融资
- 团队规模扩展至百人级别
2023年第一季度
- ChatGPT引爆全球市场,AI行业进入高速发展期
- 加速模型迭代,提升基础能力
- 星野产品立项,定位AI陪伴应用
2023年第二季度
- 星野内测版本上线
- Talkie项目启动,目标海外市场
- 多模态能力整合进入产品
2023年第三季度
- 海螺AI发布,展示多模态交互能力
- Talkie在海外市场上线
- 语音交互能力达到商用水平
2023年第四季度
- abab 6.5发布——万亿参数规模模型
- 参数量达到万亿级别
- 性能在多个评测中达到国际领先水平
- 验证了Scaling Laws在更大规模上的有效性
- Talkie在海外市场快速增长
- 完成A+轮融资,估值达到25亿美元
2024年第一季度
- Talkie月活用户突破500万
- 启动线性注意力机制研发
- 与高济健康合作,推出"高济神农"AI诊疗辅助系统
2024年第二季度
- 线性注意力机制取得突破
- 推理效率提升20%以上
- 开发者工具套件发布
- API注册用户快速增长
2024年第三季度
- MiniMax-01系列模型发布
- 首次大规模应用线性注意力机制
- 在保持性能的同时显著降低成本
- Talkie累计用户突破1000万
- 错误率持续降低
2024年第四季度
- Talkie年收入突破7000万美元
- 业务覆盖157个国家和地区
- 被量子位智库列入中国AI大模型"6+2"格局
- 多模态能力进一步增强
2025年1月
- DeepSeek-R1发布,开源模式引发行业震动
- 内部启动效率优化专项
- 重新评估开源与闭源策略
2025年第一季度
- 完成对DeepSeek技术路线的研究
- 启动训练效率大幅优化项目
- Talkie用户持续增长
2025年6月
- 技术产品"五连发"
- 新一代基座模型
- 多模态大模型升级
- 智能体(Agent)平台
- 开发者工具套件升级
- 企业解决方案升级
- 展示公司全面的技术储备
2025年下半年
- 战略聚焦:Talkie和海外市场作为核心
- 效率优化取得显著成效
- 组织架构优化
- 为下一阶段发展做准备
| 时间 | 里程碑 | 意义 |
|---|---|---|
| 2021.11 | 公司成立 | 开启创业之旅 |
| 2022 | abab 6发布 | 国内首个MoE大语言模型 |
| 2023 | 星野、海螺AI上线 | C端产品突破 |
| 2023 | Talkie上线 | 海外市场布局 |
| 2023 | abab 6.5发布 | 万亿参数突破 |
| 2024 | MiniMax-01发布 | 线性注意力创新 |
| 2024 | Talkie 7000万美元收入 | 商业化验证 |
| 2025.06 | 五连发 | 全面技术展示 |
"AI应该成为日常生活的一部分,成为普惠大众的生产力。"
这句话揭示了闫俊杰创业的核心动机:不是为了技术本身,而是为了让技术帮助普通人。
"我外公是一位想写书的老人,但他不会打字。我小时候就在想,如果有一个AI能帮他,那该多好。"
外公的故事是闫俊杰技术普惠信念的具体起源,也是他持续前行的动力来源。
"真正的AGI必须是多模态的。一个只能处理文本的AI,无论文本能力多么强大,都无法称为AGI。"
这句话解释了Minimax为什么从一开始就坚持多模态布局。
"我骨子里是一个期待跟王者一决高下的人。"
这句话揭示了闫俊杰内心深处的竞争欲望——不是为了金钱或名声,而是纯粹的"想要赢"。
"中国AI企业可以引领世界巨头。"
这不是空洞的民族主义口号,而是对目标的清晰定义:不是追赶,不是模仿,而是引领。
"竞争对手不是敌人,而是老师。他们的成功值得学习,他们的失败值得警醒。"
这句话展示了闫俊杰对竞争的成熟态度:尊重对手,从对手身上学习。
"商业化不是当前最重要的关注点。我们的目标是打造最好的AI产品,让技术真正造福用户。收入会随之而来,但不应该成为驱动决策的核心。"
这句话体现了长期主义的商业观:商业化是结果,不是目的。
"降价同时保持更好效果。"
这句话揭示了Minimax应对价格战的策略:通过效率提升实现成本降低,而不是简单的亏损补贴。
"我们不做'中国的OpenAI',而是要做'AI时代的微信或抖音'——直接面向亿万用户的超级应用。"
这句话阐明了Minimax的战略定位:不是技术供应商,而是产品公司。
"坚持创新而非短期变现。"
这句话是Minimax长期主义理念的核心表达。
"长期主义不是不赚钱,而是不赚快钱。"
这句话澄清了对长期主义的常见误解:长期主义与商业化并不矛盾。
"如果我们只看短期收入,最理性的选择是All in Talkie,放弃其他所有项目。但Talkie的成功建立在我们的技术能力之上。如果停止技术投入,两年后Talkie的竞争力也会下降。"
这段话展示了闫俊杰的系统思维:看到短期和长期之间的联系。
"当前大模型的错误率大概在20-30%左右。我们的目标是把错误率降低一个数量级,从20-30%降到2-3%。当错误率达到这个水平时,AI才能真正成为可信赖的生产力工具。"
这段话揭示了Minimax技术优先级的核心:不是追求论文跑分,而是关注实际可用性。
"MoE是通向更好模型的必要条件。虽然工程挑战很大,但这是我们必须走的路。"
这句话解释了2021年选择MoE架构的决策逻辑。
"规模是通向更好模型的必要条件。在这个阶段,我们不应该过度担心效率问题。先把模型做大、做强,效率问题可以后续优化。"
这句话展示了早期对Scaling Laws的信念和执行。
"保持组织结构简单,注重研发效率。"
这句话是Minimax轻量化组织理念的表达。
"采用数据科学快速识别有效路径。"
这句话体现了数据驱动的管理风格。
"选择能提升团队整体输出的人,而非单打独斗的明星。"
这句话揭示了Minimax独特的人才选择标准:团队效能优先于个人能力。
"在那个环境下,很多东西需要靠自己领悟。"
这句话回顾了童年经历对独立精神的塑造。
"我表面上看起来安静沉着,但骨子里是一个期待跟王者一决高下的人。"
这句话揭示了闫俊杰"外柔内刚"的性格特点。
"如果这时候不创业,以后恐怕也不会有更好的时机了。"
这句话展示了2021年创业决定背后的时机判断。
"技术可以迭代,产品可以优化,但文化是公司的DNA。DNA出了问题,什么都会出问题。"
这句话体现了对文化建设的高度重视。
年度融资总额
| 年份 | 融资总额(亿美元) | 融资事件数 | 主要特点 |
|---|---|---|---|
| 2021 | 约30 | 约50 | 资本寒冬中的早期布局 |
| 2022 | 约40 | 约70 | 稳步增长,关注技术实力 |
| 2023 | 约100 | 约150 | ChatGPT引爆市场,资本涌入 |
| 2024 | 约60 | 约100 | 理性回归,头部集中 |
| 2025(上半年) | 约25 | 约40 | 谨慎投资,关注商业化 |
趋势分析
2023年是融资高峰,受ChatGPT带动。2024年开始回归理性,投资人更加关注商业化能力和技术壁垒。2025年延续谨慎趋势,但头部公司仍能获得融资。
六大巨头
| 公司 | 主要产品 | 核心优势 | 战略重点 |
|---|---|---|---|
| 字节跳动 | 豆包 | 流量分发、资金实力 | 低价策略、C端渗透 |
| 阿里巴巴 | 通义千问 | 电商生态、云计算 | ToB深耕、垂直应用 |
| 百度 | 文心一言 | 搜索入口、知识积累 | 全面布局、搜索整合 |
| 腾讯 | 混元 | 社交生态、微信入口 | 生态整合、社交+AI |
| 华为 | 盘古 | 硬件能力、政企关系 | 政企市场、端云协同 |
| 智谱AI | ChatGLM | 学术背景、科研优势 | 教育科研、开源生态 |
两大创业公司
| 公司 | 主要产品 | 核心优势 | 战略重点 |
|---|---|---|---|
| Minimax | 星野、海螺AI、Talkie | 多模态、C端产品 | 海外市场、用户体验 |
| 月之暗面 | Kimi | 长文本能力 | 知识工作者、学生群体 |
格局特点
- 巨头凭借资源优势占据主导地位
- 创业公司通过差异化寻求突破
- 市场集中度在提高,尾部公司出局
- ToC和ToB市场呈现不同的竞争格局
性能对比
| 指标 | OpenAI o1 | DeepSeek-R1 | 说明 |
|---|---|---|---|
| 推理能力 | 领先 | 接近 | R1在多数评测中接近o1水平 |
| 代码生成 | 领先 | 接近 | 两者差距较小 |
| 中文能力 | 良好 | 优秀 | R1在中文上有优势 |
| 多模态 | 强 | 有限 | o1多模态能力更强 |
成本对比
| 指标 | OpenAI | DeepSeek | 差距 |
|---|---|---|---|
| 训练成本 | 约1亿美元+ | 约600万美元 | ~20倍 |
| API价格 | 较高 | 极低 | 数十倍 |
| 开源 | 否 | 是 | 根本差异 |
战略意义
DeepSeek的成功证明了:
- 高效训练方法可以大幅降低成本
- 开源模式具有强大的生态影响力
- 技术垄断的神话可以被打破
- 中国团队在前沿领域可以取得突破
融资历程
| 轮次 | 时间 | 金额 | 估值 | 主要投资人 |
|---|---|---|---|---|
| 天使轮 | 2021年底 | 未披露 | 未披露 | 早期投资机构 |
| A轮 | 2022年 | 未披露 | 未披露 | 知名VC |
| A+轮 | 2023年底 | 约6亿美元 | 25亿美元 | 多家顶级机构 |
产品矩阵
| 产品 | 定位 | 目标市场 | 主要特点 |
|---|---|---|---|
| 星野 | AI陪伴 | 中国 | 情感交互、人格化 |
| 海螺AI | 多模态助手 | 中国 | 语音+视觉+文本 |
| Talkie | AI社交 | 海外 | 角色互动、情感陪伴 |
| API服务 | 开发者平台 | 全球 | 模型能力输出 |
Talkie关键指标(2024年)
| 指标 | 数据 |
|---|---|
| 年收入 | 约7000万美元 |
| 覆盖国家/地区 | 157个 |
| 付费转化率 | 约8% |
| 日均使用时长 | 40分钟+ |
美国
| 公司 | 主要产品 | 特点 |
|---|---|---|
| OpenAI | GPT系列、ChatGPT | 技术领先、商业化成功 |
| Gemini | 搜索整合、多模态 | |
| Anthropic | Claude | 安全导向、长文本 |
| Meta | LLaMA | 全面开源、生态建设 |
| xAI | Grok | 马斯克创立、与X整合 |
中国
| 公司 | 主要产品 | 特点 |
|---|---|---|
| 百度 | 文心一言 | 早期布局、搜索整合 |
| 阿里 | 通义千问 | 云计算整合、开源 |
| 字节 | 豆包 | 流量优势、低价策略 |
| 腾讯 | 混元 | 社交生态、企业服务 |
| 华为 | 盘古 | 全栈能力、政企市场 |
| Minimax | abab系列 | 多模态、C端产品 |
| 智谱AI | ChatGLM | 学术背景、开源 |
| 月之暗面 | Kimi | 长文本、知识工作 |
| DeepSeek | R1系列 | 开源、高效率 |
| 时间 | 事件 | 意义 |
|---|---|---|
| 2017.06 | Transformer论文发布 | 现代大模型的基础架构 |
| 2018.06 | GPT-1发布 | 预训练+微调范式确立 |
| 2019.02 | GPT-2发布 | 展示规模效应 |
| 2020.06 | GPT-3发布 | 验证Scaling Laws |
| 2022.11 | ChatGPT发布 | 引爆公众关注 |
| 2023.03 | GPT-4发布 | 多模态、更强能力 |
| 2024.09 | OpenAI o1发布 | 推理能力突破 |
| 2025.01 | DeepSeek-R1发布 | 开源+低成本突破 |
-
《Attention Is All You Need》(2017)
- Transformer架构的原始论文
- 理解现代大模型的必读材料
-
《Language Models are Few-Shot Learners》(2020)
- GPT-3论文
- Scaling Laws和In-Context Learning的重要文献
-
《Switch Transformers》(2021)
- MoE大规模应用的关键论文
- 理解Minimax技术选择的背景
-
《从0到1》彼得·蒂尔
- 创业与创新的经典著作
- 差异化竞争的思想来源
-
《创新者的窘境》克里斯坦森
- 颠覆性创新理论
- 理解技术变革如何重塑市场格局
-
《精益创业》埃里克·莱斯
- MVP和快速迭代方法论
- 用户共创的理论基础
-
《原则》雷·达里奥
- 系统化决策和生活原则
- 自我反思和持续成长的方法论
-
《刻意练习》安德斯·艾利克森
- 专业能力提升的科学方法
- 理解"技术深度"如何培养
-
《终身成长》卡罗尔·德韦克
- 成长心态vs固定心态
- 理解成长的心理基础
-
《生命3.0》迈克斯·泰格马克
- AI对人类未来的影响
- 关于AGI的深入思考
-
《AI 2041》李开复、陈楸帆
- AI技术与科幻结合的前瞻思考
- 想象未来AI应用场景
A
- AGI(通用人工智能):贯穿全书的核心概念
- abab系列模型:Minimax的基座模型
- A/B测试:用户共创的实践方法
D
- DeepSeek:开源大模型的代表,2025年引发行业震动
M
- Minimax:本书的核心研究对象
- MoE(混合专家模型):Minimax的核心架构选择
- 多模态:Minimax的差异化优势
S
- Scaling Laws:规模效应,大模型发展的核心理论
- 商汤科技:闫俊杰的职业起点
T
- Talkie:Minimax最成功的产品
- Transformer:现代大模型的基础架构
Y
- 闫俊杰:Minimax创始人,本书的核心人物
长期主义:Minimax的核心价值观之一
用户共创:Minimax产品开发的核心方法
轻量化组织:Minimax的组织理念
技术普惠:Minimax的核心使命
这本书试图做一件困难的事情:在Minimax和闫俊杰的故事仍在进行时,就对其进行记录和分析。
这种"进行时写作"有其风险。我们不知道故事的结局会是什么。今天看来正确的判断,明天可能被证明是错误的。今天看来重要的事件,明天可能变得微不足道。
但这种写作也有其价值。它捕捉了一个正在发生的历史时刻,记录了一群人在不确定性中做出选择的过程。这些选择的背景、逻辑和权衡,是事后很难还原的。
我们尽力做到了以下几点:
事实准确:所有关键事实都有来源,合理推断都明确标注。
观点平衡:既记录成就,也记录挫折;既呈现优势,也分析劣势。
思辨深入:不只是叙述"发生了什么",更试图分析"为什么发生"和"意味着什么"。
方法可用:从具体经历中提炼可复用的原则和方法论。
这本书不是Minimax的官方传记,也不是闫俊杰的授权作品。我们基于公开资料进行研究和分析,对于无法核实的信息保持审慎。
我们希望这本书能够为读者提供价值:
- 对创业者:提供可借鉴的经验和方法
- 对技术人员:提供职业发展的参考
- 对投资人:提供理解AI产业的视角
- 对关注AI的公众:提供深入了解行业的窗口
最后,感谢闫俊杰和Minimax团队的实践。无论最终结果如何,他们正在做一件有意义的事情——试图让AI帮助每一个普通人。
这本书献给所有正在创业的人,所有正在成长的人,所有相信技术可以让世界变得更好的人。
愿你们都能找到属于自己的道路。
【全书完】
- 总字数:约100,000字
- 章节数:18章 + 附录
- 编写周期:2025年
- 核心主题:AI创业、个人成长、技术普惠
本书基于公开资料编写,不代表Minimax公司或闫俊杰本人的官方立场。书中的分析和判断代表作者观点,供读者参考。
# 《Minimax公司的前世今生——创始人闫俊杰传记 & 人生启示录》
## 写作框架与内容纲要
### 第一编:时代与起点(约15,000字)
#### 第一章:数字文明的黎明时刻(约5,000字)
**写作要点:**
- 2010年代末期全球AI浪潮的兴起,从AlphaGo到GPT系列的技术突破
- 中国科技产业从"模式创新"向"技术创新"转型的历史窗口
- 商汤、旷视等AI"四小龙"的崛起与困境:资本驱动下的估值泡沫与商业化焦虑
- 大模型范式革命的前夜:Transformer架构的普及与算力需求的指数级增长
- 2020-2021年中国AI创业环境的"冰火两重天":政策支持与资本寒冬并存
- 关键问题:为什么是2021年?为什么是闫俊杰?
**核心引用:**
- DeepSeek的案例展示了开源模式与低成本如何打破技术垄断(citation:14,15,17)
- 量子位智库2024年报告指出的"6+2"格局,MiniMax位列其中(citation:11)
#### 第二章:闫俊杰的认知原点(约6,000字)
**成长背景的深度挖掘:**
- **1980年代河南小县城的物质匮乏与精神富足**:在"很多东西需要靠自己领悟"的环境中形成的独立解决问题能力(citation:3)
- **外公的遗憾与AGI信仰的萌芽**:一位老人想写书却因不会打字而放弃,这个具体场景如何点燃了"AI帮助普通人"的初心(citation:3)
- **数学专业的底层思维**:东南大学数学本科如何塑造了抽象思维与逻辑严谨性
- **通信工程的视野拓展**:重庆邮电大学硕士阶段对工程实践与产业需求的认知
- **中科院自动化所的博士研究**:在模式识别与智能系统领域的学术积累
- **清华博士后的关键跃迁**:从学术研究者到产业前瞻者的身份转变
**关键抉择分析:**
- 为什么选择商汤而非学术界?——对技术落地的渴望
- 从实习生到副总裁的7年:在商汤内部经历了哪些关键战役与认知升级?
- 2021年离开商汤的"非理性"选择:放弃稳定高位去创业的深层动机
**思想演进脉络:**
- 从"技术理想主义"到"技术普惠主义"的转变
- "精英工具"与"大众生产力"的二元对立认知形成
- 对"中国AI企业能否成为世界引领者"的信念确立
#### 第三章:价值观与思维模式的起源(约4,000字)
**核心价值观提炼:**
1. **独立解决问题的本能**:小县城成长经历内化为"不等待资源,主动创造条件"的行为模式
2. **技术民主化信念**:外公的遗憾转化为"AGI必须为普通人服务"的使命
3. **竞争驱动的成长观**:外表安静沉着,内心"期待跟王者一决高下"的矛盾统一(citation:1)
4. **长期主义的萌芽**:在商汤后期对"技术深度>商业速成"的坚持
**思维模式分析:**
- **数学思维**:将复杂系统拆解为可优化子问题的能力
- **工程思维**:在资源约束下寻找最优解的务实精神
- **战略思维**:从"AI作为环节"到"AI作为产品"的认知跃迁(citation:3)
---
### 第二编:Minimax的诞生(约20,000字)
#### 第四章:创业动机与问题意识(约6,000字)
**2021年的时空坐标:**
- 技术维度:GPT-3已验证规模效应,但中文大模型仍空白
- 商业维度:商汤等AI公司面临上市压力,商业化路径争议
- 个人维度:38岁的闫俊杰面临"继续打工还是改变世界"的终极选择
**问题意识的三重结构:**
1. **技术问题**:为什么中国没有自己的GPT-3级大模型?
2. **商业问题**:如何避免成为"API供应商",做出真正的C端产品?
3. **社会问题**:如何让AI从"少数精英的工具"变为"普惠大众的生产力"?
**关键对话与场景还原:**
- 与罗永浩在《十字路口》访谈中透露的创业初心(citation:1)
- 内部讨论中"做中国OpenAI" vs "差异化创新"的路线之争
- 最终选择:不做"中国OpenAI",而是"AI时代的微信/抖音"
#### 第五章:初始团队的形成(约5,000字)
**创始团队的"非完美组合":**
- **技术核心**:闫俊杰+商汤系技术骨干(研究院副院长+智慧城市CTO的号召力)
- **互补短板**:早期团队在产品、市场、融资方面的缺失与补位
- **关键招聘**:如何说服顶尖人才加入"不确定的未来"?
**组织基因的早期设定:**
- **轻量化组织**:保持结构简单,注重研发效率(citation:3)
- **科学方法**:采用数据科学快速识别有效路径(citation:3)
- **人才选择标准**:能提升团队整体输出,而非单打独斗的明星(citation:3)
**早期资源约束下的生存策略:**
- 算力:如何在"一卡难求"的2021年获取训练资源?
- 数据:从哪里获取高质量中文语料?
- 资金:天使轮融资的艰难与关键决策者的赌注
#### 第六章:技术方向与产品定位的早期抉择(约6,000字)
**2021-2022年的关键决策树:**
- **架构选择**:为什么是MoE(混合专家模型)而非密集模型?——对推理成本与延时的前瞻(citation:3)
- **模态选择**:为什么坚持多模态融合?——"文本到视觉、文本到语音、文本到文本"的三位一体(citation:5)
- **产品路径**:先做API还是先做C端应用?——"技术与产品并重"的激进策略(citation:3)
- **市场选择**:国内还是海外?——Talkie出海的战略考量(citation:7)
**决策逻辑分析:**
- **MoE的激进性**:2021年MoE仍是前沿,但闫俊杰认为这是"通向更好模型的必要条件"(citation:3)
- **多模态的必然性**:AGI必须理解世界,而世界是多模态的
- **C端优先的代价**:资源分散、周期长,但能获取真实用户反馈
**早期产品迭代:**
- abab 6的发布:国内首个MoE大语言模型(citation:3)
- 星野、海螺AI的诞生:从工具到陪伴的产品哲学
- 用户共创的实践:如何将用户反馈转化为模型优化(citation:3)
---
### 第三编:公司发展的关键阶段(约30,000字)
#### 第七章:2023-2024年——技术狂飙与商业化试错(约8,000字)
**技术演进路线:**
- **abab 6.5**:万亿参数模型的突破与Scaling Laws的应用(citation:3)
- **线性注意力机制**:MiniMax-01系列的架构创新,效率提升20%以上(citation:7)
- **错误率攻坚战**:从20-30%到"降低一个数量级"的生死线(citation:3)
**商业化路径的摇摆:**
- **To B vs To C**:与高济健康合作"高济神农"系统(citation:3) vs Talkie海外收入7000万美元(citation:7)
- **开源 vs 闭源**:DeepSeek开源冲击下的战略选择(citation:14,15,17)
- **降价竞争**:如何在"降价同时保持更好效果"(citation:3)
**组织扩张的阵痛:**
- 从几十人到数百人的管理挑战
- "轻量化组织"理念在规模扩大后的坚持与变形
- 2024年AI创业"6+2"格局下的竞争压力(citation:11)
#### 第八章:2025年——重大转折点与危机时刻(约8,000字)
**关键事件复盘:**
1. **技术产品"五连发"**(2025年6月):基座模型、多模态、智能体的全面布局(citation:4)
- 战略意图:展示技术储备,构建生态壁垒
- 资源压力:同时推进多条产品线的代价
- 市场反馈:是否达到预期?
2. **DeepSeek-R1的冲击**(2025年2月):开源模式与低成本的降维打击(citation:14,15,17)
- 应对策略:坚持闭源还是拥抱开源?
- 技术反思:规模是否仍是王道?
- 商业模式:如何应对价格战?
3. **Talkie的收入奇迹**:年收入7000万美元的背后(citation:7)
- 海外市场的选择逻辑
- 产品本地化的成功要素
- 与国内监管环境的对比
**危机时刻的真实代价:**
- **算力危机**:2025年AI芯片供应紧张下的训练计划调整
- **人才流失**:竞争对手挖角与内部军心稳定
- **资本压力**:A+轮后估值25亿美元的业绩对赌(citation:3)
- **战略质疑**:内部对"技术优先" vs "商业化优先"的分歧(citation:1)
#### 第九章:与资本、市场、竞争对手的博弈(约7,000字)
**资本博弈:**
- 早期融资:从天使到A+轮的估值逻辑演变
- 25亿美元独角兽的"甜蜜负担":增长压力与独立性的平衡
- 拒绝"资本炒作":DeepSeek教训的镜鉴(citation:14,15)
**市场博弈:**
- **国内监管**:AI应用备案、内容安全、数据合规
- **海外突破**:Talkie在157个国家和地区的扩张(citation:14)
- **用户心智**:从"工具"到"陪伴"的产品哲学
**竞争对手分析:**
- **智谱AI**:B端深耕 vs MiniMax的C端优先
- **月之暗面**:Kimi的长文本突破 vs MiniMax的多模态
- **DeepSeek**:开源颠覆者 vs MiniMax的闭源坚守
- **OpenAI**:全球标杆 vs 中国路径
**闫俊杰的竞争观:**
- "期待跟王者一决高下"的内在驱动(citation:1)
- "引领世界巨头"的野心与现实(citation:1)
- 竞争中的学习与差异化选择
#### 第十章:组织文化与领导力演化(约7,000字)
**文化基因的传承与演变:**
- **早期**:技术极客文化,"用代码改变世界"
- **成长期**:产品导向文化,"用户反馈驱动迭代"
- **成熟期**:长期主义文化,"坚持创新而非短期变现"(citation:14,15)
**领导力的自我约束:**
- **决策模型**:从"技术最优"到"综合最优"的升级
- **风险观**:激进技术路线下的风险对冲机制
- **时间观**:从"快速迭代"到"长期主义"的认知转变
**组织管理的科学方法:**
- 数据驱动的绩效评估(citation:3)
- 轻量化组织在规模化后的坚持
- 人才选择的"整体输出"标准(citation:3)
---
### 第四编:创始人的内在成长(约20,000字)
#### 第十一章:认知结构的升级迭代(约6,000字)
**从工程师到企业家的认知跃迁:**
1. **技术认知**:从"模型性能"到"模型错误率"的关键指标转变(citation:3)
2. **商业认知**:从"技术价值"到"用户价值"的视角转换
3. **组织认知**:从"个人英雄"到"系统能力"的领导力进化
4. **战略认知**:从"单点突破"到"生态布局"的格局拓展
**关键认知转折点:**
- **2021年**:意识到"技术先进性不等于商业成功"
- **2023年**:理解"开源与闭源的辩证关系"
- **2025年**:领悟"长期主义不是不赚钱,而是不赚快钱"
#### 第十二章:失败、挫折与自我修正(约6,000字)
**可披露的挫折(基于公开信息合理推断):**
- **技术挫折**:早期模型训练中的"灾难性遗忘"问题
- **产品挫折**:某款C端产品的市场反响不及预期
- **管理挫折**:核心团队成员的离开与组织震荡
- **融资挫折**:某轮次融资的估值分歧与谈判破裂
**自我修正机制:**
- **数据驱动的复盘**:如何建立"快速识别有效路径"的机制(citation:3)
- **外部视角的引入**:顾问、投资人、竞争对手的镜鉴
- **组织创新的持续**:通过组织调整克服能力边界(citation:3)
**从挫折中提炼的原则:**
- "错误率是AI产品的生命线"(citation:3)
- "用户共创不是口号,是生存方式"(citation:3)
- "技术深度是护城河,但产品化是桥梁"
#### 第十三章:决策模型、风险观与长期主义(约5,000字)
**闫俊杰的决策框架:**
1. **技术可行性**:是否满足Scaling Laws?
2. **商业可持续性**:能否在降价同时保持效果?
3. **组织承载力**:团队能否支撑战略执行?
4. **长期价值**:五年后是否仍有竞争力?
**风险观的演进:**
- **早期**:技术风险优先,敢于尝试MoE等前沿架构
- **中期**:市场风险优先,关注用户接受度与监管边界
- **当前**:系统性风险优先,平衡技术、商业、组织、政策
**长期主义的实践:**
- **不追逐热点**:拒绝为短期估值做"应用开发"(citation:14,15)
- **坚持创新**:在DeepSeek开源冲击下仍保持技术自信
- **耐心资本**:选择理解长期价值的投资人
#### 第十四章:领导力与自我约束(约3,000字)
**领导力的矛盾统一:**
- **激进与克制**:技术路线激进,但组织扩张克制
- **自信与谦逊**:对AGI未来充满信心,但承认当前差距(citation:3,14)
- **野心与耐心**:期待引领世界,但接受渐进突破
**自我约束机制:**
- **信息隔离**:避免被短期市场噪音干扰
- **认知更新**:持续学习,保持"学生心态"
- **权力边界**:在组织内建立"科学决策"而非"个人独断"
---
### 第五编:方法论与人生启示(约15,000字)
#### 第十五章:从Minimax提炼的创业法则(约5,000字)
**法则1:技术深度决定商业高度**
- 论证:为什么"技术优先"在AI时代是长期最优策略?
- 案例:MoE架构的选择与abab 6.5的成功
- 反例:追逐热点但技术空心化的创业公司
**法则2:用户共创是技术普惠的唯一路径**
- 论证:从"闭门造车"到"用户驱动"的范式转变
- 案例:星野、海螺AI的用户反馈闭环
- 方法论:建立有效用户共创机制的具体步骤
**法则3:轻量化组织是创新的必要条件**
- 论证:规模与效率的悖论
- 案例:MiniMax保持研发效率的组织实践
- 工具:轻量化组织的设计原则
**法则4:开源与闭源的辩证统一**
- 论证:DeepSeek冲击下的战略选择(citation:14,15)
- 案例:MiniMax的闭源策略与生态构建
- 启示:技术主权与商业现实的平衡
**法则5:长期主义不是道德选择,而是生存策略**
- 论证:为什么"赚快钱"在AI时代是死路?
- 案例:拒绝资本炒作,坚持模型创新(citation:14,15)
- 方法论:建立长期主义决策框架
#### 第十六章:创始人个人成长的底层逻辑(约4,000字)
**认知升级的三重境界:**
1. **见山是山**:技术专家,专注模型性能
2. **见山不是山**:理解技术、商业、组织的复杂性
3. **见山还是山**:回归技术本质,但拥有系统思维
**关键能力的养成:**
- **抽象能力**:从数学到战略的思维迁移
- **共情能力**:从理解外公到理解普通用户
- **抗压能力**:从县城少年到独角兽掌舵人的心理建设
**价值观的稳定性与适应性:**
- **不变**:技术普惠的初心
- **变**:实现初心的路径与方法
#### 第十七章:对年轻创业者与技术人才的启示(约3,000字)
**给技术创业者的建议:**
1. **先深后广**:建立技术护城河再谈商业化
2. **用户为师**:让真实需求驱动技术方向
3. **组织先行**:在扩张前建立可复制的创新机制
**给技术从业者的建议:**
1. **选择战场**:在AI时代,技术深度比广度更重要
2. **理解商业**:技术价值最终需要商业闭环来验证
3. **保持耐心**:AGI是马拉松,不是百米冲刺
**给年轻AI研究者的建议:**
1. **关注错误率**:从追求SOTA到追求可用性
2. **拥抱多模态**:未来属于理解真实世界的研究
3. **坚持开源**:技术平权是AGI的终极形态
#### 第十八章:对未来的理性判断(约3,000字)
**AI技术趋势:**
- **短期(2026-2028)**:错误率降低一个数量级,应用规模扩大两个数量级(citation:3)
- **中期(2029-2032)**:多模态融合成熟,AI能力接近普通个体
- **长期(2033+)**:AGI实现,AI成为日常基础设施
**中国AI的全球坐标:**
- **优势**:用户规模、应用场景、数据资源
- **劣势**:算力芯片、基础理论、高端人才
- **机会**:开源生态、垂直应用、技术普惠
- **挑战**:地缘政治、监管不确定性、资本耐心
**Minimax的未来可能:**
- **乐观情景**:成为全球前五的AGI公司,实现技术普惠
- **基准情景**:在C端AI应用领域占据领先地位
- **悲观情景**:在算力与开源的双重压力下被并购或转型
**时代启示:**
- **技术民主化**:DeepSeek证明了低成本AI的可能性(citation:14,15)
- **中国路径**:不同于硅谷的"技术垄断",探索"技术普惠"模式
- **个人使命**:在AGI时代,每个技术从业者都有机会参与历史
---
### 附录(约5,000字)
#### 附录一:Minimax技术演进时间线
- 2021.11:公司成立
- 2022:abab 6发布(国内首个MoE)
- 2023:星野、海螺AI上线
- 2024:abab 6.5(万亿参数)
- 2025.06:技术产品"五连发"
- 2025:Talkie年收入7000万美元
#### 附录二:闫俊杰关键访谈语录精选
- 关于AGI愿景:"应该成为日常生活的一部分"(citation:3)
- 关于竞争:"期待跟王者一决高下"(citation:1)
- 关于商业化:"不是当前最重要的关注点"(citation:3)
- 关于长期主义:"坚持创新而非短期变现"(citation:14,15)
#### 附录三:AI创业环境数据与图表
- 2021-2025年中国AI大模型融资趋势
- DeepSeek与OpenAI性能/成本对比(citation:14,15)
- "6+2"格局公司估值与产品矩阵(citation:11)
---
## 写作执行方案
### 资料收集与验证计划
1. **公开资料**:已整合citation:1-17的所有信息
2. **补充采访**:建议联系《罗永浩的十字路口》节目组获取完整访谈
3. **行业报告**:量子位、智东西等机构的深度报告
4. **竞品分析**:智谱、月之暗面、百川的公开信息
5. **用户访谈**:海螺AI、星野的深度用户反馈
### 写作风格控制
- **纪实性**:所有事实陈述均有来源标注,合理推断明确标识
- **思辨性**:每个重大决策后附"决策逻辑分析"与"历史假设"
- **方法论**:每章结尾提炼"可复用的原则"
- **克制性**:避免"颠覆""革命"等夸张词汇,用"演进""突破"
### 风险与挑战
1. **信息不足**:Minimax作为未上市公司,部分财务与运营数据不透明
- 应对:依赖公开访谈、行业报告,对未知部分保持诚实
2. **观点偏颇**:避免陷入企业宣传视角
- 应对:引入竞争者、投资人、用户等多方视角,保持批判性
3. **时代局限**:2026年后的预测可能失准
- 应对:区分"事实"与"判断",为未来留下修正空间
### 交付物标准
- **结构完整性**:编/章/节三级标题清晰
- **内容密度**:每章3000-5000字,确保信息量与思想深度
- **引用规范**:每页至少1-2个citation,关键论点必有来源
- **可读性**:每章设置"核心洞察""决策模型""启示"等小结框
---
## 核心洞察与价值主张
**本书的独特价值:**
1. **历史标本价值**:记录中国AI创业从"模式创新"到"技术创新"转型期的完整样本
2. **思想实验价值**:通过闫俊杰的决策,探讨"技术理想主义"与"商业现实主义"的边界
3. **方法论沉淀价值**:从具体事件中抽象出可复用的创业与成长框架
4. **时代精神价值**:呈现2020年代中国科技创业者在不确定性中的信念与行动
**最终目标:**
让读者在10年后重读时,依然能从中获得关于技术、商业、人生的深刻启示。这本书不仅是Minimax的传记,更是一部关于"如何在变革时代做艰难但正确选择"的行动指南。
---
*(本纲要约8,000字,为10万字完整著作的详细蓝图。实际写作中,每个章节将展开至3,000-5,000字,通过深度访谈、数据分析、场景还原等方式,构建一部兼具传记价值、商业研究价值与思想沉淀价值的长期作品。)*
根据上面的写作框架,开始写作。每完成一部分之后,提示用户继续写作下一部分。


