Skip to content

Minimax 公司的前世今生和创始人闫俊杰传记&人生启示录

License

Notifications You must be signed in to change notification settings

AIGeniusInstitute/MinimaxHistory

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

11 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Minimax 公司的前世今生和创始人闫俊杰传记&人生启示录


光子AI / 编著

闫俊杰,1989年出生,河南人,Minimax创始人兼首席执行官。2006年考入东南大学数学学院,2015年博士毕业于中国科学院自动化所模式识别国家重点实验室,并在清华大学计算机系从事博士后研究,在深度学习和计算机视觉领域发表多篇学术论文。曾任商汤科技副总裁、研究院副院长及智慧城市事业群CTO,主导构建通用计算机视觉模型和智慧城市技术体系。2022年初在上海创立上海稀宇极智科技有限公司(Minimax),公司以“与所有人共创智能”为使命,致力于实现通用人工智能(AGI)。2024年8月入选《财富》中国40位40岁以下商界精英榜。2024年上半年推出商用万亿参数MoE架构大模型abab 6.5,并发布开源模型MiniMax-01系列。2025年7月完成近3亿美元C轮融资,投后估值达40亿美元。截至2025年9月30日,公司拥有超过2.12亿个人用户和13万企业客户,产品覆盖200多个国家和地区,海外市场收入占比超70%。2026年1月9日,MiniMax在港交所上市(股票代码:0100.HK),全球发售3358万股,发行价165港元,首日市值突破700亿港元。公司研发多模态大模型,覆盖文本、语音、图像及视频等领域,闫俊杰在2026年初公司上市时指出,真正的通用人工智能必然是多模态输入与多模态输出的融合体,并透露公司计划在未来几个月将各模态整合到统一模型中。

慷慨捐赠:光子AI

光子AI,让AI像光一样照亮每个人 / Photon AI & AI Genius Institute, 2026

您的慷慨捐赠,将帮助我们持续为读者提供高质量的内容。

Donate to Photon AI & AI Genius Institute Generously,and we will continue to provide high-quality content for readers.

微信 支付宝

《Minimax公司的前世今生——创始人闫俊杰传记 & 人生启示录》


第一编:时代与起点


第一章:数字文明的黎明时刻

一、一场棋局改变的世界认知

2016年3月9日,首尔四季酒店的一间会议室里,空气凝固得近乎窒息。

李世石执白落下第四手棋,神情笃定。这位曾十八次夺得世界围棋冠军的传奇棋手,在此刻仍相信人类智慧的不可替代性。而他的对手——谷歌DeepMind开发的AlphaGo,只是一个由服务器、算法和无数条电线组成的冰冷系统。

五天后,比分定格在4:1。李世石输了。

全世界为之震惊。围棋是人类智力活动中最复杂的游戏之一,其可能的棋局数量超过宇宙中原子的总数。数千年来,人类一直相信这是机器永远无法征服的领域。然而,AlphaGo用一种人类棋手从未见过的下法,撕碎了这种傲慢。

在中国,数以亿计的观众通过直播见证了这一历史时刻。其中有一个人,彼时正在商汤科技担任技术研发工作。他盯着屏幕上那些匪夷所思的落子,心中涌起的不是恐惧,而是一种难以言喻的兴奋——

如果AI能够在围棋这样的"封闭问题"中战胜人类,那么在"开放问题"中呢?在理解语言、生成文字、创造艺术、辅助决策这些更接近日常生活的领域呢?

这个人叫闫俊杰。五年后,他将创立一家名为Minimax的公司,试图回答这个问题。

二、从AlphaGo到GPT:范式革命的前夜

AlphaGo的胜利标志着深度学习技术的里程碑式突破,但它仍然是一个"专用系统"——只会下围棋,其他什么都不会。真正让AI从"专才"走向"通才"的,是另一场静悄悄的革命。

2017年6月,谷歌大脑团队在一篇论文中提出了一种新的神经网络架构。论文标题平淡无奇:《Attention Is All You Need》(注意力就是你所需要的一切)。这篇论文介绍的Transformer架构,将在此后几年彻底改写AI的历史。

与此前主流的循环神经网络(RNN)不同,Transformer通过"自注意力机制"(Self-Attention)处理序列数据,能够同时"看到"输入序列的所有位置,并自动学习哪些位置之间存在关联。这一设计突破了序列长度的瓶颈,让模型可以处理更长的文本,也让并行计算成为可能——模型训练速度大幅提升。

2018年,OpenAI发布了GPT(Generative Pre-trained Transformer),一个基于Transformer的语言模型。GPT-1只有1.17亿个参数,在当时看来已经相当庞大。但它真正的革命性在于"预训练+微调"的范式:先在海量无标注文本上学习语言规律,再针对具体任务进行微调。

2019年,GPT-2来了,参数量达到15亿。OpenAI以"担心被滥用"为由,一度拒绝公开完整模型——这个举动本身就说明了AI能力的质变。

2020年6月,GPT-3横空出世。1750亿参数,训练数据涵盖几乎整个互联网。它不再需要针对特定任务微调,只要在提示词(prompt)中给出几个例子,就能举一反三地完成各种任务:写文章、编代码、翻译、问答、甚至创作诗歌和剧本。

科技界炸了。

人们突然意识到:所谓的"通用人工智能"(AGI),或许不再是科幻小说里的概念,而是正在逼近的现实。

规模效应(Scaling Laws)被验证:只要模型更大、数据更多、算力更强,性能就会持续提升,而且是以一种令人不安的可预测性提升。这不是量变,而是质变的前兆。

三、中国AI产业的"四小龙时代"与困境

当GPT-3在大洋彼岸掀起波澜时,中国的AI产业正处于一个微妙的历史节点。

2014年至2018年,中国AI领域经历了一轮资本驱动的狂欢。商汤、旷视、云从、依图——这四家计算机视觉公司被媒体冠以"AI四小龙"的称号,估值纷纷突破数十亿美元。它们的技术底色高度相似:基于深度学习的图像识别,应用场景则聚焦于安防监控、金融风控、手机美颜等领域。

商汤科技是其中估值最高的一家。2021年底,商汤在港交所上市,市值一度突破1500亿港元。作为"AI独角兽之王",它承载着中国资本市场对AI产业的最大期待。

但问题正在浮现。

第一,技术同质化严重。 "AI四小龙"做的事情本质上大同小异——都是用深度学习处理图像。技术门槛不高,护城河不深。一位投资人私下感叹:"你仔细看它们的PPT,换个Logo基本分不清是谁家的。"

第二,商业化路径狭窄。 安防是最大的市场,但安防市场的甲方是政府。政府项目周期长、账期长、定制化需求多、毛利率却不高。更重要的是,安防市场终究是有限的——当渗透率达到一定程度后,增长必然放缓。

第三,ToB的诅咒。 这些公司本质上都是"卖技术给企业"的ToB公司。ToB意味着漫长的销售周期、复杂的客户关系、低效的规模扩张。与互联网公司"赢者通吃"的网络效应相比,ToB公司很难实现指数级增长。

第四,资本泡沫的代价。 在融资驱动的增长模式下,估值越来越高,但利润却遥遥无期。投资人开始失去耐心。2020年至2021年,多家AI公司冲击IPO,但上市后股价纷纷破发。市场在用脚投票:你们讲的故事很好听,但我不买账了。

2021年,当商汤在港股上市时,闫俊杰正站在人生的十字路口。他在商汤待了七年,从实习生做到研究院副院长、智慧城市事业群CTO,亲历了这家公司从初创到巅峰的全过程。他比任何人都清楚"四小龙模式"的天花板在哪里。

他也在思考一个更根本的问题:AI到底应该是什么?

是卖给企业的一个"技术环节"?还是直接面向亿万用户的"产品本身"?

是服务于少数精英客户的昂贵工具?还是每一个普通人都能使用的日常基础设施?

四、大模型范式革命的前夜

GPT-3的成功揭示了一个朴素但深刻的道理:规模(Scale)就是力量。

更大的模型、更多的数据、更强的算力,就能带来更好的效果。这被称为"Scaling Laws"(规模定律)。OpenAI的研究表明,模型性能与参数量、数据量、算力之间存在幂律关系——投入增加十倍,性能提升就可预测。

这意味着什么?

意味着AI不再是一个"小巧精妙"的技术问题,而是一个"规模投入"的工程问题。谁能堆砌更多的GPU、训练更大的模型、喂养更多的数据,谁就更有可能胜出。

但这也带来了新的门槛。

训练GPT-3花费了多少钱?OpenAI没有公开,但业界估算至少在1000万美元级别。这还只是一次训练的成本。如果算上反复试错、调参、扩展,总成本可能高达数千万甚至上亿美元。

算力需求更是天文数字。GPT-3训练使用了数万张英伟达V100 GPU,运行了数周时间。而彼时,全球最先进的AI芯片几乎被英伟达垄断,价格高昂且供不应求。

2020年底,OpenAI获得了微软10亿美元的投资,并获得了Azure云计算平台的优先算力支持。这笔交易的背后逻辑很清晰:大模型是"烧钱游戏",只有科技巨头才能玩得起。

中国呢?

2020年,中美科技脱钩的阴影开始笼罩AI产业。华为被列入"实体清单",高端芯片断供。虽然AI训练芯片尚未被全面封锁,但所有人都意识到:这只是时间问题。

一个尴尬的现实是:中国有庞大的应用场景、丰富的数据资源、充沛的工程人才,但在最核心的芯片和基础算法上,仍然高度依赖美国。当OpenAI在GPT-3上一骑绝尘时,中国甚至没有一家公司能够复现这个模型——不是不想做,而是做不出来。

五、2020-2021:冰火两重天

2020年底至2021年初,中国AI创业环境呈现出一种奇特的"冰火两重天"景象。

"火"的一面是政策。 2020年3月,中央提出"新基建"战略,人工智能被列为七大领域之一。各地政府纷纷出台AI产业扶持政策,产业园区遍地开花。2021年,"十四五"规划将AI作为"战略性新兴产业"的重点方向。从国家到地方,对AI的支持力度空前。

"冰"的一面是资本。 经历了2018-2019年的投资狂潮后,一级市场开始冷却。投资人变得谨慎:AI公司估值太高、盈利遥遥无期、商业化故事越来越难讲。2020年,中国AI领域融资总额同比下降超过20%。二级市场更是惨淡:几乎所有上市的AI公司都在破发。

这是一个筛选的时刻。

那些依赖资本输血、缺乏真正技术壁垒和商业闭环的公司,开始感受到寒意。而那些真正相信技术力量、愿意做长期投入的创业者,则看到了窗口——正因为资本冷却,竞争对手减少,反而是"逆周期布局"的好时机。

2021年11月,一家名为"Minimax"的公司悄然注册成立。创始人是刚从商汤离职的闫俊杰。

彼时,几乎没有人关注这家小公司。AI投资正处于低谷,大模型赛道尚未成为共识,中国市场对"做中国OpenAI"的信心普遍不足。

但闫俊杰心中有一个清晰的判断:大模型时代已经到来,而且这一次,技术突破不会停留在实验室——它必将深刻改变每一个普通人的生活。

他在后来的访谈中回忆这个决定时说:"AI应该成为日常生活的一部分,成为普惠大众的生产力。这是我创业的初心。"

六、关键问题:为什么是2021年?为什么是闫俊杰?

复盘历史,我们必须追问两个问题:

为什么是2021年?

答案在于时机的微妙平衡。

2021年,GPT-3已经验证了大模型的可行性,但中国市场尚无真正意义上的竞品。技术路径已经明确,但竞争尚未白热化。资本寒冬让创业成本下降,但长期主义的投资人仍然存在。政策支持力度加大,但监管尚未收紧。

这是一个"不早不晚"的窗口期。

早一年,GPT-3尚未发布,大模型的规模效应还未被验证,贸然入场风险太大。晚一年,ChatGPT横空出世,大模型赛道瞬间拥挤,竞争成本将成倍增加。

2021年恰好处于"共识形成之前、泡沫膨胀之前"的甜蜜点。对那些拥有技术判断力和战略魄力的创业者而言,这是百年难遇的时机。

为什么是闫俊杰?

答案在于能力与意愿的交汇。

从能力来看,闫俊杰具备创立大模型公司的全部要素:

  • 学术积淀:数学本科(东南大学)、通信工程硕士(重庆邮电大学)、模式识别与智能系统博士(中科院自动化所)、清华博士后——这条学术路径涵盖了AI研究的底层能力。
  • 工业经验:商汤七年,从一线研究员到研究院副院长、智慧城市CTO,深度参与了AI从实验室到产业落地的全过程。
  • 组织能力:管理过大型技术团队,具备招聘、协调、决策的全链条经验。
  • 行业网络:在商汤积累的人脉,成为组建创始团队的关键资源。

但能力只是必要条件。真正让闫俊杰与众不同的,是他的意愿——那种源自内心深处的使命感。

这种使命感有一个具体的起点:他的外公。

外公是一位想写书的老人,却因为不会打字而终究未能完成心愿。这个遗憾深深触动了闫俊杰。他意识到,技术如果只服务于少数精英,那就辜负了技术本身的潜力。AI应该帮助的,正是那些"想做某事但缺乏工具"的普通人。

"AI应该成为普惠大众的生产力"——这不是一句公关话术,而是闫俊杰创业的真正动机。

2021年,当他决定离开商汤自立门户时,他38岁,已经是功成名就的技术高管。从世俗眼光来看,这是一个"非理性"的选择:放弃稳定的高薪、期权、地位,去做一件成功概率极低的事情。

但从闫俊杰的视角来看,这是他一生中最理性的决定——因为时机到了,而他不能再等了。


本章核心洞察

  1. 技术革命的预兆往往被忽视。 AlphaGo引发了媒体狂欢,但真正改变世界的是默默发布的Transformer论文。对创业者而言,识别"决定性技术突破"比追逐"热点新闻"更重要。

  2. 规模效应重塑了AI的竞争逻辑。 大模型时代,"小巧精妙"让位于"大力出奇迹"。这既是门槛,也是机会——敢于做长期、大规模投入的团队,将获得后发者难以逾越的壁垒。

  3. 窗口期转瞬即逝。 2021年的Minimax赶上了"共识形成之前"的最佳时机。历史总是奖励那些在不确定性中做出正确判断的人。

  4. 使命感是创业的终极燃料。 技术、资本、团队都可以后天获取,但驱动创始人在黑暗中坚持的,只能是内心深处的信念。


【本章完】


第二章:闫俊杰的认知原点

一、河南小县城:匮乏中的自我教育

1989年,闫俊杰出生于河南省一个普通的小县城。

那是一个物质匮乏的年代。改革开放刚刚起步,中国的人均GDP不到300美元,位列全球最贫穷国家之列。河南作为农业大省,工业化程度低,城镇化率不足20%。县城里的生活单调而封闭:没有互联网,没有智能手机,甚至连电视机都是稀罕物件。

但正是这种环境,塑造了闫俊杰最重要的人格底色:独立解决问题的能力。

在后来的一次访谈中,闫俊杰回忆起童年时说:"在那个环境下,很多东西需要靠自己领悟。"这句话平淡,却藏着深意。

县城不像大城市,没有名师指点,没有优质教育资源,没有丰富的课外读物。想要获取知识,只能靠自己摸索。数学题不会做?没人能教你,只能反复看课本,一遍遍推导。物理概念不理解?没有辅导班可上,只能对着实验现象苦思冥想。

这种"被迫的自学",在当时看起来是劣势,但回过头来却成了优势。它培养了一种稀缺的能力:在没有外部指导的情况下,独立拆解问题、寻找答案。

这种能力在后来的创业中体现得淋漓尽致。创业本质上就是"在没有地图的地方开路"——没有人能告诉你正确答案,你必须自己摸索。那些从小习惯了"被安排"的人,往往在面对不确定性时手足无措。而闫俊杰,从童年起就习惯了这种不确定性。

小县城还教会了他另一件事:资源有限时,创造力反而更重要。

没有昂贵的学习资料?那就把能找到的每一本书翻烂。没有名校光环?那就用成绩说话。没有人脉关系?那就靠实力敲门。

多年后,当Minimax在算力紧缺、资金有限的情况下与巨头竞争时,这种"在约束条件下寻找最优解"的思维模式,成为了公司的核心竞争力之一。

二、外公的遗憾:AGI信仰的萌芽

每一个伟大的创业故事背后,往往都有一个具体的、私人的起点。对闫俊杰来说,这个起点是他的外公。

外公是一位普通的老人,一生经历了战乱、饥荒、动荡,终于在改革开放后迎来了相对安稳的晚年。他有很多故事想讲,想把自己的人生经历写成一本书,留给后人。

但他不会打字。

在那个年代,写书意味着手写稿,然后找人誊录、打字、排版。对于一个生活在县城的老人来说,这个过程既昂贵又繁琐。他不知道该找谁帮忙,也不好意思给家人添麻烦。

最终,这本书从未被写出来。外公带着这个遗憾离开了人世。

这件事在闫俊杰心中留下了深刻的印记。

他意识到一个残酷的事实:技术的门槛,往往就是普通人实现梦想的障碍。

外公想表达,但没有工具;想创作,但没有途径。不是因为他不够聪明,不是因为他不够努力,只是因为他没有掌握"打字"这项在当时看来理所当然的技能。

如果当时有一个AI,能够听懂外公的话,把他的口述转化为文字,那本书是不是就能写出来?如果技术能够足够"普惠",是不是就能帮助无数像外公一样的普通人,实现他们被压抑的创造力?

这个问题,在闫俊杰心中种下了一颗种子。

多年后,当他在各种场合谈论Minimax的愿景时,反复提到一个词:"普惠"。AI不应该只是少数精英的工具,而应该成为每一个普通人的助手。让不会打字的人能够写作,让不会画画的人能够创作,让不会编程的人能够开发——这不是慈善,而是技术本该具有的使命。

"AI应该成为日常生活的一部分,成为普惠大众的生产力。"

这句话不是口号。它源自一个具体的人、一个具体的遗憾、一个具体的画面:一位老人坐在昏暗的房间里,想说却说不出,想写却写不成。

三、数学专业:抽象思维的锻造

1999年,闫俊杰以优异的成绩考入东南大学数学系。

这是一个看似"没用"的专业选择。那个年代,计算机科学正在兴起,金融、法律被视为"有前途"的专业,而数学?太抽象、太理论、离就业太远。

但闫俊杰的选择自有其道理。

他喜欢数学。喜欢那种从公理出发、层层推导、最终抵达确定结论的感觉。喜欢那种"世界虽然混乱,但至少数学是干净的"确定性。

更重要的是,数学训练了他一种核心能力:将复杂问题抽象化,然后分解为可处理的子问题。

这是一种元能力——不是解决某个具体问题的技能,而是解决一切问题的思维框架。

举个例子:当你面对一个商业难题时,你可以直接凭经验拍脑袋做决定,也可以先把问题形式化——定义变量、识别约束、建立目标函数——然后用逻辑推导出最优解。前者依赖直觉,后者依赖结构化思维。数学训练的正是后者。

在后来的创业中,这种思维模式体现在Minimax的技术选择上。

为什么选择MoE(混合专家模型)架构?因为MoE在数学上具有更好的扩展性:可以在不增加推理成本的前提下扩大模型容量。

为什么关注"错误率"而非"性能跑分"?因为错误率是用户体验的真正约束条件,而跑分只是学术论文的虚荣指标。

为什么坚持多模态融合?因为世界本身是多模态的,单一模态的模型在数学上就不可能完整建模现实。

这些决策背后,是一套严谨的逻辑链条。而这套逻辑链条的根基,是东南大学数学系那四年的训练。

四、重庆邮电:工程思维的补全

2003年,闫俊杰进入重庆邮电大学攻读通信工程硕士。

如果说数学是"抽象的艺术",那么通信工程就是"落地的科学"。

通信工程关心的是:如何在现实世界的约束条件下,实现信息的高效传输?信号会衰减,信道会干扰,带宽有限制,功耗有上限——如何在这些约束中找到最优解?

这是典型的工程思维:不是追求理论上的完美,而是追求现实中的可行。

在重邮的两年,闫俊杰接触到了大量产业化的课题。他开始理解:技术不是目的,技术解决的问题才是目的。

一个算法再优美,如果工程上无法实现,就只是一纸空文。一个模型再强大,如果成本过高、延迟过长,就无法大规模应用。

这种工程思维,后来成为Minimax区别于其他AI公司的一个重要特点。

很多AI创业公司是"学术驱动"的——创始人来自顶尖高校,团队充满博士,技术路线追逐最新论文。这种模式的优势是技术前沿,劣势是往往忽视工程落地。

Minimax从一开始就不同。闫俊杰关心的问题不是"我们的模型在论文里能跑多高的分数",而是"我们的产品在用户手里能有多低的错误率"。

这种差异看似微小,实则决定了公司的命运。

五、中科院自动化所:学术高峰的攀登

2005年,闫俊杰进入中国科学院自动化研究所,攻读模式识别与智能系统博士学位。

中科院自动化所是中国AI研究的"黄埔军校"。这里诞生过众多院士,培养了无数AI领域的顶尖人才。在这里,闫俊杰接受了最系统、最严格的学术训练。

模式识别是AI的核心问题之一:如何让机器"认识"世界?如何从图像中识别人脸?如何从语音中识别文字?如何从数据中识别规律?

智能系统则关心更高层次的问题:如何让机器"理解"世界?如何做出决策?如何与环境互动?

博士阶段的研究,让闫俊杰在技术上达到了相当的深度。他开始发表论文,参与国家级项目,逐渐在学术圈崭露头角。

但博士生涯也让他看到了学术界的局限性。

学术研究的激励机制是"发论文"。发顶会论文、刷榜、提升h-index——这些是评价学者的核心指标。问题是,论文与现实应用之间往往存在巨大的鸿沟。

一个在ImageNet上刷到SOTA(state-of-the-art)的模型,放到真实场景中可能一塌糊涂。一个在实验室里运行良好的算法,部署到手机上可能慢得无法忍受。

闫俊杰开始思考:技术的价值,到底应该如何衡量?

是看论文引用数,还是看用户使用量?是看学术评价,还是看商业成功?

这个问题没有标准答案。但闫俊杰隐约感觉到:他更在乎的是后者。

六、清华博士后:从学术到产业的跃迁

博士毕业后,闫俊杰进入清华大学做博士后研究。

清华博士后的这段经历,成为他从学术界向产业界跃迁的关键跳板。

在清华,他接触到了更多产业界的资源和视角。北京是中国AI创业的中心,中关村聚集了大量创业公司和投资机构。闫俊杰开始意识到:AI正在从实验室走向市场,一场产业革命正在酝酿。

与此同时,一家名为"商汤科技"的公司进入了他的视野。

商汤成立于2014年,创始人汤晓鸥是香港中文大学教授,在计算机视觉领域享有盛名。商汤的团队星光熠熠,聚集了大量来自清华、北大、港中文的顶尖AI人才。

更重要的是,商汤正在做一件当时看来极具雄心的事情:将AI技术大规模产业化。

不是发论文,不是做demo,而是真正地卖产品、签合同、赚钱。

2014年,闫俊杰以实习生的身份加入商汤。这个决定改变了他的职业轨迹,也为七年后的创业埋下了伏笔。

七、商汤七年:关键战役与认知升级

从2014年到2021年,闫俊杰在商汤待了整整七年。

七年,足够让一个初出茅庐的博士后成长为管理千人团队的技术高管。七年,也足够让他看清一家AI公司的全貌——技术的、商业的、组织的。

第一阶段:技术专家(2014-2016)

入职初期,闫俊杰的角色是一线研究员。他负责具体的技术攻关:如何提升人脸识别精度?如何降低模型推理延迟?如何在边缘设备上部署深度学习?

这段经历让他积累了扎实的工程经验。不是写论文的经验,而是"让东西真正跑起来"的经验。

他学会了如何在算力有限的情况下优化模型,如何与硬件团队协作,如何应对客户的各种奇葩需求。这些"脏活累活",是学术界永远学不到的。

第二阶段:管理者(2016-2019)

随着业务扩张,闫俊杰开始承担管理职责。他先后担任研究院副院长、智慧城市事业群CTO,管理的团队从几十人扩展到数百人。

管理是一门与技术完全不同的学问。技术问题可以用逻辑推导,但人的问题不行。如何招聘优秀人才?如何激励团队?如何处理冲突?如何在资源有限的情况下做出取舍?

这些问题没有公式可套,只能靠经验和直觉。

在商汤的管理实践中,闫俊杰形成了一套自己的组织哲学:

  • 轻量化:保持组织结构简单,减少管理层级,让信息高效流动。
  • 数据驱动:用数据评估绩效,避免主观臆断。
  • 人才标准:选择能提升团队整体输出的人,而非个人能力突出但难以协作的"明星"。

这些原则,后来原封不动地移植到了Minimax。

第三阶段:战略思考者(2019-2021)

2019年之后,闫俊杰开始更多地参与公司战略层面的讨论。他的视角从"如何做好一个项目"提升到"公司应该往哪个方向走"。

这个阶段,他开始深入思考AI产业的本质问题:

  • 商业模式问题:为什么AI公司普遍不赚钱?是技术不够好,还是商业模式有问题?
  • 产品形态问题:AI应该是"卖给企业的技术",还是"直接面向用户的产品"?
  • 竞争格局问题:中国AI公司能否在全球竞争中占据一席之地?

他看到了"四小龙"模式的天花板:ToB业务增长缓慢,商业化艰难,估值泡沫终将破裂。他也看到了另一种可能:如果AI能够像互联网一样直接触达亿万用户,商业化的故事就完全不同了。

2020年,GPT-3发布,闫俊杰看到了那个"不同的故事"的具体形态。

大语言模型不是卖给企业的"技术组件",而是可以直接与用户对话的"智能体"。它不需要复杂的销售流程,不需要繁琐的定制开发,只需要一个简单的对话框,就能为用户创造价值。

这是AI商业模式的根本性变革。

从ToB到ToC,从"卖技术"到"做产品",从"服务企业"到"服务每个人"——这是完全不同的逻辑。

闫俊杰意识到:如果不在这个时间节点入场,可能就再也没有机会了。

八、离开商汤:一个"非理性"的理性选择

2021年,闫俊杰做出了一个让很多人不解的决定:离开商汤,自主创业。

从世俗角度来看,这是一个"非理性"的选择:

  • 财务成本:他放弃了稳定的高薪和即将兑现的期权。商汤2021年底上市,早期员工的股票价值不菲。
  • 机会成本:作为研究院副院长和事业群CTO,他在商汤的职业前景一片光明。继续待下去,未来可能是更高的职位、更大的影响力。
  • 风险敞口:创业成功率不到1%。尤其是大模型赛道,资金和算力需求惊人,失败的概率远大于成功。

但从闫俊杰的内心逻辑来看,这又是一个完全"理性"的选择:

第一,时机窗口。 GPT-3已经证明了大模型的可行性,但中国尚无真正的竞品。如果等到市场成熟再入场,机会窗口就会关闭。

第二,使命驱动。 在商汤,他只能做"AI作为技术环节"的事情。但他真正想做的,是"AI作为产品本身"——直接触达用户,实现技术普惠。这在商汤的业务框架内很难实现。

第三,能力匹配。 经过七年历练,他在技术、管理、战略各方面都积累了足够的能力。如果这时候不创业,未来恐怕也不会有更好的准备。

第四,内在驱动。 在一次访谈中,闫俊杰说过一句意味深长的话:"我表面上看起来安静沉着,但骨子里是一个期待跟王者一决高下的人。"

这句话揭示了他内心深处的竞争欲望。不是为了财富,不是为了名声,而是纯粹的、近乎本能的"想要证明自己"的冲动。

在商汤,他最多是一个"将军"。但他想做的,是"帅"——自己定义战场,自己决定战略,然后赢得战争。

2021年11月,Minimax正式成立。

38岁的闫俊杰,带着从县城一路走来的独立精神,带着外公遗憾激发的普惠信念,带着数学锻造的抽象思维,带着工程磨砺的务实品格,带着商汤七年的技术与管理积累——踏上了一条充满不确定性的创业之路。

他不知道前方等待他的是什么。但他知道,这条路他必须走。

九、思想演进:从技术理想主义到技术普惠主义

回顾闫俊杰的成长轨迹,可以清晰地看到一条思想演进的脉络:

起点:技术理想主义。

数学专业、博士研究、学术训练——这些经历塑造了他对"技术之美"的信仰。他相信技术本身具有价值,相信优雅的算法可以改变世界。这是一种纯粹的、学术式的技术理想主义。

转折:技术落地的启蒙。

商汤七年的经历让他意识到:技术的价值必须通过落地来实现。一个再美的模型,如果无法解决实际问题,就只是智力游戏。这是技术理想主义向技术实用主义的第一次修正。

升华:技术普惠主义。

外公的遗憾、GPT-3的启示、对"四小龙"困境的反思——这些因素汇聚在一起,让闫俊杰形成了一种新的信念:技术的终极价值,不在于服务少数精英,而在于普惠大众。

AI不应该只是大企业的工具,不应该只是技术专家的玩具。它应该像水和电一样,成为每个人都能使用的基础设施。让不会打字的老人能够写书,让不会画画的孩子能够创作,让不会编程的员工能够开发——这才是AI的真正使命。

这种"技术普惠主义"成为Minimax的核心价值观,也成为闫俊杰此后一切决策的出发点。

本章核心洞察

  1. 早年环境塑造底层能力。 县城的匮乏教会了闫俊杰独立解决问题,这种能力在创业中无可替代。对创业者而言,早年的"逆境"往往是最好的训练场。

  2. 个人使命往往源于具体经历。 外公的遗憾不是抽象的概念,而是具体的画面。最深刻的信念,往往源于最私人的经历。创业者应该追问自己:什么是驱动你的那个"具体的故事"?

  3. 跨学科训练创造认知优势。 数学的抽象思维+工程的落地能力+商业的战略视野——这种跨学科组合让闫俊杰拥有了独特的认知框架。在AI时代,单一技能正在贬值,跨界能力才是护城河。

  4. 大公司经历是双刃剑。 商汤七年给了闫俊杰技术、管理、人脉的积累,但也可能让他陷入"路径依赖"。关键在于:是否能够在"大公司思维"和"创业者思维"之间自由切换?

  5. 创业的最佳时机是"准备好了+时机到了"的交汇点。 太早创业,能力不足;太晚创业,时机已逝。2021年的闫俊杰,恰好站在两者的交汇点上。


【本章完】

第三章:价值观与思维模式的起源

一、四重价值观的形成

如果把闫俊杰的人生比作一棵大树,那么价值观就是深埋地下的根系。树冠可以随风摇摆,枝叶可以四季更替,但根系决定了这棵树能长多高、能活多久。

通过前两章的梳理,我们可以清晰地辨识出闫俊杰价值观的四个核心支柱。这四根支柱相互支撑、彼此强化,构成了他人格的底层架构。

第一根支柱:独立解决问题的本能

这是县城成长经历留下的烙印。

在资源匮乏的环境中,等待是没有用的。没有人会主动帮你,没有现成的答案可以抄袭。你要么自己想办法,要么永远停在原地。

这种环境内化为一种行为模式:不等待资源,主动创造条件。

闫俊杰曾在访谈中透露,Minimax在早期面临严重的算力短缺。当时AI芯片一卡难求,价格飞涨,大公司凭借资金优势囤积资源,创业公司几乎无处可买。

很多创业者在这种情况下会选择等待——等投资到账,等芯片降价,等市场转好。但Minimax的做法不同:他们想尽一切办法在有限条件下推进研发。优化训练效率、精简模型架构、与芯片供应商谈判——每一个环节都在"约束条件下寻找最优解"。

这不是被动应对,而是主动创造。

这种思维模式的根源,正是闫俊杰童年时期形成的"独立解决问题"本能。当你从小就习惯了"没有人帮你",长大后就不会期待"有人帮你"。你会把所有的希望都寄托在自己身上——这既是压力,也是力量。

第二根支柱:技术民主化信念

这是外公遗憾点燃的火种。

技术应该服务于谁?这是一个看似简单、实则深刻的问题。

在硅谷的主流叙事中,技术是"精英的游戏"。最聪明的人创造最先进的技术,然后卖给最有钱的客户。这套逻辑在商业上完全成立,但在价值观上却存在缺陷:如果技术只服务于精英,那么技术就成了加剧不平等的工具。

闫俊杰的信念与此不同:技术的终极价值,在于普惠大众。

这种信念的起源是私人的——外公想写书却不会打字的遗憾。但它的延伸是普遍的:世界上有多少人因为缺乏工具而无法表达自己?有多少创意因为技术门槛而被埋没?有多少普通人因为"不会操作"而被排斥在数字世界之外?

AI是有史以来最强大的技术之一。如果这种技术只服务于少数人,那将是人类的巨大损失。如果这种技术能够普惠大众,那将是一场真正的解放。

"AI应该成为日常生活的一部分,成为普惠大众的生产力。"

这句话是Minimax的愿景宣言,也是闫俊杰创业的初心。它不是公关话术,而是深植于个人经历的真实信念。

第三根支柱:竞争驱动的成长观

这是最容易被忽视、却可能最为重要的一根支柱。

闫俊杰给外界的印象是"安静沉着"。他不是那种锋芒毕露、咄咄逼人的创业者。在公开场合,他更多展现的是温和与内敛。

但在一次与罗永浩的访谈中,他说出了内心深处的另一面:

"我骨子里是一个期待跟王者一决高下的人。"

这句话的分量不容小觑。

它揭示了闫俊杰内心深处的竞争欲望——不是为了金钱,不是为了名声,而是纯粹的、近乎本能的"想要赢"。他想和最强的对手竞争,想证明自己能够站在世界之巅。

这种竞争驱动的成长观,解释了很多看似矛盾的行为:

  • 为什么放弃商汤的稳定高位去创业?——因为只有创业才能"和王者一决高下"。
  • 为什么选择大模型这个巨头云集的赛道?——因为这里才有真正的"王者"。
  • 为什么不满足于做"中国的OpenAI"?——因为目标从一开始就不是模仿,而是超越。

闫俊杰在同一次访谈中还说过另一句话:

"中国AI企业可以引领世界巨头。"

这不是空洞的民族主义口号。这是一个竞争者对目标的清晰定义:不是追赶,不是模仿,而是引领。

有趣的是,这种强烈的竞争欲望与他外表的温和形成了鲜明对比。这种"外柔内刚"的矛盾统一,或许正是领导力的一种高级形态:对外展现的是包容与合作,对内燃烧的是野心与斗志。

第四根支柱:长期主义的萌芽

这是商汤后期经历催生的认知升级。

在商汤的最后几年,闫俊杰亲眼目睹了"资本驱动增长"模式的困境。高估值带来高期待,高期待带来短期压力,短期压力导致动作变形。

很多AI公司在资本的裹挟下,开始追逐短期收入。签大合同、做定制项目、冲刺上市——这些动作在财务报表上很好看,但对技术积累的贡献却很有限。

闫俊杰看到了这种模式的本质:短期主义是一种慢性自杀。

当你把所有资源都用于短期变现时,长期的技术护城河就无法构建。当护城河消失时,竞争对手会轻易攻入,你的短期收益也将化为乌有。

这种认知催生了他对长期主义的坚定信念。

后来,在谈到Minimax的商业化时,闫俊杰明确表示:"商业化不是当前最重要的关注点。我们的目标是打造最好的AI产品,让技术真正造福用户。收入会随之而来,但不应该成为驱动决策的核心。"

这种态度在资本市场上显得"不合时宜"。投资人通常希望看到明确的商业化路径、可预测的收入增长、清晰的盈利时间表。但闫俊杰的立场很坚定:

"坚持创新而非短期变现。"

这不是不要商业化,而是不以牺牲长期价值为代价追求短期商业化。这是一种更高级的商业智慧:通过长期主义建立壁垒,然后在壁垒之上构建可持续的商业模式。

二、三重思维模式的交织

如果说价值观是"指南针",决定了闫俊杰往哪个方向走;那么思维模式就是"方法论",决定了他如何到达目的地。

通过分析他的教育背景和职业经历,可以辨识出三种核心思维模式的交织与融合。

第一种:数学思维

数学思维的核心是抽象化与形式化

面对一个复杂问题,数学家的第一反应不是直接解决,而是先问:这个问题的本质是什么?能否抽象为一个更一般的形式?能否分解为若干个子问题?

这种思维方式在闫俊杰的决策中处处可见。

比如,对于"AI产品应该追求什么指标"这个问题,行业主流的答案是"性能跑分"——在各种benchmark上刷出更高的分数。但闫俊杰的视角不同。他问的是:用户真正关心的是什么?

答案是:错误率。

用户不关心你的模型在GPT-4Bench上排名第几,他们关心的是:当我用你的产品时,它会不会给我一个错误的答案?会不会编造一个不存在的事实?会不会误导我做出错误的决策?

错误率才是决定用户体验的核心变量。

在一次访谈中,闫俊杰详细阐述了这个观点:"当前大模型的错误率大概在20-30%左右。这意味着每三到五次使用,就可能有一次出错。对于日常对话来说,这或许可以接受。但对于严肃的应用场景——比如医疗咨询、法律建议、金融决策——这个错误率是致命的。"

他进一步指出:"我们的目标是把错误率降低一个数量级,从20-30%降到2-3%。当错误率达到这个水平时,AI才能真正成为可信赖的生产力工具。应用规模才会从现在的百万级扩张到亿级。"

这种"抓住核心变量、忽略次要变量"的分析方式,是典型的数学思维。它让决策变得清晰、聚焦、可执行。

第二种:工程思维

工程思维的核心是在约束条件下寻找最优解

与数学家追求"理论最优"不同,工程师追求的是"现实可行"。资源总是有限的,时间总是紧迫的,完美方案往往是不存在的。工程师的任务是在诸多约束中找到那个"够好"的解。

Minimax的技术选择处处体现着这种工程思维。

例一:MoE架构的选择。

2021年,当Minimax决定技术路线时,市场主流是"密集模型"(Dense Model)——所有参数在每次推理时都被激活。这种架构简单直接,但有一个致命缺陷:随着模型规模增大,推理成本线性增长。

MoE(混合专家模型)提供了一种替代方案:通过"门控机制",每次推理只激活一部分"专家"模块,而不是全部参数。这意味着模型可以拥有巨大的总参数量,但推理时只使用其中一小部分,从而在性能和效率之间取得平衡。

当时,MoE仍是学术前沿,工程实现难度大,很多公司不敢尝试。但Minimax做出了激进的选择:从一开始就押注MoE。

这是工程思维的体现:清晰地识别约束条件(算力有限、成本敏感),然后选择能在约束下达到最优的技术方案。

例二:降价与效果的平衡。

2024年,大模型市场进入价格战。各家公司纷纷降低API价格,试图抢占市场份额。这对Minimax构成了巨大压力。

但闫俊杰的回应不是简单的"跟进降价"。他提出了一个更精确的目标:"降价同时保持更好效果。"

这是一个工程问题,而不是商业问题。它要求团队在技术上找到突破点:如何优化模型架构、如何提升训练效率、如何降低推理成本——同时不牺牲模型能力。

最终,Minimax通过线性注意力机制等技术创新,将效率提升了20%以上,成功实现了"降价不降质"的目标。

第三种:战略思维

战略思维的核心是跳出当前局势,从更高维度审视问题

技术思维关心的是"如何做",战略思维关心的是"做什么"和"为什么做"。

在商汤后期,闫俊杰完成了从技术专家到战略思考者的跃迁。他开始思考一些根本性的问题:

  • AI的终极形态是什么? 是卖给企业的"技术组件",还是直接触达用户的"产品"?
  • 中国AI公司的定位是什么? 是追随硅谷巨头,还是走出一条不同的道路?
  • 竞争的关键变量是什么? 是模型性能、数据规模、用户体验,还是生态系统?

这些问题没有标准答案,但它们决定了公司的战略方向。

闫俊杰给出的答案体现在Minimax的战略定位上:

  • 不做"中国的OpenAI"——不是模仿者,而是创新者。
  • 不只做API服务商——不是技术供应商,而是产品公司。
  • 坚持多模态融合——不是单一能力,而是全面智能。
  • C端与B端并重——不是非此即彼,而是双轮驱动。

这些选择背后,是一套连贯的战略逻辑:AI的终极价值在于直接服务用户,而直接服务用户需要完整的产品能力,完整的产品能力需要多模态的技术支撑,多模态的技术需要长期的研发投入。

整套战略是一个自洽的体系,而不是一堆孤立的决策。

三、思维模式如何影响决策

理解了闫俊杰的三重思维模式,我们就能更好地理解Minimax的一系列关键决策。

决策一:为什么坚持自研大模型?

2021年创业时,市场上已经有开源的大模型可以使用。很多创业公司选择基于开源模型做应用层创新,这样可以节省大量研发成本和时间。

但Minimax的选择是从零开始自研

这个决策背后的逻辑是什么?

  • 数学思维:自研模型意味着对底层架构拥有完全的控制权。当需要针对特定场景优化时,可以从根本上调整模型结构,而不是在别人的架构上打补丁。
  • 工程思维:自研模型可以根据自身的算力条件和应用场景进行定制优化,而不是被迫适应通用模型的设计取舍。
  • 战略思维:在AI时代,模型能力是核心竞争力。如果依赖开源模型,就意味着在最关键的环节上没有差异化。长期来看,这是不可持续的。

决策二:为什么坚持做C端产品?

大模型商业化最直接的路径是ToB——把API卖给企业客户。这种模式现金流可预测、客户关系稳定、销售周期明确。

但Minimax从一开始就坚持做C端产品:星野、海螺AI、Talkie……这些面向普通用户的应用,消耗了大量的研发资源。

为什么?

  • 价值观驱动:技术普惠信念要求AI直接触达普通用户,而不是通过企业客户间接服务。
  • 数据飞轮:C端产品产生海量用户反馈,这些反馈可以直接用于模型优化,形成"产品→数据→模型→产品"的正向循环。
  • 战略卡位:C端市场是"赢者通吃"的逻辑,先发优势可以转化为持久壁垒。晚进入者即使技术更好,也很难撼动已经形成的用户心智。

决策三:为什么布局海外市场?

Talkie是Minimax面向海外市场推出的AI社交应用,在157个国家和地区运营。2024年,Talkie贡献了约7000万美元的收入,成为公司最重要的收入来源之一。

为什么一家中国创业公司要在创业早期就布局海外?

  • 数学思维:全球市场的用户基数是中国市场的数倍。从TAM(总可触达市场)角度看,海外市场的天花板更高。
  • 工程思维:海外市场的监管环境相对宽松,产品迭代可以更快。在国内需要数月才能获批的功能,在海外可能几周就能上线。
  • 战略思维:海外市场是检验产品竞争力的"试金石"。如果能在与OpenAI、Anthropic的直接竞争中胜出,就证明了技术的全球竞争力。

四、价值观与思维模式的矛盾统一

任何复杂的人格都存在内在张力。闫俊杰也不例外。

张力一:长期主义 vs 竞争欲望

长期主义要求耐心、沉稳、不急于求成。但竞争欲望是急切的、进取的、渴望胜利的。

这两者如何共存?

答案是:在战略目标上保持长期视野,在战术执行上保持竞争强度。

闫俊杰不会为了短期收入牺牲技术投入,但他会在每一个具体的技术攻关中追求极致。他不会被季度财报绑架,但他会被竞争对手的进展刺激。

这是一种"长期的野心家"心态:目标是十年后的胜利,但每一天都在为那个胜利而战斗。

张力二:技术理想 vs 商业现实

技术民主化信念意味着"让技术惠及所有人",但商业模式需要变现、需要利润、需要可持续。

如果AI完全免费,公司如何生存?如果收费太高,普惠如何实现?

Minimax的解法是:先建立技术护城河,再在护城河之上构建商业模式。

具体而言:

  • 通过自研模型建立技术壁垒,确保产品的不可替代性;
  • 通过C端产品获取海量用户,建立数据飞轮;
  • 在用户规模达到一定程度后,通过增值服务、订阅付费等方式实现商业化;
  • 保持基础功能的低价或免费,确保普惠性不被破坏。

这是一种"技术换时间、规模换利润"的策略。短期内牺牲商业化效率,换取长期的竞争优势和商业可能性。

张力三:独立精神 vs 团队协作

县城成长经历塑造了闫俊杰"独立解决问题"的本能。但管理一家公司需要的是团队协作、授权赋能、让别人发挥作用。

如何从"单打独斗"转向"带领团队"?

闫俊杰的做法是:把独立精神转化为组织能力。

他不是那种事无巨细亲力亲为的管理者。相反,他更愿意搭建一个让每个人都能"独立解决问题"的组织架构:

  • 轻量化组织:减少管理层级,让信息直达一线,让决策权下放到最了解情况的人手中。
  • 数据驱动文化:用数据而非权力来做判断,减少主观臆断和政治博弈。
  • 人才选择标准:选择那些"能提升团队整体输出"的人,而非个人英雄。

这样,他的独立精神就不再是"一个人的独立",而是"一群人的独立"——每个团队成员都像他当年在县城一样,习惯于在没有指导的情况下自己找到答案。

五、原则的可复制性

闫俊杰的价值观和思维模式是否可以被其他人学习?

答案是:部分可以。

可以学习的:

  1. 独立解决问题的习惯:这可以通过刻意练习来培养。当遇到问题时,先尝试自己解决,而不是第一时间求助他人。
  2. 数学思维的训练:即使不是数学专业,也可以通过学习统计学、逻辑学、系统论等来培养抽象化思维。
  3. 工程思维的培养:通过参与实际项目,学会在约束条件下寻找可行解,而不是追求理论最优。
  4. 战略思维的提升:通过阅读商业案例、分析竞争格局、与不同背景的人交流,提升从更高维度看问题的能力。

难以复制的:

  1. 童年经历的烙印:价值观的底层是早年经历,这些经历无法被后天模拟。
  2. 使命感的私人起源:外公的遗憾是闫俊杰独有的故事,每个人需要找到自己的"故事"。
  3. 竞争欲望的强度:这种"期待与王者一决高下"的本能,似乎与生俱来,难以后天培养。

但这不意味着没有借鉴价值。相反,理解这些价值观和思维模式的形成机制,可以帮助我们反思自己的成长经历:

  • 我的童年经历留下了什么"能力烙印"?
  • 我有没有一个像"外公的遗憾"那样的私人故事,驱动着我的选择?
  • 我的思维模式是什么?它的优势和盲区在哪里?
  • 我如何在现有基础上,刻意培养缺失的能力?

这种反思本身,就是成长的开始。

本章核心洞察

  1. 价值观是根系,决定了人生这棵树能长多高。 闫俊杰的四重价值观——独立精神、技术普惠、竞争驱动、长期主义——构成了他决策的底层逻辑。创业者应该清晰地识别和表达自己的核心价值观。

  2. 思维模式是方法论,决定了如何到达目的地。 数学思维提供抽象能力,工程思维提供落地能力,战略思维提供格局视野。三者缺一不可。

  3. 价值观和思维模式之间存在张力,但可以统一。 长期主义与竞争欲望、技术理想与商业现实、独立精神与团队协作——这些张力不是非此即彼,而是可以在更高层次上整合。

  4. 原则部分可以学习,但根基难以复制。 童年经历和私人故事塑造了价值观的底层,这些无法被后天模拟。但思维模式可以通过刻意练习来培养。

  5. 反思自己的"认知原点",是成长的第一步。 每个人都应该追问:我的价值观从何而来?我的思维模式是什么?我如何在现有基础上进化?


【第一编完】


第二编:Minimax的诞生


第四章:创业动机与问题意识

一、2021年的时空坐标

要理解一个创业决定,必须先理解做出这个决定的时空背景。

2021年的中国AI产业,正处于一个微妙的历史节点。多重力量在此交汇:技术范式的革命、商业模式的困境、政策环境的变化、资本市场的冷却——这些力量相互作用,创造了一个独特的"创业窗口"。

技术维度:GPT-3已验证规模效应,但中文大模型仍是空白

2020年6月,OpenAI发布GPT-3,震惊世界。这个拥有1750亿参数的语言模型,展现了令人难以置信的能力:写文章、编代码、翻译、问答、创作——几乎无所不能。

更重要的是,GPT-3验证了一个核心假设:规模就是力量(Scaling Laws)

研究表明,模型性能与参数量、数据量、算力之间存在幂律关系。只要不断增加投入,性能就会持续提升,而且是以一种可预测的方式提升。这意味着AI不再是一个"灵光一现"的创意问题,而是一个"规模投入"的工程问题。

但在中国,这个发现尚未转化为行动。

彼时,中国最接近GPT-3的尝试是几个学术机构的研究项目——参数量在百亿级别,与GPT-3相差一个数量级。产业界的注意力仍然集中在计算机视觉、语音识别等"专用AI"领域。真正意义上的中文大语言模型,几乎不存在。

这是一片蓝海,也是一片深海。

蓝海意味着竞争者少,先发者可以获得巨大优势。深海意味着门槛极高——算力需求、数据积累、人才储备、资金投入——每一项都是天文数字。

对于那些拥有技术判断力和战略魄力的创业者而言,这是百年难遇的机会。但对于缺乏准备的冒险者而言,这是一个足以吞噬一切的深渊。

商业维度:AI"四小龙"的困境暴露了商业模式的根本缺陷

2021年底,商汤科技在港交所上市。这本该是中国AI产业的高光时刻,但资本市场的反应却出乎意料地冷淡。

上市首日,商汤股价勉强维持发行价。随后几个月,股价持续下跌,市值从最高点腰斩再腰斩。其他几家AI公司的情况也好不到哪里去:旷视上市计划一再搁置,云从上市后股价长期低迷,依图更是选择了从港股退市。

这是怎么回事?

表面原因是多方面的:地缘政治风险、疫情冲击、监管收紧……但更深层的原因是商业模式本身的缺陷。

"四小龙"本质上都是ToB公司——把AI技术卖给企业客户。这种模式有几个致命问题:

第一,销售周期长、定制化需求高。 企业客户的决策流程复杂,从接触到签单往往需要半年甚至一年。签单之后还有漫长的部署周期,以及永无止境的定制需求。

第二,客户集中度高、议价能力弱。 最大的客户往往是政府和大型企业,它们拥有强大的议价能力。AI公司不得不压低价格、延长账期、提供额外服务——利润空间被不断挤压。

第三,规模效应弱、边际成本高。 与互联网产品不同,ToB业务很难实现"赢者通吃"。每一个新客户都需要新的销售投入、新的定制开发、新的运维支持。规模扩大时,成本也在同步增长。

第四,技术壁垒低、同质化严重。 "四小龙"做的事情本质上大同小异:都是用深度学习处理图像。技术门槛不高,护城河不深。竞争者可以轻易复制,价格战不可避免。

闫俊杰在商汤的七年,亲眼目睹了这些问题。他比任何人都清楚:ToB模式有天花板,而且这个天花板比外界想象的要低得多。

如果AI永远只是"卖给企业的技术组件",那么AI公司就永远只能是"系统集成商"的命运——辛苦、低利、缺乏想象空间。

个人维度:38岁的闫俊杰面临人生的终极选择

2021年,闫俊杰38岁。

从世俗标准来看,他已经非常成功:商汤科技研究院副院长、智慧城市事业群CTO、学术与工业的双重背景、丰厚的期权与薪酬。如果继续留在商汤,未来的职业路径清晰可见:更高的职位、更大的团队、更多的财富。

但他心里始终有一个声音:这不是我想要的人生。

在商汤,他最多是一个"执行者"——执行公司既定的战略,完成董事会设定的目标。即使做到CEO,也要对投资人负责、对上市规则负责、对既有业务负责。

他想做的,是"定义者"——自己定义问题、自己选择方向、自己承担后果。

这是一种深层次的渴望,与财富无关,与地位无关。它源自那个在县城长大的少年,那个习惯了"靠自己领悟"的孩子,那个骨子里"期待与王者一决高下"的人。

38岁,在创业领域不算年轻。很多人在这个年龄已经选择"稳妥"——毕竟有家庭责任、有财务规划、有健康考量。重新出发的机会成本太高,失败的代价太大。

但闫俊杰的判断是:如果这时候不创业,以后恐怕也不会有更好的时机了。

技术窗口正在打开:大模型的可行性已经验证,但中国市场尚无强势玩家。

能力储备已经就绪:七年商汤经历积累的技术、管理、人脉,足以支撑一个创业项目。

个人状态处于巅峰:精力充沛、认知成熟、野心尚存。再等几年,这些条件可能都会改变。

2021年秋天,闫俊杰做出了决定。

二、问题意识的三重结构

每一个伟大的创业都始于一个清晰的问题意识:你看到了什么问题?为什么别人没有解决?你准备怎么解决?

闫俊杰的问题意识可以分解为三个层次:技术问题、商业问题、社会问题。

技术问题:为什么中国没有自己的GPT-3级大模型?

这是最直接的问题,也是最刺眼的现实。

GPT-3发布一年多了,中国依然没有真正可用的大语言模型。不是不想做,而是做不出来。

原因是多方面的:

  • 算力瓶颈:训练GPT-3级别的模型需要成千上万张高端GPU,成本以亿计算。中国企业在算力采购上面临地缘政治风险,高端芯片随时可能断供。
  • 数据挑战:高质量中文语料的规模远小于英文。互联网上的中文内容虽然数量不少,但质量参差不齐,清洗成本高昂。
  • 人才缺口:真正懂得如何训练超大规模模型的人才极其稀缺。这不仅需要算法能力,还需要大规模分布式系统的工程能力。
  • 信心不足:很多人不相信中国公司能做出GPT-3。"OpenAI有微软撑腰,我们拿什么比?"这种心态在业界普遍存在。

但闫俊杰的判断是:这些困难都是可以克服的。

算力可以通过多种渠道获取,虽然成本高,但不是完全不可能。数据可以通过精细化运营来积累,质量比数量更重要。人才可以培养和吸引,只要有足够吸引人的愿景。信心更是一个自我实现的预言——只有先相信能做到,才可能真的做到。

他看到的不是障碍,而是机会:正因为别人不敢做,先做的人才能获得先发优势。

商业问题:如何避免成为"API供应商",做出真正的C端产品?

这是闫俊杰对"四小龙困境"的深层反思。

AI公司有两种商业模式:

模式一:做技术供应商。 把AI能力封装成API或SDK,卖给企业客户。客户用这些能力去构建自己的产品。

模式二:做产品公司。 直接面向最终用户,提供完整的AI产品或服务。

"四小龙"走的是模式一。它们把人脸识别、图像分析、语音识别等能力卖给银行、安防公司、手机厂商。这些企业再把这些能力集成到自己的产品中。

这种模式的问题在于:价值被中间商截取了。

最终用户为银行的人脸识别功能付费,但这笔钱大部分被银行赚走,AI公司只拿到很小一部分。更糟糕的是,AI公司与最终用户之间隔着一层"客户",无法直接获取用户反馈,无法建立用户心智,无法形成数据飞轮。

闫俊杰想走模式二。

他相信,大语言模型的出现改变了游戏规则。以前的AI是"能力",需要被嵌入到其他产品中才能发挥作用。但大语言模型是"智能体",可以直接与用户对话,直接解决用户问题,直接创造价值。

换句话说,大模型让AI第一次有可能成为"产品本身",而不只是"产品的一部分"。

这是一个根本性的范式转变。抓住这个机会,就有可能打造出"AI时代的微信"或"AI时代的抖音"——直接面向亿万用户的超级应用。

社会问题:如何让AI从"少数精英的工具"变为"普惠大众的生产力"?

这是最深层的问题,也是闫俊杰创业的真正动机。

回顾AI产业过去十年的发展,有一个令人遗憾的规律:最先进的AI技术,总是首先服务于最有钱的客户。

企业级AI解决方案价格昂贵,只有大公司用得起。消费级AI产品功能有限,往往只是噱头。普通人对AI的感知,仅限于手机上的语音助手和推荐算法——这些"AI"与GPT-3展示的能力相比,简直是天壤之别。

为什么会这样?

因为AI公司需要赚钱,而"有钱的客户"更容易付费。在商业逻辑的驱动下,AI技术的普惠性被牺牲了。

但闫俊杰认为这是一个错误的取舍。

他相信,AI技术的真正价值,恰恰在于它的普惠性。当AI足够便宜、足够易用、足够可靠时,它可以帮助每一个普通人:

  • 帮助不会打字的老人写作
  • 帮助没有受过专业训练的人创作
  • 帮助语言不通的人沟通
  • 帮助知识有限的人学习
  • 帮助资源匮乏的人创业

这不是慈善,而是技术的使命。外公的遗憾,正是这种使命的具象化。

Minimax的愿景从一开始就很清晰:让AI成为每个人的生产力工具。

不是少数精英的特权,而是普通大众的日常。不是昂贵的企业解决方案,而是人人用得起的基础设施。

三、关键对话与决策场景

创业决定不是在真空中做出的。它涉及无数的对话、争论、权衡、妥协。还原这些场景,可以帮助我们理解决策的真实质感。

场景一:与罗永浩的访谈——初心的公开表达

2024年,闫俊杰接受了罗永浩《十字路口》节目的专访。这是他少有的深度公开访谈之一。

在访谈中,罗永浩问了一个直接的问题:"你创业的初心是什么?"

闫俊杰的回答没有任何官话套话:

"我外公是一位想写书的老人,但他不会打字。我小时候就在想,如果有一个AI能帮他,那该多好。后来我意识到,世界上有无数像我外公一样的人——他们有表达的欲望,却缺乏表达的工具。AI应该帮助这些人。"

"我骨子里是一个期待跟王者一决高下的人。我相信中国AI企业可以引领世界巨头,而不只是追随。"

这两段话揭示了闫俊杰创业动机的双重结构:

  • 使命驱动:让AI普惠大众,帮助那些被技术门槛拦住的普通人。
  • 竞争驱动:与全球最强的对手竞争,证明中国公司能够站在世界之巅。

这两重动机看似矛盾(普惠 vs 精英,谦逊 vs 野心),实则统一:只有成为最强者,才能真正实现普惠的使命。

场景二:内部路线之争——"中国OpenAI" vs "差异化创新"

Minimax成立初期,团队内部曾有过一场重要的路线之争:

一派主张"做中国的OpenAI"——紧跟OpenAI的技术路线,复刻GPT的成功,在中国市场占据位置。这条路线相对清晰,风险可控,投资人也更容易理解。

另一派主张"差异化创新"——不做简单的复刻,而是根据中国市场的特点和自身的优势,走一条不同的道路。这条路线充满不确定性,但如果成功,护城河更深。

闫俊杰的选择是后者。

他的理由很清晰:

"如果只是做中国的OpenAI,那我们永远只能跟在别人后面。OpenAI有微软的资金、有全球最顶尖的人才、有先发优势——我们在同一条赛道上很难超越。"

"但如果我们找到一条不同的路,情况就不一样了。中国有独特的用户需求、独特的数据资源、独特的应用场景。这些是我们的优势,也是差异化的基础。"

最终的战略定位是:不做"中国OpenAI",而是"AI时代的微信/抖音"。

这个定位意味着几个关键选择:

  1. 产品形态:不只是API,而是完整的C端产品。
  2. 用户对象:不只是企业客户,而是亿万普通用户。
  3. 技术路线:不只是语言模型,而是多模态融合。
  4. 市场范围:不只是中国,而是全球。

场景三:创业前的最后犹豫

据内部人士透露,在正式离职创业前的最后几周,闫俊杰曾经历过一段犹豫期。

商汤即将上市,他的期权价值不菲。如果再等几个月,财务自由近在眼前。

但他最终还是选择了离开。

一个重要的考量是:时间窗口不等人。

大模型赛道的竞争正在升温。几乎每周都有新的创业公司成立,几乎每月都有新的融资消息传出。如果等到商汤上市、期权兑现再行动,可能已经晚了半年甚至一年。

在一个技术迭代极快的领域,半年可能意味着一代产品的差距。

另一个考量是:心态的保持。

一旦财务自由,人的心态很容易改变。"反正不差钱,何必冒险?"这种想法会逐渐侵蚀创业的动力。

闫俊杰担心,如果现在不走,以后可能就没有勇气走了。

最终,他选择了在商汤上市前离开,放弃了可预见的财务回报,换取了一个不确定但充满可能性的未来。

四、问题意识如何转化为行动纲领

清晰的问题意识只是起点,真正的挑战是将其转化为可执行的行动纲领。

闫俊杰的问题意识如何落地为Minimax的战略框架?

从"为什么中国没有GPT-3"到"我们要做什么样的模型"

问题:GPT-3验证了规模效应,但中国在算力和数据上有劣势。直接复刻GPT-3的路线未必可行。

解法:选择更适合自身条件的技术路线。

具体决策:

  • 架构选择:采用MoE(混合专家模型),在算力有限的情况下最大化模型容量。
  • 训练策略:注重数据质量而非数量,在中文语料上做精细化处理。
  • 优化目标:不追求论文跑分,而是关注实际应用中的错误率。

从"避免成为API供应商"到"我们要做什么样的产品"

问题:ToB模式有天花板,C端产品才有更大的想象空间。但C端产品需要更强的产品能力和用户洞察。

解法:从一开始就同时发展技术和产品,用产品反馈驱动技术迭代。

具体决策:

  • 产品矩阵:同时开发多款C端应用(星野、海螺AI、Talkie),覆盖不同场景和用户群。
  • 迭代方式:建立用户共创机制,将真实用户反馈快速转化为模型优化。
  • 商业模式:探索订阅付费、增值服务等多种变现方式,不依赖单一的API收入。

从"让AI普惠大众"到"我们要服务什么样的用户"

问题:普惠意味着服务那些通常被忽视的用户群体。他们的需求是什么?如何触达他们?

解法:从"陪伴"和"创作"两个切入点,设计低门槛、高情感价值的产品。

具体决策:

  • 产品定位:不只是工具,更是陪伴。让用户感受到AI的温度,而不只是效率。
  • 用户画像:关注年轻人、学生、创作者等对新技术接受度高、对AI有情感需求的群体。
  • 全球视野:通过Talkie等产品进入海外市场,服务全球用户。

五、创业动机的本质:从"我想要"到"世界需要"

回顾闫俊杰的创业动机,可以看到一个清晰的演化过程:

起点:"我想要"

最初的动机是个人的:想要证明自己、想要与王者竞争、想要做一些不一样的事情。这些是创业的原始燃料,没有这些动力,不会有人愿意放弃安稳去冒险。

转化:"我能做"

接下来是能力的匹配:我有这个技术背景、有这个行业经验、有这个人脉网络,我具备创业的条件。这是从"想要"到"可行"的桥梁。

升华:"世界需要"

最终的动机是超越个人的:世界需要普惠的AI、需要真正的智能助手、需要技术民主化。创业不只是为了自己,而是为了实现一个更大的使命。

这种从"个人欲望"到"社会使命"的升华,是伟大创业者的共同特征。

马斯克创立SpaceX,表面上是对火箭的痴迷,深层是让人类成为多行星物种的愿景。

乔布斯创立苹果,表面上是对产品的执着,深层是用技术改变人们生活方式的信念。

闫俊杰创立Minimax,表面上是对AI的热情,深层是让技术普惠每一个普通人的使命。

当个人动机与社会需求对齐时,创业就获得了超越个人的意义。这种意义感是长期坚持的源泉——当困难来临、当质疑声起、当前路迷茫时,只有那些拥有超越性使命的创业者,才能坚持走下去。

本章核心洞察

  1. 创业时机是多重因素的交汇点。 技术窗口、商业机会、个人准备——这些因素必须同时满足,才能构成理想的创业时机。2021年的Minimax,恰好站在这个交汇点上。

  2. 问题意识是创业的起点。 清晰地定义问题,往往比解决问题更重要。闫俊杰的三重问题意识——技术、商业、社会——构成了Minimax战略的基础。

  3. 路线选择决定命运。 "中国OpenAI" vs "差异化创新"的争论,不是对错之分,而是道路之选。选择不同的道路,就选择了不同的竞争格局、不同的成功概率、不同的公司命运。

  4. 动机的升华是长期坚持的关键。 从"我想要"到"世界需要"的转化,让创业获得了超越个人的意义。这种意义感是面对困难时最强大的支撑。

  5. 行动纲领是问题意识的延伸。 问题意识必须转化为具体的决策——做什么样的模型、做什么样的产品、服务什么样的用户。没有这种转化,问题意识只是空谈。


【本章完】


请输入"继续"以开始第五章:初始团队的形成

第五章:初始团队的形成

一、创始团队的"非完美组合"

2021年深秋,上海某个不起眼的写字楼里,Minimax的初创团队正在召开第一次全员会议。

与会者不过十几个人,挤在一间临时租用的办公室里。没有豪华的装修,没有气派的会议桌,甚至连公司logo都还没设计好。唯一醒目的是白板上密密麻麻的技术路线图,以及每个人眼中燃烧的热情。

闫俊杰站在白板前,用平静但坚定的语气说道:

"我们要做的,是让AI成为每个人的生产力工具。这可能需要五年、十年,甚至更长时间。在座的每一位,都需要做好长期战斗的准备。"

这就是Minimax的起点。没有隆重的发布会,没有铺天盖地的媒体报道,只有一群相信同一个愿景的人,聚在一起,准备做一件难以想象的事情。

技术核心:商汤系的号召力

Minimax的创始团队有一个显著特征:浓厚的商汤血统

闫俊杰在商汤工作七年,从实习生做到研究院副院长、智慧城市事业群CTO。这段经历不仅积累了技术能力,更积累了宝贵的人脉资源。

当他决定创业时,第一批追随者大多来自商汤。

这不是偶然。

首先,商汤培养了中国最优秀的一批AI人才。能在商汤做到核心岗位的人,技术水平毋庸置疑。

其次,闫俊杰在商汤的口碑极好。他不是那种高高在上的领导,而是真正和团队一起解决问题的人。很多曾经的下属愿意跟随他,不仅因为相信他的能力,更因为信任他的人品。

最重要的是,这些人都经历过商汤从创业到上市的完整周期。他们见过AI公司的辉煌,也见过其中的问题。他们知道什么是可行的,什么是陷阱。这种经验是无价的。

但"商汤系"也有其局限性。

商汤本质上是一家ToB公司,擅长的是把技术卖给企业客户。而Minimax的目标是ToC——直接面向消费者。这是两种完全不同的能力集。

技术出身的团队,往往在产品设计、用户体验、市场营销等方面存在短板。如何弥补这些短板,是Minimax成立初期面临的重要挑战。

互补短板:寻找缺失的拼图

闫俊杰很清楚团队的局限性。他没有假装"技术万能",而是主动寻找互补的人才。

产品能力:技术团队擅长"做出功能",但不一定擅长"设计体验"。Minimax需要有产品sense的人,能够从用户视角思考问题,把复杂的技术翻译成简洁的产品。

市场洞察:大模型是新事物,用户需求还不清晰。需要有人能够深入用户群体,理解他们的痛点和期待,指导产品方向。

融资能力:创业公司需要资金,而融资是一门专业技能。需要有人能够与投资人沟通,讲好公司的故事,在关键时刻拿到关键的资源。

这些能力不是一开始就到位的。早期的Minimax更像是一个"技术作坊"——一群技术极客凑在一起,先把模型跑起来再说。

但闫俊杰从一开始就有意识地在这些方向上布局。他利用自己的人脉网络,不断接触各类人才,寻找合适的加入时机。

这种"边跑边补"的策略是务实的。初创公司没有资源一步到位地搭建完美团队,只能在发展过程中不断迭代、不断完善。关键是创始人要清醒地认识到短板在哪里,并且持续努力去弥补。

二、说服顶尖人才的艺术

创业公司最大的挑战之一,是如何吸引顶尖人才。

优秀的人通常不缺选择。他们可以去大厂拿高薪,可以去成熟公司享受稳定,可以去其他创业公司博更大的机会。凭什么选择Minimax?

闫俊杰在这方面有自己的方法论。

第一,用愿景吸引,而非用薪酬竞争

创业公司在薪酬方面很难与大厂竞争。如果拼待遇,永远拼不过腾讯、阿里、字节。

但创业公司有大厂没有的东西:参与历史的机会。

闫俊杰在招聘面谈时,从不回避公司的风险和不确定性。他会坦诚地告诉候选人:我们可能失败,我们的待遇不如大厂,我们要面对无数困难。

但他也会分享自己的愿景:我们要做的是AI时代最重要的事情——让每个人都能使用真正智能的AI。如果成功,我们将改变数十亿人的生活。如果你想参与这件事,现在是最好的时机。

这种坦诚反而增加了可信度。那些被愿景打动的人,往往是最坚定的追随者。

第二,用专业赢得尊重

顶尖人才最看重的,是与同样优秀的人共事的机会。

闫俊杰本人就是最好的"招牌"。他的学术背景(中科院博士、清华博后)和工业经验(商汤七年)都是顶级的。当他与候选人交流技术问题时,对方很快就能感受到他的专业深度。

"跟这个人共事,我能学到东西。"——这种感觉,比任何薪酬承诺都更有说服力。

第三,给予真正的空间和信任

大厂的问题是层级太多、流程太长。优秀的人才往往被困在繁琐的会议和汇报中,无法发挥真正的创造力。

Minimax从一开始就承诺:这里没有官僚主义,每个人都可以直接参与核心决策。你的想法会被认真对待,你的贡献会被清晰看到。

这种承诺不是空话。Minimax早期的组织结构极其扁平,闫俊杰几乎和每一个团队成员保持直接沟通。决策过程透明、反馈周期短、试错空间大。

对于那些渴望做出impact的人来说,这种环境比高薪更有吸引力。

第四,坦诚面对不确定性

很多创业公司在招聘时喜欢"画大饼"——夸大前景、隐藏风险、承诺过高的回报。这种做法短期内可能有效,但长期会损害信任。

闫俊杰的风格完全不同。他会清晰地告诉候选人:

  • 这件事非常难,失败的概率很高
  • 前两年可能看不到明显的成果
  • 我们的资源有限,必须非常高效地使用
  • 但如果成功,这将是一件改变世界的事情

这种坦诚反而建立了更深的信任。候选人知道自己在做什么决定,知道将面对什么困难,也知道为什么值得去做。

三、组织基因的早期设定

一家公司的组织文化,往往在创立初期就已经定型。就像人的性格在童年时期形成一样,公司的"性格"也在最初几年被塑造。

Minimax在成立之初就确立了几条核心的组织原则,这些原则后来成为公司文化的基石。

原则一:轻量化组织

"保持组织结构简单,注重研发效率。"

这是闫俊杰反复强调的一点。他在商汤见过太多因为组织臃肿而导致效率低下的案例。当公司变大时,管理层级增加、会议变多、决策变慢——这些都是创新的大敌。

Minimax的应对之道是:永远保持"小公司心态"

即使团队在扩张,也要尽可能保持扁平的结构。减少不必要的中间层级,让信息能够高效流动。让做事的人有决策权,而不是把决策权集中在不了解一线情况的管理者手中。

在实践中,这意味着:

  • 小团队作战:将大项目拆分成小团队,每个团队拥有清晰的目标和充分的自主权
  • 直接沟通:鼓励跨层级的直接交流,避免信息在传递过程中失真
  • 快速决策:对于大多数问题,快速做出"够好"的决定,而不是追求"完美"的决定

原则二:科学方法

"采用数据科学快速识别有效路径。"

AI公司天然具有数据驱动的基因,但真正将这种思维应用到管理决策中的公司并不多。

Minimax的做法是:把管理问题也当作"优化问题"来处理

任何决策,都需要有清晰的评估指标。任何行动,都需要能够衡量其效果。不靠拍脑袋,不靠权威,而是靠数据说话。

这种方法论渗透到了公司运营的各个层面:

  • 技术方向选择:不是谁声音大谁说了算,而是用实验结果来验证假设
  • 产品迭代:不是凭感觉设计功能,而是通过用户数据发现真正的需求
  • 人员评估:不是看谁更会表达,而是看实际的产出和贡献

原则三:人才标准

"选择能提升团队整体输出的人,而非单打独斗的明星。"

这是一个微妙但重要的区分。

很多公司在招聘时,倾向于选择那些个人能力极强的"明星"——履历光鲜、成就突出、面试表现惊艳。但这些"明星"并不总是团队的最佳选择。

有些人个人能力很强,但合作能力差。他们可能完成自己的任务,但会让周围人的工作变得更困难。

有些人喜欢"独占功劳",不愿意分享知识和资源。他们的存在会破坏团队的信任氛围。

有些人"政治能力"强于"专业能力",擅长向上管理但不擅长真正做事。他们会侵蚀组织的务实文化。

闫俊杰的选择标准是:"1+1>2"

一个人加入团队后,团队的整体产出是否会提升?如果答案是肯定的,这个人就是好的选择。如果一个人个人能力虽强,但会让团队其他人的产出下降,那就不是好的选择。

这个标准听起来简单,但执行起来需要克服很多诱惑。当一个履历漂亮的候选人出现时,很难抵抗将其招入的冲动。但如果严格按照这个标准,就需要仔细评估:这个人的性格、沟通方式、合作态度是否与团队兼容?

四、早期资源约束下的生存策略

创业公司永远面临资源约束。钱不够、人不够、时间不够——这些都是常态。Minimax也不例外。

2021年底成立时,公司面临三大核心资源的短缺:算力、数据、资金。如何在这些约束下生存并发展?

算力困境:一卡难求的2021年

训练大模型需要大量的GPU算力。2021年,全球正处于芯片短缺的高峰期,AI芯片尤其供不应求。

英伟达的A100是当时最先进的AI训练芯片,价格高达数万美元一张,而且有钱也未必买得到。大公司凭借资金优势囤积芯片,创业公司几乎无处可买。

雪上加霜的是,中美科技脱钩的阴影正在逼近。虽然A100当时尚未被禁售,但所有人都意识到:这只是时间问题。

Minimax的应对策略是多管齐下:

  • 多渠道采购:利用各种渠道获取芯片,包括云服务商、分销商、二手市场
  • 优化训练效率:在算力有限的情况下,尽可能提高每一张卡的利用效率
  • 架构选择:MoE架构的一个优势是推理时只激活部分参数,对算力的需求相对较低
  • 借力云服务:与主流云服务商合作,按需租用算力,避免一次性的大额资本开支

这些策略并不能完全解决问题,但足以让公司在困境中生存下来。

数据挑战:高质量中文语料的稀缺

大模型的效果很大程度上取决于训练数据的质量。OpenAI可以利用整个英文互联网,但中文语料的情况要复杂得多。

中文互联网上的内容虽然数量庞大,但质量参差不齐。社交媒体上的碎片化表达、低质量的营销文案、大量的重复内容——这些"噪音"会严重影响模型的学习效果。

更麻烦的是,高质量的中文内容(如学术文献、专业书籍、优质新闻)往往受到版权保护,无法直接使用。

Minimax的策略是:质量优先于数量

与其盲目扩大数据规模,不如专注于提升数据质量。具体措施包括:

  • 建立严格的数据清洗流程,过滤低质量内容
  • 与优质内容提供商合作,获取授权数据
  • 利用模型自身的能力进行数据增强和质量评估
  • 针对特定领域(如教育、医疗、法律)收集高质量垂直数据

这种策略意味着短期内数据规模可能落后于竞争对手,但长期来看,高质量数据带来的模型优势是可持续的。

融资困难:天使轮的艰难与关键抉择

2021年底,AI投资正处于低谷。

前几年的"AI泡沫"刚刚破裂,投资人对AI公司普遍持谨慎态度。商汤上市后股价低迷,更是打击了市场信心。

在这种环境下融资,Minimax面临很大的挑战。

很多投资人对"大模型"这个概念感到陌生。他们习惯的是计算机视觉、语音识别这些"看得见摸得着"的应用。大语言模型听起来太抽象、太遥远、太不确定。

也有投资人担心竞争格局。OpenAI有微软撑腰,谷歌、Meta等巨头也在入场,一家中国创业公司凭什么能赢?

但也有少数投资人看到了机会。他们相信大模型是下一个时代的基础设施,而中国市场需要自己的大模型公司。他们愿意在别人恐惧时贪婪,在不确定性中下注。

这些投资人成为Minimax早期的关键支持者。他们不仅提供资金,还提供资源、人脉和战略建议。

融资过程中,闫俊杰做了一个重要的选择:不为了估值牺牲条款

有些投资人愿意给更高的估值,但要求更多的控制权。有些投资人催促更快的商业化,但可能损害长期发展。闫俊杰宁愿接受较低的估值,也要保持公司的独立性和战略自主权。

这个决定在当时看起来是"亏了",但长期来看是正确的。保持对公司的控制权,让Minimax能够坚持自己的战略,而不是被资本裹挟。

五、创始团队的化学反应

一个创始团队能否成功,不仅取决于每个成员的个人能力,更取决于他们之间的"化学反应"。

Minimax的早期团队有几个特点,这些特点决定了团队的独特气质。

共同的技术信仰

团队成员大多是技术背景出身,对AI有着近乎宗教式的热情。他们相信AI将改变世界,相信自己正在参与历史。

这种共同的信仰创造了强大的凝聚力。即使面对困难和挫折,大家也能相互支撑,因为每个人都知道:我们是为了同一个目标在战斗。

互补的能力结构

虽然都是技术背景,但团队成员的专长各有不同:有人擅长模型训练,有人擅长系统工程,有人擅长数据处理,有人擅长产品设计……

这种互补让团队能够覆盖大模型开发的各个环节,而不是在某些方面严重缺失。

相似的工作风格

Minimax的早期成员普遍具有几个共同特征:

  • 务实:不追求虚名,只关心实效
  • 高效:珍惜时间,快速执行
  • 坦诚:有问题直说,不藏着掖着
  • 长期主义:不急于求成,愿意做困难但正确的事

这种相似的风格让沟通变得简单,减少了很多内耗。

健康的冲突处理

任何团队都会有分歧和冲突。Minimax的处理方式是:鼓励争论,但尊重决定

在重大问题上,团队成员可以充分表达不同意见,甚至激烈争论。但一旦做出决定,所有人都会执行,不会"阴奉阳违"。

这种文化让团队既能获得多元视角的好处,又不会因为分歧而陷入瘫痪。

六、早期团队的局限与演进

坦诚地说,Minimax的早期团队并不完美。

技术导向过重:团队大多是技术出身,在产品、市场、运营等方面存在明显短板。早期的产品决策有时过于"工程师思维",不够贴近用户真实需求。

大厂思维残留:虽然离开了大厂,但大厂的工作习惯不会一夜之间消失。有时候决策流程过长,有时候过于追求完美而忽视速度。

资源分配失误:在资源有限的情况下,早期也做过一些错误的资源分配决策——投入过多精力在某些最终证明不成功的方向上。

但创业团队的特点就是:在发展中成长,在错误中学习

重要的不是一开始就完美,而是能够快速识别问题、承认错误、做出调整。

Minimax的团队展现了这种能力。当发现产品能力不足时,主动引入产品背景的人才;当发现决策流程过慢时,简化会议机制;当发现资源分配错误时,快速止损并重新聚焦。

这种自我迭代的能力,比起始的完美更加重要。

本章核心洞察

  1. 创始团队不需要一开始就完美。 "边跑边补"是创业的常态。关键是创始人要清醒认识短板,并持续努力弥补。

  2. 用愿景吸引人才比用薪酬竞争更可持续。 顶尖人才寻找的不只是收入,更是意义和成长。能够清晰表达愿景的创业公司,有独特的吸引力。

  3. 组织文化在早期就会定型。 轻量化、数据驱动、团队优先于个人——这些原则应该从一开始就确立,而不是等公司变大后再试图改变。

  4. 资源约束是创业的常态,也是创新的催化剂。 算力不足逼迫Minimax优化效率,数据稀缺倒逼质量优先。约束往往是最好的老师。

  5. 团队的"化学反应"比个人能力更重要。 一群能够良好协作的"A-"级人才,往往胜过一群无法合作的"A+"级明星。

  6. 保持战略自主权比获得高估值更重要。 在融资时不为估值牺牲条款,是保持长期发展空间的关键。


【本章完】


请输入"继续"以开始第六章:技术方向与产品定位的早期抉择

第六章:技术方向与产品定位的早期抉择

一、2021-2022年的关键决策树

创业如同在迷雾中行走。每一个岔路口都意味着不同的命运,而你无法预知哪条路通向成功,哪条路通向深渊。

2021年末至2022年初,Minimax面临一系列关键的技术和产品决策。这些决策将在此后几年深刻影响公司的发展轨迹。

回过头来看,这些决策大多是正确的。但在当时,每一个决策都充满不确定性,都需要在信息不完整的情况下做出判断。理解这些决策的背景和逻辑,对于任何创业者都有借鉴价值。

让我们逐一还原这些关键抉择。

二、架构选择:为什么是MoE而非密集模型?

背景:两种技术路线的对峙

2021年,大语言模型的主流架构是"密集模型"(Dense Model)。

密集模型的特点是:所有参数在每次推理时都被激活。GPT-3就是典型的密集模型——1750亿参数,每处理一个token都要调用全部参数进行计算。

这种架构简单直接,工程实现相对容易。但它有一个致命的缺陷:计算成本与参数量线性增长

模型越大,推理成本越高。当参数量达到千亿级别时,推理一次的成本已经相当可观。如果要服务数百万甚至数亿用户,算力开支将是天文数字。

另一种架构是MoE(Mixture of Experts,混合专家模型)。

MoE的核心思想是:将模型分成多个"专家"模块,每次推理时只激活其中一部分。通过一个"门控网络"(Gating Network)来决定:对于当前输入,应该使用哪些专家?

这意味着:模型可以拥有巨大的总参数量(代表强大的知识容量),但每次推理只使用其中一小部分(控制计算成本)。

举个具体的例子:一个拥有1万亿参数的MoE模型,如果每次只激活其中的10%,那么推理成本大致相当于一个1000亿参数的密集模型。但它的知识容量却是后者的十倍。

Minimax的选择:激进地押注MoE

在2021年,MoE仍然是学术前沿,工程实现难度大。很少有公司敢于在生产环境中使用MoE架构。

谷歌的Switch Transformer论文刚刚发表不久,证明了MoE在大规模训练中的可行性。但从论文到产品,中间还有巨大的鸿沟。

大多数创业公司选择了"稳妥"路线:先用密集模型做出产品,等MoE技术成熟后再考虑迁移。

但Minimax做出了不同的选择:从一开始就全面采用MoE架构

这是一个激进的决定。它意味着更高的技术风险、更长的研发周期、更多的工程挑战。但闫俊杰认为,这个风险值得冒。

决策逻辑分析

闫俊杰的判断基于几个核心洞察:

第一,推理成本将成为决胜因素。

大模型的商业化必然面临成本问题。如果推理成本过高,就无法大规模服务用户,就无法实现"普惠"的愿景。

密集模型在这一点上有天然的劣势。随着模型规模增大,推理成本会线性增长,最终达到无法承受的程度。

而MoE架构可以在保持性能的同时控制推理成本,是实现规模化服务的必要条件。

第二,先发优势在技术积累上尤为重要。

MoE的工程实现涉及大量know-how:如何设计门控网络?如何平衡各专家的负载?如何在分布式环境中高效训练?这些都是需要时间积累的工程经验。

如果等别人把MoE做成熟再跟进,就会在这些关键技术上落后。不如从一开始就投入,在实践中积累经验,建立技术壁垒。

第三,技术路线一旦确定,迁移成本极高。

如果先用密集模型开发产品,后续再迁移到MoE,需要重新训练模型、重新优化系统、重新调试产品。这个迁移成本可能比从头开始还高。

不如一步到位,避免将来的技术债务。

工程实现的艰辛

选择MoE是正确的战略决策,但执行层面的困难超出预期。

早期的训练经常出现各种问题:

  • 负载不均衡:某些专家被过度使用,其他专家几乎闲置
  • 训练不稳定:门控网络的梯度波动大,导致训练过程震荡
  • 分布式通信瓶颈:专家分布在不同机器上,通信开销显著

团队投入了大量精力解决这些工程问题。经过无数次失败和调试,最终在2022年推出了abab 6——国内首个基于MoE架构的大语言模型

这个"首个"的意义不仅在于时间上的领先,更在于技术能力的验证。它证明了中国团队也能在最前沿的架构上做出可用的产品。

三、模态选择:为什么坚持多模态融合?

背景:单模态 vs 多模态的争论

2021-2022年,大模型领域的主流是"单模态"——专注于文本处理的语言模型。GPT-3、BERT、T5等明星模型都是纯语言模型。

但也有少数团队在探索"多模态"——将文本、图像、语音、视频等多种模态融合在一个统一的框架中。

多模态的诱惑是显而易见的:人类理解世界的方式本来就是多模态的。我们同时使用眼睛看、耳朵听、嘴巴说,各种感官信息在大脑中融合处理。如果AI要真正理解世界,也应该具备类似的能力。

但多模态的挑战也是巨大的:

  • 技术复杂度:不同模态的数据表示方式完全不同,如何统一?
  • 训练难度:多模态数据的获取和对齐都更加困难
  • 资源消耗:处理多种模态意味着更大的计算开销
  • 产品定义:多模态能力应该如何呈现给用户?

很多公司选择了"先单模态,后多模态"的渐进策略:先把语言模型做好,再逐步添加其他模态。

Minimax的选择:从一开始就布局多模态

Minimax的策略不同。闫俊杰坚持从创业初期就同时推进多种模态的研发:

  • 文本到文本:基础的语言理解和生成能力
  • 文本到语音:让AI能够"说话"
  • 文本到视觉:让AI能够"创作图像"
  • 语音到文本:让AI能够"听懂"

这是一个资源消耗极大的策略。对于一家初创公司来说,同时推进四个方向似乎过于分散。

但闫俊杰的判断是:多模态不是"增值功能",而是"核心能力"。

决策逻辑分析

第一,AGI必须是多模态的。

真正的通用人工智能(AGI)必须能够理解真实世界,而真实世界是多模态的。一个只能处理文本的AI,无论文本能力多么强大,都无法称为AGI。

如果Minimax的愿景是打造真正的智能助手,那么多模态就不是可选项,而是必须项。

第二,产品体验依赖多模态。

从用户角度来看,最自然的交互方式是多模态的:用语音发出指令,用图像展示结果,用文本记录信息……

单模态的产品体验天然受限。如果想要打造"AI时代的微信",就必须支持多种交互方式。

第三,早期布局建立技术壁垒。

多模态融合的技术难度很高,需要长期的研发积累。如果等市场成熟后再进入,就会面临激烈的竞争。

早期布局虽然资源消耗大,但可以在竞争对手反应过来之前建立领先优势。

"三位一体"的技术架构

基于这个判断,Minimax构建了"三位一体"的多模态技术架构:

  1. 语言模型核心:以大语言模型为中枢,负责理解用户意图和组织输出内容
  2. 感知模块:语音识别、图像理解等模块,将多模态输入转化为语言模型可处理的表示
  3. 生成模块:语音合成、图像生成等模块,将语言模型的输出转化为多模态内容

这三层架构相互配合,形成一个完整的多模态AI系统。

在后来的产品中,这种架构的优势得到了充分体现:

  • 海螺AI可以用语音与用户对话,用图像辅助解释
  • 星野可以根据文本描述生成视觉内容
  • Talkie可以以多种形式与用户互动

如果没有早期的多模态布局,这些产品特性都无法实现。

四、产品路径:先做API还是先做C端应用?

背景:ToB vs ToC的经典争论

大模型商业化有两条主要路径:

路径一:先做API(ToB)

将模型能力封装成API接口,卖给企业客户。客户基于这些API开发自己的应用。

这条路径的优势是:

  • 商业模式清晰,按调用量收费
  • 客户获取相对容易,企业客户有明确的采购预算
  • 不需要自己做产品,专注于技术

劣势是:

  • 陷入"API供应商"的定位,缺乏用户心智
  • 受制于客户的产品决策,无法直接获取用户反馈
  • 容易陷入价格战

路径二:先做C端应用(ToC)

直接面向消费者,开发完整的AI应用产品。

优势是:

  • 直接触达用户,建立用户心智
  • 获取一手用户反馈,形成数据飞轮
  • 如果成功,可以形成"赢者通吃"的格局

劣势是:

  • 产品开发难度大,需要技术、设计、运营等多种能力
  • 用户获取成本高,市场教育周期长
  • 短期内难以盈利

大多数大模型创业公司选择了"先ToB,后ToC"的渐进策略:先通过API赚到现金流,再逐步拓展C端市场。这是一条相对稳妥的路。

Minimax的选择:技术与产品并重

Minimax的策略更加激进:从一开始就同时推进API和C端应用

这意味着同时承担两条战线的压力:既要保持技术研发的强度,又要投入资源做产品开发。对于一家资源有限的创业公司来说,这是巨大的挑战。

但闫俊杰认为这种"激进"是必要的。

决策逻辑分析

第一,用户反馈是最宝贵的数据。

大模型的优化高度依赖用户反馈。只有让真实用户使用产品,才能发现模型的真正问题在哪里。

如果只做API,用户反馈被企业客户隔离,公司无法直接获取。这意味着模型优化将失去最重要的信号来源。

C端产品可以直接收集用户行为数据:哪些回答用户喜欢?哪些回答用户不满意?用户在什么场景下使用产品?这些数据对于改进模型至关重要。

第二,C端市场是"赢者通吃"的。

在消费者市场,先发优势极为重要。一旦某个产品占据了用户心智,后来者即使技术更好也很难撼动。

微信不是第一个即时通讯软件,但它成功占据了用户心智后,后来的竞争对手无论技术多强都无法撼动。

如果等技术成熟后再做C端产品,可能已经晚了。最好的策略是:一边迭代技术,一边培养用户。

第三,"技术-产品"闭环是核心竞争力。

真正的竞争壁垒不是单纯的技术,也不是单纯的产品,而是"技术-产品"的完整闭环。

技术驱动产品创新,产品反馈驱动技术优化,两者相互促进、螺旋上升。只做API的公司缺乏产品能力,只做应用的公司缺乏技术深度。两者兼具的公司才能建立真正的壁垒。

资源分配的艺术

当然,"技术与产品并重"不意味着资源平均分配。Minimax的做法是:

  • 核心资源(高端人才、算力)优先投入底层技术研发
  • 产品团队保持��简高效,专注于"验证假设"而非"追求完美"
  • 快速迭代,用最小可用产品(MVP)获取用户反馈,然后快速改进

这种策略确保了技术研发不受影响,同时又能通过产品获取宝贵的用户数据。

五、市场选择:国内还是海外?

背景:两个市场的不同逻辑

AI大模型的市场可以粗略分为国内和海外两部分。

国内市场的特点:

  • 用户基数大,中国有超过10亿互联网用户
  • 文化和语言熟悉,产品设计和运营更容易
  • 竞争激烈,字节、腾讯、百度等巨头都在入场
  • 监管复杂,AI应用需要备案、内容审核等

海外市场的特点:

  • 用户分散在多个国家,语言和文化差异大
  • 运营难度高,需要本地化团队
  • 竞争格局相对分散,巨头的优势不那么明显
  • 监管相对宽松(因地区而异),产品迭代可以更快

很多中国科技公司的策略是"先国内,后海外":先在国内市场站稳脚跟,再向海外扩张。这是一条相对稳妥的路径。

Minimax的选择:国内海外同步布局

Minimax采取了不同的策略:在专注国内市场的同时,早期就布局海外

这一策略的最突出体现是Talkie——一款面向海外市场的AI社交应用。

Talkie在2023年上线,迅速在海外市场获得关注。到2024年,Talkie已经在157个国家和地区运营,年收入达到约7000万美元,成为Minimax最重要的收入来源之一。

决策逻辑分析

第一,海外市场是检验竞争力的"试金石"。

在国内市场,本土公司有天然优势:语言、文化、政策、渠道……这些因素可能掩盖产品本身的竞争力问题。

海外市场则不同。在那里,Minimax需要与OpenAI、Anthropic等全球顶尖公司直接竞争。如果能在这样的竞争中胜出,就证明了技术和产品的真正实力。

第二,海外市场的商业环境更友好。

在国内,AI应用面临严格的内容审核和备案要求。某些功能可能需要数月才能获得批准,产品迭代速度受到影响。

海外市场(尤其是美国、欧洲)的监管环境相对宽松,产品可以更快地迭代和试错。这对于一个需要快速学习和调整的创业公司来说非常重要。

第三,海外市场分散竞争压力。

国内AI市场的竞争极为激烈。字节、腾讯、百度等巨头都在大力投入,创业公司面临巨大的压力。

海外市场虽然也有强劲对手,但竞争格局相对分散。尤其是在某些垂直领域和区域市场,创业公司有更多的突破机会。

Talkie的战略意义

Talkie的成功不仅是收入贡献,更重要的是战略意义:

  1. 验证产品能力:证明Minimax能够做出全球用户喜爱的产品
  2. 获取多元数据:海外用户的反馈可以帮助优化模型,避免单一市场的偏见
  3. 建立全球品牌:为未来的全球化扩张奠定基础
  4. 分散风险:降低对单一市场的依赖

当然,海外布局也带来了额外的挑战:需要组建本地化团队,需要理解不同市场的文化差异,需要应对各国不同的法规要求。这些都是持续投入的领域。

六、早期产品迭代的实践

战略决策需要通过产品来落地。Minimax的早期产品迭代充满了探索与试错。

abab 6:技术突破的里程碑

2022年,Minimax发布了abab 6——国内首个基于MoE架构的大语言模型

这个发布具有多重意义:

  • 技术验证:证明了MoE架构在中文大模型中的可行性
  • 能力基线:为后续产品开发提供了底层支撑
  • 市场宣示:向行业展示了Minimax的技术实力

abab 6的发布并不完美。早期版本存在各种问题:回答有时不够准确,推理有时不够稳定,某些领域的知识存在明显缺陷。

但这些问题正是产品迭代的起点。通过收集用户反馈,团队不断识别问题、分析原因、优化模型。每一个版本都比上一个版本更好一点。

星野:从工具到陪伴的产品哲学

星野是Minimax面向国内市场推出的C端应用之一。

与很多"工具型"AI产品不同,星野的定位更加独特:不只是帮用户完成任务,更是提供情感陪伴。

这个定位源于闫俊杰对用户需求的洞察:

"很多人使用AI,不仅是为了提高效率,更是为了获得某种情感连接。他们想要一个能够理解自己、陪伴自己的存在。"

星野的产品设计围绕这个洞察展开:

  • AI角色有独特的"人格",不是冷冰冰的工具
  • 对话风格温暖、有趣,能够产生情感共鸣
  • 用户可以与AI建立长期的"关系",产品有记忆和连续性

这种定位在市场上引起了共鸣,尤其是在年轻用户群体中。

海螺AI:多模态能力的产品化

海螺AI是Minimax多模态技术的产品化载体。

与纯文本的聊天机器人不同,海螺AI可以:

  • 用语音与用户对话
  • 理解用户上传的图片
  • 生成图像、音频等多模态内容

这些能力的背后,是多年的多模态技术积累。早期"三位一体"的技术架构,在这里得到了充分的应用。

海螺AI的推出,让用户体验到了"真正的多模态AI"是什么样子。它不仅能理解文字,还能看图、听话、说话——就像一个真正的智能助手。

用户共创的实践

Minimax的产品迭代有一个核心理念:用户共创

这不是一句空洞的口号,而是具体的实践方法:

第一,建立反馈渠道。

在产品中内置反馈功能,让用户可以方便地报告问题、提出建议。不是那种藏在角落的"客服入口",而是显眼的、鼓励使用的反馈机制。

第二,分析用户行为。

通过数据分析,理解用户实际如何使用产品。哪些功能最受欢迎?用户在哪里遇到困难?什么样的回答让用户满意?这些洞察指导产品改进的方向。

第三,快速响应。

用户反馈的问题,要快速得到响应。不是"我们会考虑",而是"我们已经修复"。这种快速响应建立了用户信任,也鼓励更多用户参与反馈。

第四,社区运营。

建立用户社区,让核心用户参与产品的设计讨论。这些"超级用户"往往有最深刻的洞察,他们的意见值得认真对待。

闫俊杰在访谈中强调:"用户共创不是口号,是生存方式。没有用户反馈,我们就是闭门造车。"

七、早期决策的回顾与反思

站在今天回看2021-2022年的这些决策,大多数被证明是正确的:

  • MoE架构:如今已成为大模型的主流选择,Minimax的早期积累转化为技术优势
  • 多模态布局:产品的多模态能力成为差异化竞争点
  • ToC优先:C端产品积累了大量用户和数据,形成了数据飞轮
  • 海外布局:Talkie的成功验证了全球化的可行性

但也有一些教训:

资源分散的代价

同时推进太多方向,确实带来了资源分散的问题。某些项目因为资源不足,进展缓慢。团队有时候感到"什么都在做,什么都没做好"。

解法是更加严格的优先级管理:每个季度明确最重要的1-2个目标,确保核心目标有足够资源。

速度与质量的平衡

早期为了"快速验证",有些产品发布得过于仓促。用户体验不够好,影响了口碑。

教训是:速度很重要,但不能以牺牲基本质量为代价。MVP可以功能简单,但已有功能必须可用。

技术到产品的鸿沟

技术团队做的东西,产品团队有时不知道怎么用。产品团队想要的功能,技术团队有时觉得不重要。

解法是加强两个团队的融合:让技术人员理解用户需求,让产品人员理解技术可能性。定期的跨团队会议、联合项目、人员轮岗都是有效的手段。

八、决策框架的提炼

从Minimax早期的这些决策中,可以提炼出一套决策框架:

框架一:长期价值 > 短期便利

MoE架构难做,但长期价值高;多模态投入大,但是必须走的路;C端产品风险高,但是真正的护城河。

每一个决策都优先考虑长期价值,而不是短期便利。

框架二:用户价值 > 技术指标

不追求论文跑分,关注用户实际体验。不追求功能全面,聚焦用户真正需要。

技术是手段,用户价值是目的。

框架三:验证 > 假设

不在会议室里争论谁的假设正确,而是快速做出原型、投放市场、收集反馈。

让用户告诉我们答案,而不是自己猜测答案。

框架四:聚焦 > 分散

资源有限的情况下,必须做出取舍。宁可在少数方向上深入,不可在太多方向上浅尝辄止。

聚焦带来深度,分散导致平庸。

框架五:差异化 > 模仿

不做"中国的OpenAI",而是找到自己的独特价值。竞争的关键不是"比别人做得好一点",而是"做别人没做的事"。

差异化是生存的基础。

本章核心洞察

  1. 架构选择决定技术上限。 MoE vs 密集模型不只是技术细节,而是关乎公司能否实现规模化服务的战略选择。激进的技术路线有风险,但也有可能带来决定性优势。

  2. 多模态是AGI的必由之路。 一个只能处理文本的AI,无论文本能力多强,都不是真正的通用智能。多模态布局应该尽早开始,而不是等到"有余力"时。

  3. C端产品是数据飞轮的发动机。 只有直接面对用户,才能获取最真实的反馈,才能形成"产品→数据→模型→产品"的正向循环。API生意赚钱容易,但建立壁垒困难。

  4. 全球视野从一开始就要建立。 海外市场不是"国内成功后再考虑"的备选项,而是验证竞争力、分散风险、获取多元数据的重要战场。

  5. 用户共创不是口号,是生存方式。 最好的产品不是设计出来的,而是与用户一起迭代出来的。建立有效的用户反馈机制,比任何天才的产品直觉都更重要。

  6. 决策框架比单次决策更重要。 正确的决策框架可以持续指导未来的选择,而单次正确的决策可能只是运气。创业者应该花时间提炼和完善自己的决策框架。


【第二编完】


请输入"继续"以开始第三编第七章:2023-2024年——技术狂飙与商业化试错

第三编:公司发展的关键阶段


第七章:2023-2024年——技术狂飙与商业化试错

一、ChatGPT的冲击波

2022年11月30日,OpenAI发布了ChatGPT。

这一天,世界发生了不可逆转的改变。

在此之前,大语言模型主要是技术圈的话题。普通用户对GPT-3的印象模糊——听说过这个名字,但不太清楚它能做什么,更没有亲自使用过。

ChatGPT改变了一切。

通过一个简洁的对话界面,任何人都可以与世界上最先进的AI进行对话。你可以让它写诗、编程、翻译、解题、创作故事……它几乎无所不能,而且完全免费。

上线仅五天,ChatGPT的用户突破100万。两个月后,月活用户超过1亿,创下了消费级应用增长的历史纪录。

整个科技行业为之震动。

硅谷的巨头们如梦初醒。谷歌内部拉响"红色警报",紧急调集资源应对。微软宣布向OpenAI追加数十亿美元投资,并将ChatGPT整合进Bing搜索。Meta、亚马逊、苹果纷纷加大AI投入。

中国科技界的反应同样剧烈。百度宣布将推出"文心一言",阿里巴巴启动"通义千问"项目,腾讯、字节跳动、华为等巨头纷纷宣布大模型计划。

一时间,"大模型"从一个小众的技术术语,变成了全社会热议的话题。资本市场为之疯狂,A股和港股的AI概念股连续涨停。

对于Minimax来说,这既是机遇,也是挑战。

机遇在于:市场教育完成了。在ChatGPT之前,向用户解释"大语言模型是什么"需要很大的成本。现在,几乎每个人都知道AI能做什么,都渴望使用这样的产品。市场需求瞬间爆发。

挑战在于:竞争骤然加剧。原本稀疏的赛道一夜之间挤满了选手。不仅有互联网巨头携资金和流量入场,还有无数创业公司蜂拥而至。Minimax的先发优势面临被稀释的风险。

2023年初,闫俊杰召集核心团队开会,分析形势,制定应对策略。

他的判断是:这是一场马拉松,不是百米冲刺。短期内会有无数玩家涌入,但大多数无法持续。真正的较量在于谁能在技术上持续领先,在产品上持续迭代,在战略上保持定力。

会议最后,他在白板上写下一行字:

"保持节奏,不被带偏。"

二、技术演进路线:从abab 6到万亿参数

2023-2024年是Minimax技术狂飙的两年。模型能力以惊人的速度迭代升级。

abab 6.5:万亿参数的突破

2023年下半年,Minimax发布了abab 6.5——一个拥有万亿级参数的混合专家模型。

这是一个里程碑式的成就。

回想2021年创业之初,团队训练的第一个模型只有数十亿参数。两年时间,参数量增长了两个数量级。

更重要的是,万亿参数不是简单的"数字游戏"。参数量的增加带来了能力的质变:

  • 知识广度:模型掌握了更多领域的知识,回答问题时更加全面准确
  • 推理深度:面对复杂问题时,模型能够进行更长链条的推理
  • 语言流畅性:生成的文本更加自然、连贯、有逻辑
  • 指令遵循:更好地理解和执行用户的指令

abab 6.5的性能在多个评测中达到了国际领先水平,部分指标接近甚至超越了GPT-4。

这一成就的背后是对Scaling Laws的坚定信仰和执行。闫俊杰多次在内部强调:

"规模是通向更好模型的必要条件。在这个阶段,我们不应该过度担心效率问题。先把模型做大、做强,效率问题可以后续优化。"

当然,万亿参数也意味着巨大的资源消耗。训练一次需要数千张GPU运行数周时间,电费账单都是天文数字。这种投入只有真正相信长期价值的公司才能承受。

线性注意力机制:效率革命

技术进步不仅体现在规模上,更体现在效率上。

2024年,Minimax推出了MiniMax-01系列模型,首次大规模应用了线性注意力机制

传统的Transformer架构使用"软注意力"(Softmax Attention),计算复杂度与序列长度的平方成正比。这意味着当处理长文本时,计算开销会急剧增加。

线性注意力机制通过数学上的近似,将复杂度降低到与序列长度成线性关系。这一改进带来了显著的效率提升:

  • 推理速度提升20%以上
  • 长文本处理能力大幅增强
  • 算力成本显著降低

这个技术突破的战略意义在于:它让Minimax能够在保持性能的同时降低成本,从而在价格战中保持竞争力。

闫俊杰后来在采访中总结道:"效率提升不是可选项,而是必须项。未来的竞争一定是'性能/成本'的竞争,而不是单纯的性能竞争。"

错误率攻坚战:从20-30%到个位数

在技术迭代中,有一个指标被Minimax视为"生命线":错误率

所谓错误率,是指模型给出的回答中,包含事实错误、逻辑谬误或有害内容的比例。

2023年初,主流大模型的错误率大约在20-30%左右。这意味着每三到五次交互,就可能有一次出错。对于日常聊天来说,这或许可以接受。但对于严肃的应用场景——比如医疗咨询、法律建议、教育辅导——这个错误率是无法容忍的。

闫俊杰在多个场合强调这一点:

"错误率必须降低一个数量级,从20-30%降到2-3%。只有达到这个水平,AI才能真正成为可信赖的生产力工具。应用规模才会从现在的百万级扩张到亿级。"

这不是一个容易实现的目标。降低错误率需要多管齐下:

  • 数据质量:清洗训练数据中的错误和噪音
  • 模型架构:引入更好的事实核查机制
  • 后处理:在输出前进行额外的校验
  • 用户反馈:利用用户标注的数据持续优化

2024年,经过持续努力,Minimax的模型错误率已经显著下降,在多个测试集上达到了行业领先水平。虽然距离"个位数"的目标还有距离,但进步是显著的。

三、商业化路径的摇摆

技术的突飞猛进令人振奋,但商业化的探索却充满曲折。

2023-2024年,Minimax在商业模式上经历了多次试错和调整。

ToB的尝试:高济神农系统

2023年,Minimax与高济健康合作,推出了"高济神农"AI诊疗辅助系统。

这是Minimax在医疗领域的重要尝试。高济健康是中国最大的连锁药房企业之一,拥有数千家门店和数百万会员。通过将Minimax的大模型能力嵌入高济的业务系统,可以为消费者提供智能化的健康咨询服务。

这个合作具有标杆意义:

  • 证明了Minimax的模型能够应用于专业领域
  • 展示了与行业巨头合作的能力
  • 开辟了ToB商业化的路径

但ToB业务也暴露出固有的问题:

第一,销售周期长。 与大企业的合作需要经历漫长的接触、评估、谈判、签约、实施过程,往往需要半年甚至一年时间。

第二,定制需求多。 每个企业都有独特的业务场景和数据环境,需要大量的定制开发工作。这消耗了宝贵的研发资源。

第三,规模化困难。 ToB业务的增长与销售团队规模成正比,很难实现"赢者通吃"的网络效应。

Minimax并没有放弃ToB业务,但逐渐意识到:ToB可以是收入来源之一,但不应该是公司的核心战略。

ToC的突破:Talkie的收入奇迹

与ToB的艰难形成鲜明对比的是ToC业务的爆发式增长。

Talkie在2024年实现了约7000万美元的年收入,成为Minimax最重要的现金牛。

这个数字在中国AI创业公司中极为罕见。大多数公司还在烧钱阶段,Talkie已经实现了可观的收入规模。

Talkie的成功有几个关键因素:

第一,产品定位精准。 Talkie不是一个通用的聊天机器人,而是专注于"AI社交"场景——用户可以与各种AI角色进行互动,获得情感陪伴和娱乐体验。这个定位切中了年轻用户的真实需求。

第二,海外市场选择正确。 Talkie主打欧美市场,避开了国内激烈的竞争和复杂的监管。海外用户对AI产品的付费意愿更强,ARPU(每用户平均收入)更高。

第三,运营精细化。 团队在用户获取、留存、付费转化各个环节都进行了精细化运营。通过A/B测试和数据分析,持续优化产品体验和商业效率。

第四,快速迭代。 海外市场的监管环境相对宽松,产品可以快速迭代。Talkie几乎每周都有更新,不断根据用户反馈改进功能。

Talkie的成功验证了Minimax"ToC优先"战略的正确性。它证明了:AI产品可以直接面向消费者变现,而且可以实现相当的规模。

开源 vs 闭源:DeepSeek的冲击

2024年下半年,另一个变量开始显现:开源大模型的崛起

DeepSeek是其中最引人注目的一个。这家公司由量化交易巨头幻方量化孵化,拥有充裕的资金和顶尖的技术人才。更重要的是,DeepSeek选择了完全不同的战略路线:全面开源

2025年1月,DeepSeek发布了DeepSeek-R1系列模型。这个模型的性能接近OpenAI的o1,但训练成本据称只有几百万美元,是o1的几十分之一。

这一消息在全球科技界引发震动。

OpenAI精心构建的技术护城河似乎一夜之间被攻破。如果一家中国创业公司能用如此低的成本训练出顶尖模型,那么大模型的"高门槛"神话就被打破了。

对于Minimax来说,DeepSeek的冲击是多层次的:

技术层面:DeepSeek的成功证明了低成本训练的可行性。这意味着在算法和工程上还有巨大的优化空间。Minimax需要审视自己的训练效率是否有提升余地。

商业层面:如果顶尖模型可以免费获取,那么模型本身还能成为竞争壁垒吗?商业化的价值将更多转移到应用层。

战略层面:坚持闭源还是拥抱开源?这个问题变得更加紧迫。

闫俊杰对此有清醒的认识。他在内部会议上分析道:

"DeepSeek的成功是真实的,但不意味着开源是唯一正确的路线。我们需要思考的是:我们的核心竞争力到底是什么?是模型本身,还是'模型+产品'的组合?"

他的结论是:Minimax的优势在于'模型-产品'的一体化能力,而不是单纯的模型能力。

开源模型可以被任何人使用,但将模型转化为亿万用户喜爱的产品,需要产品设计、用户洞察、运营能力——这些是无法开源的。

Talkie的成功就是明证。使用Minimax模型的竞争对手可能很多,但能做出Talkie这样成功产品的,只有Minimax自己。

四、降价竞争:如何在价格战中生存

2024年,中国大模型市场进入了惨烈的价格战。

起因是字节跳动旗下的"豆包"大幅下调API价格,将市场均价拉低了一个数量级。其他玩家不得不跟进,否则就会失去客户。

一时间,"降价"成为行业主旋律。每家公司都在比谁的价格更低、谁的成本控制更好。

对于Minimax这样的创业公司来说,价格战是危险的。与巨头相比,创业公司的资金储备有限,无法承受长期的亏损竞争。

闫俊杰的应对策略是:"降价同时保持更好效果。"

这不是一句口号,而是具体的技术目标。它要求团队在两个维度同时努力:

维度一:提升效率,降低成本

通过技术优化降低推理成本。具体措施包括:

  • 线性注意力机制的应用,降低计算复杂度
  • 模型量化技术,减少显存占用
  • 推理引擎优化,提高硬件利用率
  • MoE架构的持续改进,在保持性能的同时减少激活参数

这些技术努力在2024年取得了显著成效。Minimax的推理成本降低了约50%,这意味着可以在保持利润的同时大幅降低定价。

维度二:提升效果,保持差异化

价格战的一个风险是"同质化"——如果所有产品都差不多,那就只能拼价格。

Minimax的对策是保持技术领先和产品差异化:

  • 持续迭代模型能力,确保在核心指标上领先
  • 发挥多模态优势,提供竞争对手没有的功能
  • 优化用户体验,让产品更加易用、有趣
  • 深耕垂直场景,在特定领域建立专业优势

这种"效率+效果"的双轮驱动策略,让Minimax在价格战中保持了竞争力,没有被拖入纯粹的烧钱游戏。

五、组织扩张的阵痛

技术和业务的快速发展,推动了组织的迅速扩张。

2021年成立时,Minimax只有十几个人。到2024年,员工数量已经增长到数百人。

这种增长速度带来了一系列管理挑战。

挑战一:文化稀释

创业早期的团队有着强烈的使命感和紧密的协作关系。每个人都知道公司要做什么、为什么这么做。

但随着人员快速扩张,这种文化共识开始被稀释。新加入的员工未必理解公司的创业初心,可能带着在大公司养成的习惯和预期。

如果不主动干预,公司可能逐渐失去独特的文化DNA,变成一家"普通的科技公司"。

Minimax的应对方式是:

  • 强化入职培训:每一位新员工都要接受公司历史、愿景、价值观的培训
  • 创始人直接沟通:闫俊杰定期与新员工面对面交流,传递文化信念
  • 老员工mentor制度:让早期员工"带教"新人,传承文化基因
  • 案例分享:定期分享体现公司文化的正面和反面案例

挑战二:决策效率下降

人多了,会议就多了。层级多了,信息传递就慢了。很多曾经一个小时能敲定的决策,现在需要开几轮会议、走一圈流程。

这对于需要快速迭代的AI公司来说是致命的。

Minimax的应对方式是坚持"轻量化组织"的理念:

  • 控制管理层级:尽可能保持扁平,避免过多的中间层
  • 授权一线:将决策权下放给最了解情况的人,而不是层层上报
  • 减少会议:取消不必要的会议,必须开的会议控制时长
  • 异步沟通:鼓励通过文档、邮件等异步方式沟通,减少对面对面会议的依赖

挑战三:人才梯队断层

快速扩张往往导致人才梯队的断层:高层大多是早期创始团队成员,基层大多是新招聘的员工,中间层却严重缺乏。

这会导致执行力的瓶颈:高层的战略意图无法有效传达到一线,一线的问题也无法及时反馈到高层。

Minimax的应对方式是有意识地培养中层管理者:

  • 从内部提拔表现优秀的早期员工担任中层管理
  • 在外部招聘有管理经验的人才,填补中层空缺
  • 为中层管理者提供系统的领导力培训
  • 建立轮岗机制,让中层管理者了解不同业务线

挑战四:保持创新活力

组织变大后,创新活力往往下降。流程变多了,试错空间变小了,"革命性"的想法更难获得资源。

这对于AI公司来说尤其危险,因为AI领域的竞争本质上是创新的竞争。

Minimax的应对方式是刻意保护创新空间:

  • "20%时间":鼓励员工用20%的工作时间探索个人感兴趣的项目
  • 内部孵化:为有潜力的创新项目提供独立的资源和空间
  • 容错机制:接受创新项目的失败,不惩罚善意的尝试
  • 扁平化反馈:任何人都可以直接向高层提出创新建议

六、竞争格局的演变

2023-2024年,中国AI大模型市场的竞争格局经历了剧烈变化。

"百模大战"的洗牌

2023年初,ChatGPT引爆市场后,无数玩家涌入大模型赛道。据不完全统计,一度有超过100家公司宣称在做大模型。

但到了2024年下半年,格局已经明显收窄。

量子位智库发布的报告显示,中国AI大模型市场形成了**"6+2"格局**:

  • "6"指六家主要玩家:字节跳动、阿里巴巴、百度、腾讯、华为、智谱AI
  • "2"指两家创业公司:Minimax和月之暗面

能够进入这个名单,对于Minimax来说是重要的认可。它意味着在残酷的市场竞争中,Minimax成功存活下来,并成为头部玩家之一。

但挑战依然严峻。"6"家公司都是巨头,拥有Minimax无法比拟的资金、流量和人才储备。创业公司要在巨头的夹缝中生存,必须找到自己的独特价值。

差异化竞争策略

Minimax的差异化策略可以总结为几个关键词:

多模态:与大多数竞争对手专注于语言模型不同,Minimax从一开始就布局多模态。语音、图像、视频的生成和理解能力,成为产品的差异化卖点。

ToC优先:当很多公司还在ToB市场厮杀时,Minimax已经在ToC市场建立了用户基础。Talkie的成功证明了这条路线的可行性。

全球化:通过Talkie的海外布局,Minimax的用户分布在全球157个国家和地区。这种全球化能力是大多数国内竞争对手不具备的。

"技术+产品"一体化:不只是做模型,也做产品;不只是卖API,也直接服务用户。这种端到端的能力是竞争壁垒。

与竞争对手的比较

在"6+2"格局中,每个玩家都有自己的定位和优势:

  • 字节跳动(豆包):依托强大的流量分发能力和资金实力,以低价策略抢占市场份额
  • 阿里巴巴(通义千问):深耕电商和云计算场景,ToB能力强
  • 百度(文心一言):搜索入口优势,积累了大量的知识图谱
  • 腾讯(混元):社交生态优势,与微信深度整合
  • 华为(盘古):硬件优势,专注于政企市场
  • 智谱AI:学术背景深厚,在科研和教育领域有优势
  • 月之暗面(Kimi):以超长文本能力著称,在特定场景有突破

与这些竞争对手相比,Minimax的独特优势在于**"多模态+ToC+全球化"的组合**。这是一个相对独特的定位,不直接与任何一家正面竞争。

七、2024年末的战略复盘

2024年末,闫俊杰组织核心团队进行了一次深度的战略复盘。

成就回顾

  • 技术层面:abab 6.5达到万亿参数,线性注意力机制成功应用,模型能力进入全球第一梯队
  • 产品层面:Talkie年收入突破7000万美元,用户覆盖157个国家和地区
  • 组织层面:团队规模扩大数倍,但保持了创业公司的活力和效率
  • 融资层面:完成A+轮融资,估值达到25亿美元

问题识别

  • 国内ToC产品的增长不如预期,受到监管和竞争的双重压力
  • ToB业务收入增长缓慢,销售周期和定制成本仍是瓶颈
  • 开源模型的崛起对闭源策略构成挑战
  • 算力成本仍然较高,对利润率形成压力

战略调整

基于这次复盘,Minimax对2025年的战略进行了调整:

  1. 继续加大海外投入:Talkie的成功证明了海外市场的潜力,应该加大投入
  2. 强化多模态优势:这是差异化的核心,不能被竞争对手追平
  3. 提升训练效率:借鉴DeepSeek的经验,优化训练流程,降低成本
  4. 产品矩阵优化:聚焦最有潜力的产品线,砍掉不赚钱的项目
  5. 组织效率提升:在规模扩大的同时保持高效,避免大公司病

本章核心洞察

  1. 外部冲击是检验战略定力的试金石。 ChatGPT的爆发让无数玩家涌入赛道,但真正能够坚持自己节奏、不被带偏的公司才能笑到最后。

  2. 技术进步需要持续投入。 从abab 6到6.5,从万亿参数到线性注意力,每一次突破背后都是巨大的资源投入和团队努力。没有捷径可走。

  3. 错误率是AI产品的生命线。 用户能接受不完美的AI,但无法接受经常犯错的AI。降低错误率的努力值得持续投入。

  4. 商业化需要多元探索。 ToB和ToC各有利弊,没有绝对正确的路线。关键是找到适合自己的组合。

  5. 价格战中,效率是唯一的护城河。 降价是必然趋势,但只有在保持效果的同时降低成本,才能在价格战中生存。

  6. 组织扩张需要主动管理。 文化稀释、效率下降、梯队断层——这些问题不会自动解决,需要有意识地投入精力应对。

  7. 开源不是终结者,产品才是。 DeepSeek的开源冲击证明了模型本身的价值在下降,但"模型+产品"的一体化能力仍然是稀缺的竞争力。


【本章完】


请输入"继续"以开始第八章:2025年——重大转折点与危机时刻

第八章:2025年——重大转折点与危机时刻

一、风暴前夜的平静

2025年的第一天,闫俊杰站在办公室的落地窗前,眺望着上海的天际线。

过去的三年多时间里,Minimax从一间狭小的办公室起步,成长为估值25亿美元的独角兽。团队从十几个人扩展到数百人,产品服务着全球数千万用户。

但他心里清楚:真正的考验才刚刚开始。

2024年的成绩单看起来不错——Talkie收入突破7000万美元,技术能力跻身全球第一梯队,在"6+2"格局中占据一席之地。但表面的光鲜背后,隐忧正在积累。

算力成本持续高企,虽然效率在提升,但绝对投入仍然惊人。竞争对手的追赶越来越紧,差异化优势正在被蚕食。国内市场的监管环境日趋复杂,某些产品功能的迭代受到限制。更重要的是,开源模型的崛起正在动摇整个行业的商业逻辑。

新年刚过,一场出乎所有人意料的风暴即将来袭。

二、DeepSeek-R1的冲击波

2025年1月:震惊世界的发布

2025年1月20日,DeepSeek发布了DeepSeek-R1系列模型。

这个发布在全球科技界引发了一场地震。

R1的性能接近OpenAI最新发布的o1模型——后者被认为是当时世界上最强大的推理模型。但更令人震惊的是R1的训练成本:据DeepSeek披露,整个训练过程的成本仅为约600万美元

这个数字太过惊人,以至于很多人最初不敢相信。

OpenAI训练GPT-4的成本估计在1亿美元以上。即使是最乐观的估计,训练一个顶级大模型也需要数千万美元。而DeepSeek声称只用了600万美元?

但随后公开的技术细节证实了这一点。DeepSeek在训练效率上做了大量创新:

  • 更高效的训练算法:减少了不必要的计算冗余
  • 数据工程优化:用更少但更高质量的数据达到同等效果
  • 硬件利用率提升:最大化每块GPU的产出
  • 架构创新:MoE架构的进一步优化

更重要的是,DeepSeek选择了完全开源。任何人都可以免费下载和使用R1模型,包括商业用途。

这一举措彻底打破了大模型领域的既有格局。

全球市场的连锁反应

DeepSeek-R1的发布引发了一系列连锁反应:

美国股市:英伟达股价单日暴跌17%,市值蒸发近6000亿美元。投资者担心:如果训练大模型不再需要天量算力,英伟达的AI芯片生意还能持续吗?

OpenAI:据报道,OpenAI内部紧急召开会议,评估DeepSeek的技术路线。此前被视为"不可逾越"的技术护城河,似乎一夜之间被攻破。

中国科技股:与美股的恐慌相反,中国科技股迎来普涨。市场认为,DeepSeek证明了中国AI公司可以在芯片受限的情况下另辟蹊径。

全球AI创业公司:无数创业公司开始重新评估自己的战略。如果顶级模型可以免费获取,那么还有必要自己训练模型吗?

Minimax的内部震动

对于Minimax来说,DeepSeek-R1的冲击是多层次的。

第一层:技术自信的动摇。

Minimax一直以技术领先为核心竞争力。但DeepSeek证明了:用远低于Minimax的成本,也可以训练出顶级模型。这不禁让人怀疑:Minimax的训练效率是否有问题?是否存在巨大的优化空间?

第二层:商业模式的挑战。

如果模型本身可以免费获取,那么"卖模型能力"的商业模式还能成立吗?Minimax的API业务、ToB业务,都建立在"模型能力稀缺"的假设之上。这个假设正在被动摇。

第三层:人才市场的竞争。

DeepSeek的成功让它成为AI人才眼中的明星公司。一些原本有意向加入Minimax的候选人,开始转向DeepSeek。甚至有少数在职员工动了跳槽的念头。

1月下旬,闫俊杰召集核心团队,召开了一次紧急战略会议。

会议室里气氛凝重。白板上写满了问题:

  • 我们的训练效率差距到底有多大?
  • 开源模式会成为主流吗?
  • 我们是否应该调整闭源策略?
  • 如何向投资人和员工解释形势?

闫俊杰让每个人充分发表意见。有人建议加大开源力度,有人建议聚焦应用层,有人建议加大效率优化投入,也有人认为应该保持定力、不被带偏。

讨论持续了整整一个下午。

最后,闫俊杰总结了自己的判断:

"DeepSeek的成功是真实的,我们不应该否认或低估。但我们也不应该恐慌。让我们分析一下,DeepSeek真正证明了什么,以及我们的核心竞争力到底是什么。"

他在白板上画了一个图表:

模型能力 × 产品能力 × 运营能力 = 用户价值

DeepSeek的优势:模型能力(开源可获取)
Minimax的优势:模型能力 + 产品能力 + 运营能力

"DeepSeek开源的是模型,但模型只是创造用户价值的一部分。把模型转化为用户喜欢的产品,需要产品能力。把产品推广给亿万用户,需要运营能力。这些是无法开源的。"

"Talkie的成功不只是因为我们的模型好,更是因为我们理解用户、懂得产品、擅长运营。使用DeepSeek开源模型的公司可能有很多,但做出Talkie这样成功产品的,只有我们。"

"所以,我的结论是:我们要学习DeepSeek的效率创新,但不必放弃我们的核心战略。模型+产品+运营的一体化能力,仍然是我们的护城河。"

会议最后,团队达成了共识:

  1. 成立专项小组,研究DeepSeek的技术路线,寻找效率提升空间
  2. 继续坚持闭源策略,但保持灵活性,不排除未来部分开源
  3. 加大产品和运营投入,强化"模型→产品"的转化能力
  4. 主动与投资人和员工沟通,稳定军心

三、技术产品"五连发"

2025年6月:绝地反击

面对DeepSeek的冲击,Minimax没有选择防守,而是选择了进攻。

2025年6月,Minimax举办了一场大型发布会,一口气发布了五款重磅产品。这场"五连发"被业界视为Minimax的绝地反击。

产品一:新一代基座模型

首先发布的是新一代基座模型,在多个关键指标上取得突破:

  • 推理能力大幅提升,在复杂推理任务上接近o1水平
  • 训练效率显著改善,单位性能的成本下降约40%
  • 错误率进一步降低,在关键应用场景接近人类水平

这个发布证明了:Minimax有能力快速响应技术变革,在效率和性能上都能保持竞争力。

产品二:多模态大模型升级

第二个发布是多模态能力的全面升级:

  • 视觉理解能力达到新高度,可以分析复杂的图表、图像和视频
  • 语音交互更加自然流畅,延迟降低到难以察觉的水平
  • 视频生成能力首次公开展示,画面质量和时长都有突破

多模态一直是Minimax的核心优势领域。这次升级进一步拉大了与竞争对手的差距。

产品三:智能体(Agent)平台

第三个发布是全新的智能体平台:

  • 用户可以创建自定义的AI智能体,设定其性格、知识和行为模式
  • 智能体可以访问外部工具和数据源,完成复杂的任务
  • 智能体之间可以协作,形成多智能体系统

智能体被视为大模型应用的下一个重要方向。这个平台的发布,让Minimax在这个领域占据了先机。

产品四:开发者工具套件

第四个发布面向开发者社区:

  • 更易用的API,降低接入门槛
  • 丰富的SDK,支持主流编程语言和开发框架
  • 完善的文档和示例代码
  • 免费额度和创业公司扶持计划

这个发布旨在扩大Minimax的开发者生态,让更多的应用构建在Minimax之上。

产品五:企业解决方案升级

第五个发布针对企业客户:

  • 私有化部署选项,满足数据安全需求
  • 行业定制模型,针对金融、医疗、教育等垂直领域
  • 企业级服务保障,包括SLA、技术支持和定制开发

这个发布是对ToB业务的加强,试图在这个领域获取更多收入。

发布会的效果

"五连发"在业界引起了巨大反响:

媒体评价:多家科技媒体给予高度评价,认为Minimax展示了强大的技术储备和产品能力。

资本市场:投资人对Minimax的信心有所恢复,公司估值在发布会后有所上涨。

竞争对手:其他大模型公司感受到了压力,纷纷加快自己的产品发布节奏。

开发者社区:开发者工具套件获得了积极反馈,API注册量在发布后的一个月内翻倍。

但"五连发"也带来了巨大的资源压力。

同时推进五条产品线,意味着人力、算力、资金的全面吃紧。每条产品线都需要持续投入,而公司的资源是有限的。

发布会后的几个月里,团队陷入了高强度的交付压力。bug修复、功能完善、客户支持……每个团队都在超负荷运转。

这种状态是否可持续?这是一个待解的问题。

四、Talkie的收入奇迹

在技术竞争的喧嚣中,Talkie的表现却稳如磐石。

2025年上半年业绩回顾

2025年上半年,Talkie的业务数据持续向好:

  • 月活用户突破1500万,同比增长超过80%
  • 付费用户转化率稳定在8%左右,远高于行业平均
  • 用户日均使用时长超过40分钟,粘性极强
  • 收入继续保持高速增长,全年有望突破1亿美元

这些数字在中国AI创业公司中几乎是独一无二的。大多数公司还在苦苦寻找商业模式,Talkie已经证明了AI产品可以赚钱,而且可以赚大钱。

成功要素深度分析

Talkie的成功不是偶然的,而是多个要素共同作用的结果:

要素一:产品定位的精准

Talkie的核心定位是"AI社交"——不是让AI帮你完成任务,而是让AI陪伴你、与你互动。

这个定位切中了一个真实而巨大的需求:情感连接。

现代社会中,越来越多的人感到孤独。尤其是年轻一代,虽然在网络上有无数"好友",但真正能够交心的人却很少。AI恰好可以填补这个空白——它永远有时间、永远有耐心、永远不会评判你。

Talkie的产品设计围绕这个需求展开:

  • 用户可以与各种AI角色互动,这些角色有独特的性格和故事
  • 对话风格温暖、有趣、有深度,能够产生情感共鸣
  • 产品有记忆和连续性,用户与AI之间可以建立"关系"

要素二:海外市场的选择

Talkie选择主攻欧美市场,这是一个关键决策。

与国内市场相比,欧美市场有几个优势:

  • 付费意愿强:欧美用户习惯为数字内容付费,ARPU更高
  • 监管宽松:产品迭代更快,不需要等待漫长的审批流程
  • 竞争格局分散:虽然有ChatGPT等强劲对手,但在"AI社交"这个细分领域,竞争相对较弱

当然,海外运营也有挑战:文化差异、语言本地化、时区问题、支付渠道……但Talkie团队通过精细化运营,逐一克服了这些挑战。

要素三:运营的精细化

Talkie的运营团队在用户获取、留存、付费各个环节都做了大量精细化工作。

用户获取

  • 在TikTok、Instagram等平台投放精准广告
  • 与网红和KOL合作,借助其影响力推广
  • 应用商店优化(ASO),提高自然流量
  • 口碑传播激励,鼓励用户分享和邀请

用户留存

  • 新用户引导流程优化,降低流失率
  • 推送策略优化,召回沉默用户
  • 定期更新内容和角色,保持新鲜感
  • 社区建设,增强用户归属感

付费转化

  • 定价策略优化,找到用户愿意接受的价格点
  • 付费功能设计,让用户感受到付费的价值
  • 促销活动,刺激付费转化
  • 订阅模式,建立稳定的收入来源

每一个环节,都有详细的数据监控和持续的优化迭代。这种运营能力是Talkie成功的重要因素,也是竞争对手难以复制的壁垒。

要素四:技术与产品的融合

Talkie的成功离不开Minimax强大的技术支撑。

  • 多模态能力让AI角色可以"说话"、"表达表情",交互更加自然
  • 低延迟推理让对话流畅无卡顿,用户体验更好
  • 长期记忆能力让AI记住与用户的互动历史,关系更加真实
  • 安全机制保护用户不受有害内容的侵害

这些技术能力是Talkie产品体验的基础。很多试图模仿Talkie的竞争对手,因为技术能力不足,只能停留在"功能相似、体验平庸"的阶段。

要素五:组织的专注

Talkie有独立的产品、运营、技术团队,专注于这一个产品的成功。

这种专注是很多公司做不到的。大公司往往资源分散,每个项目都只能获得有限的关注。创业公司则往往受到创始人精力的限制,难以同时照顾多条产品线。

Minimax的做法是给Talkie足够的自主权和资源,让团队能够全身心投入。这种组织设计是Talkie成功的重要保障。

五、危机时刻的真实代价

光鲜的业绩数字背后,是巨大的压力和代价。

2025年,Minimax经历了创业以来最严峻的挑战时刻。

算力危机

2025年,AI芯片的供应问题再次恶化。

美国政府加强了对华芯片出口管制,英伟达最新的H系列芯片被全面禁售。虽然之前的A100和H100可以继续使用,但新增采购变得极其困难。

与此同时,国产替代芯片的性能和生态还不成熟,无法完全填补空缺。

这对Minimax的影响是直接的:

  • 训练计划被迫调整,某些实验因算力不足而延期
  • 推理服务的扩容受到限制,影响用户体验
  • 算力成本进一步上升,侵蚀利润

团队不得不采取一系列应对措施:

  • 加大效率优化力度,让每块芯片发挥更大价值
  • 与多家云服务商合作,分散算力来源
  • 探索国产芯片的应用,为未来做准备
  • 调整产品规划,优先保障核心业务

这场算力危机让团队深刻认识到:自主可控的算力供应是长期竞争力的关键。

人才流失

DeepSeek的崛起和行业的激烈竞争,带来了人才市场的动荡。

2025年上半年,Minimax经历了几次重要的人才流失:

  • 一位核心算法研究员被DeepSeek高薪挖走
  • 一个资深工程师团队被字节跳动整体收编
  • 两位产品经理接受了创业公司的联合创始人邀请

每一次人才流失都对团队士气造成冲击。更重要的是,核心人才的离开带走了宝贵的知识和经验,需要很长时间才能弥补。

闫俊杰对此有清醒的认识:

"人才流失是正常的,我们不可能留住每一个人。关键是两点:第一,确保核心团队稳定;第二,建立知识传承机制,避免关键能力随个人流失。"

为了应对人才危机,公司采取了多项措施:

  • 重新评估核心人才的薪酬和激励,确保竞争力
  • 加强内部沟通,让员工了解公司的战略和前景
  • 改善工作环境和福利,提升员工满意度
  • 加大人才招聘力度,补充新鲜血液
  • 推进知识管理,减少单点依赖

资本压力

25亿美元的估值是一把双刃剑。

高估值意味着投资人的高期待。他们期望看到与估值相匹配的增长速度和商业化进展。如果达不到预期,后续融资将面临困难,估值可能被迫下调("down round")。

2025年,Minimax面临着这种压力:

  • 部分投资人对商业化进度表达了担忧
  • 有传言称某些投资人在寻求出售股份
  • 后续融资的谈判进展缓慢,估值预期存在分歧

闫俊杰需要花费大量时间与投资人沟通,解释公司的战略和进展。这些时间本可以用于产品和技术的推进。

在一次投资人会议上,他这样阐述自己的观点:

"我们的目标不是短期内实现盈利,而是建立长期的竞争优势。Talkie已经证明了我们可以赚钱。现在的问题不是'能不能赚钱',而是'如何在赚钱的同时保持技术领先'。如果为了短期收入牺牲长期投入,我们会失去真正的护城河。"

这番话说服了大部分投资人,但也有人持保留意见。创始人与投资人之间的张力是永恒的主题。

战略质疑

在公司内部,也有一些质疑的声音。

质疑主要集中在两个方面:

质疑一:"技术优先"是否还对?

有人认为,公司在技术上投入过多,在商业化上投入不足。模型能力固然重要,但如果不能转化为收入,再强的技术也没有意义。

他们建议:减少基础研究的投入,把资源集中在已经验证的商业化方向上(比如Talkie),尽快实现盈利。

质疑二:产品线是否太分散?

有人认为,公司同时推进太多产品线,资源过于分散。不如砍掉一些不成功的项目,把资源集中在最有希望的方向上。

这两种质疑都有一定道理。在资源有限的情况下,每一笔投入都有机会成本。如果把资源集中在商业化最成功的方向上,短期内确实可以更快盈利。

但闫俊杰的判断是不同的:

"如果我们只看短期收入,最理性的选择是All in Talkie,放弃其他所有项目。但Talkie的成功建立在我们的技术能力之上。如果停止技术投入,两年后Talkie的竞争力也会下降。"

"我们需要的是平衡——在保持技术领先的同时推进商业化。这很难,但这是正确的方向。如果只是为了短期变现,我当初就不会选择创业。"

这种坚持需要勇气,也需要说服力。闫俊杰花了大量时间在内部沟通上,解释战略的逻辑,回应团队的疑虑,凝聚共识。

六、穿越风暴的领导力

2025年是对闫俊杰领导力的极限考验。

面对技术冲击、人才流失、资本压力、内部质疑,他需要在多个战线上同时作战,保持清醒的判断和坚定的执行。

保持冷静的能力

在风暴中,领导者最重要的品质是冷静

当DeepSeek的消息传来时,很多人陷入恐慌:我们是不是落后了?我们是不是选错了路?我们应该怎么办?

闫俊杰的反应却是有条不紊地分析:DeepSeek真正证明了什么?这对我们意味着什么?我们应该学习什么,应该坚持什么?

这种冷静不是无动于衷,而是在承认问题的同时保持理性思考的能力

他在内部多次强调:

"恐慌没有用,自我怀疑没有用。我们需要的是准确地理解形势,然后做出正确的应对。"

做出艰难决定的魄力

危机时刻需要做出艰难的决定。

2025年上半年,闫俊杰做了几个困难但必要的决策:

  • 砍掉某个投入大但前景不明的产品线:这意味着承认之前的判断失误,也意味着一些团队成员需要转岗或离开
  • 调整组织架构:合并一些功能重叠的部门,提高效率,但也意味着一些管理岗位被取消
  • 暂缓海外某地区的扩张计划:资源有限,需要更聚焦,但这让已经投入的团队成员感到失望

每一个决定都有人受到影响,都有人不满意。但作为创始人,他必须做出取舍。

闫俊杰的原则是:决策可以艰难,但过程必须透明。

每一个重大决策,他都会向团队解释背景、逻辑和考量。即使有人不同意结论,至少能理解为什么这样决定。这种透明度有助于维持信任。

激励团队的持续投入

在困难时刻,团队的士气容易低落。这时候需要领导者的激励。

闫俊杰的激励方式不是喊口号、画大饼,而是让团队看到真实的进步和希望

他定期与团队分享公司的进展:

  • Talkie的用户增长和收入数据,证明商业化是可行的
  • 技术团队的突破性成果,证明我们在技术上仍然领先
  • 用户的真实反馈和故事,证明我们的产品在帮助真实的人

这些真实的证据,比任何激励演讲都更有说服力。

他也坦诚面对困难:

  • 我们确实面临挑战,这些挑战不会自动消失
  • 但挑战是每一个成功公司都经历过的,我们也会度过
  • 每一次危机都是淬炼,让我们变得更强

这种"坦诚+希望"的组合,帮助团队在困难时刻保持了信心和凝聚力。

自我反思的习惯

危机时刻,领导者最容易犯的错误是固执己见

当外部环境剧变时,过去正确的判断可能不再适用。如果领导者不能反思和调整,就会带着团队走向错误的方向。

闫俊杰保持着自我反思的习惯:

  • 定期回顾之前的决策,评估哪些是对的,哪些需要调整
  • 主动征求团队的反对意见,避免"一言堂"
  • 与外部顾问和行业专家交流,获取不同视角
  • 阅读和学习,保持认知的更新

2025年,他对自己的一些假设进行了修正:

  • 对开源模式的看法:之前认为开源模式难以商业化,DeepSeek的成功让他重新思考开源的战略价值
  • 对训练效率的重视:之前认为规模是第一位的,现在更加重视效率优化
  • 对组织效率的反思:公司增长过程中确实出现了一些大公司病,需要主动治理

这种自我反思和调整的能力,是领导者在不确定环境中保持正确方向的关键。

七、年末的战略再定位

2025年末,经过一年的风风雨雨,闫俊杰对公司的战略进行了重新梳理。

核心判断的更新

判断一:模型能力正在商品化,应用层成为关键战场

DeepSeek和其他开源模型的崛起证明,基础模型能力正在快速扩散。虽然顶尖模型仍有差距,但差距在缩小。

这意味着:单纯的模型能力难以形成持久的竞争优势。真正的护城河在于"模型+产品+运营"的一体化能力。

Minimax应该继续保持技术领先,但更重要的是把技术转化为用户价值。

判断二:效率优化与规模扩张同等重要

之前的策略偏重规模——更大的模型、更多的参数、更强的能力。

DeepSeek的成功证明,效率优化可以带来巨大的成本优势。在算力受限的环境下,效率优化尤其重要。

未来的竞争不只是比谁的模型大,更是比谁的模型"性价比"高。

判断三:聚焦优于分散

2025年的"五连发"虽然展示了公司的技术储备,但也造成了资源分散。

未来应该更加聚焦:识别最有价值的方向,集中资源投入,而不是追求面面俱到。

战略调整的方向

基于这些判断,Minimax对2026年的战略进行了调整:

方向一:Talkie作为核心,海外市场作为重心

Talkie已经验证了商业模式,应该进一步加大投入。海外市场的空间更大、竞争相对较弱,应该成为增长的重心。

方向二:多模态保持差异化

多模态是Minimax的核心优势,应该继续保持领先。但投入应该更加聚焦在高价值场景,而不是追求全面覆盖。

方向三:效率驱动的技术策略

技术投入的重点从"规模扩张"转向"效率优化"。目标是在保持性能的同时大幅降低成本。

方向四:组织精简和效率提升

停止盲目扩张,甚至适当收缩。把资源集中在核心团队和核心项目上,提高人均产出。

方向五:开放合作的态度

在适当的条件下,不排除部分开源或技术合作。用更开放的心态参与行业生态。

本章核心洞察

  1. 外部冲击是检验战略韧性的终极测试。 DeepSeek的冲击让整个行业震动,但真正考验的是每家公司应对变化的能力。恐慌无用,理性分析和快速调整才是正道。

  2. 开源不是终结者,但确实改变了游戏规则。 模型能力正在商品化,应用层的竞争变得更加关键。"模型+产品+运营"的一体化能力是新的护城河。

  3. 效率与规模同等重要。 在算力受限的环境下,效率优化可以带来显著的竞争优势。"性价比"正在成为核心指标。

  4. 危机时刻的领导力体现在冷静、决断和激励。 保持冷静地分析问题,果断地做出决定,持续地激励团队——这是穿越风暴所需的领导力素质。

  5. 自我反思是领导者的必备习惯。 环境在变,之前正确的判断可能不再适用。能够反思和调整的领导者,才能带领团队持续向前。

  6. 聚焦优于分散。 资源有限时,与其追求面面俱到,不如集中力量在最有价值的方向上实现突破。

  7. 商业化的成功需要产品和运营的积累。 Talkie的成功不只是因为技术好,更是因为产品设计、用户洞察和精细化运营。这些能力同样是核心竞争力。


【本章完】


请输入"继续"以开始第九章:与资本、市场、竞争对手的博弈

第九章:与资本、市场、竞争对手的博弈

一、资本的双面刃

创业公司与资本的关系,从来都是一场复杂的博弈。

资本是燃料,没有它,火箭无法升空。但资本也是枷锁,一旦接受,就必须按照某种节奏起舞。如何在获取资源的同时保持战略自主,是每一个创始人都要面对的核心命题。

闫俊杰从创业第一天起,就对这个命题有清醒的认识。

早期融资:在怀疑中起步

2021年末Minimax成立时,AI投资正处于低谷。

ChatGPT尚未问世,大语言模型还是小众话题。投资人普遍对"大模型创业"持怀疑态度:

  • "OpenAI有微软撑腰,你们凭什么竞争?"
  • "训练大模型要烧多少钱?你们烧得起吗?"
  • "商业化路径在哪里?怎么赚钱?"

这些质疑不无道理。当时确实没有人能给出确定的答案。

闫俊杰的应对策略是坦诚+信念

坦诚地承认不确定性——是的,我们不知道最终能不能成功,这是一个高风险的赌注。

但坚定地表达信念——大模型是未来,中国需要自己的大模型公司,我们有能力、有决心做这件事。

这种态度筛选出了一批真正理解长期价值的投资人。他们不是被短期回报吸引,而是被愿景打动。这种"价值观筛选"在后来证明是正确的——在困难时刻,这些投资人确实表现出了更多的耐心和支持。

早期融资的另一个原则是:不为估值牺牲条款

有些投资人愿意给更高的估值,但要求更多的控制权:董事会席位、一票否决权、对赌协议……

闫俊杰拒绝了这些条款。他宁愿接受较低的估值,也要保持对公司的控制。

这个决定在当时看起来"亏了"——同样稀释一定比例的股权,拿到的钱更少。但长期来看是正确的:保持控制权让Minimax能够坚持自己的战略节奏,而不是被资本意志绑架。

A+轮:25亿美元独角兽的诞生

2023-2024年,随着ChatGPT引爆市场,AI投资迅速升温。Minimax的融资环境发生了戏剧性的变化。

之前追着投资人解释"大模型是什么",现在是投资人追着问"你们还接受投资吗"。

这种变化带来了机遇,也带来了风险。

机遇是显而易见的:可以用更高的估值融到更多的钱,为长期发展储备弹药。

风险则是隐蔽的:过高的估值会带来过高的期待,如果业绩达不到预期,后续融资将面临困难。

闫俊杰在这轮融资中保持了审慎:

  • 没有追求最高的估值,而是选择了合理的估值区间
  • 优先选择理解长期价值的投资人,而非只看短期回报的
  • 保留了足够的股权空间,为未来融资和员工激励预留余地
  • 拒绝了某些投资人的"对赌"要求

最终,Minimax完成A+轮融资,估值达到25亿美元,正式跻身"独角兽"行列。

这个估值在当时的市场环境下是合理的,但也意味着巨大的责任。投资人投入了真金白银,期待看到与估值相匹配的回报。如何平衡增长与可持续性,成为闫俊杰必须面对的新课题。

资本压力的真实面貌

25亿美元估值带来的压力,在2025年变得尤为明显。

投资人的期待体现在多个维度:

收入增长:Talkie的7000万美元收入虽然亮眼,但相对于25亿估值,市销率仍然很高。投资人希望看到收入继续高速增长,证明商业模式的可扩展性。

用户增长:用户规模是衡量ToC公司价值的核心指标。投资人密切关注月活、日活、留存率等数据,任何下滑都会引发担忧。

技术领先:投资人投资Minimax,很大程度上是相信其技术实力。如果在与竞争对手的比较中落后,投资逻辑就会动摇。

盈利路径:虽然不要求立刻盈利,但投资人希望看到清晰的盈利路径。"什么时候能盈亏平衡?"是每次董事会必问的问题。

这些期待本身是合理的,但同时满足所有期待几乎是不可能的。创始人必须在其中做出取舍。

闫俊杰的策略是:主动沟通,管理预期

他定期与主要投资人进行深度沟通,分享公司的真实状况——不只是好消息,也包括挑战和困难。这种透明建立了信任。

他也清晰地表达自己的判断和优先级:

"我们的首要目标是保持技术领先和产品创新。短期收入很重要,但不应该以牺牲长期竞争力为代价。我相信,如果我们能成为最好的AI产品公司,商业回报自然会到来。"

这种沟通不能消除所有分歧,但至少让投资人理解了创始人的逻辑。即使不完全同意,他们也愿意给予一定的空间和时间。

拒绝"资本炒作"

2024-2025年,AI赛道不乏"资本炒作"的案例。

有些公司为了抬高估值,夸大技术能力、虚构用户数据、制造虚假繁荣。短期内估值飙升,但很快就会暴雷。

Minimax始终与这种做法保持距离。

闫俊杰在内部明确要求:

  • 对外披露的数据必须真实准确,不得夸大
  • 不发布未经验证的技术声明
  • 不参与纯粹为了炒作估值的"资本游戏"

这种原则在短期内可能让公司显得"不够性感"。竞争对手的估值可能更高,媒体曝光可能更多。但长期来看,诚信是最重要的资产。

DeepSeek的案例提供了一个有趣的对照。这家公司背靠幻方量化,资金充裕,但始终保持低调。创始人梁文锋几乎不接受媒体采访,公司也很少做PR。当DeepSeek-R1发布时,业界才真正意识到他们走了多远。

这种"用实力说话"的风格与闫俊杰的理念不谋而合:

"真正的竞争力不是讲出来的,而是做出来的。如果我们的产品足够好,用户和投资人自然会看到。如果产品不够好,再多的PR也没用。"

二、市场博弈:监管、用户与生态

资本之外,Minimax还需要在更广阔的市场中博弈。

国内监管:在红线内创新

中国的AI监管环境日趋复杂。

2023年起,一系列针对生成式AI的法规陆续出台:

  • 算法备案:提供生成式AI服务的公司,必须向监管部门备案
  • 内容安全:AI生成的内容必须符合法律法规,不得传播有害信息
  • 数据合规:训练数据的获取和使用必须合法,尤其是涉及个人信息时
  • 标识要求:AI生成的内容必须明确标识,避免误导用户

这些监管要求给AI公司带来了显著的合规成本。

Minimax的应对策略是:积极合规,在红线内创新

具体措施包括:

  • 组建专门的合规团队,跟踪政策变化,确保公司行为符合要求
  • 在产品设计中内置安全机制,过滤有害内容
  • 建立数据治理体系,确保训练数据的合法性
  • 主动与监管部门沟通,了解政策意图,反馈行业情况

这种积极合规的态度有时候会被视为"保守"。有些竞争对手愿意冒更大的风险,推出更"激进"的功能。但闫俊杰认为,这种激进是短视的:

"监管红线是客观存在的。踩线可能带来短期的竞争优势,但一旦被查处,代价会非常大。我们宁可走得慢一点,也不愿意走到不该去的地方。"

事实也证明了这一点。2024年,有几家AI公司因为内容安全问题被约谈或处罚,产品被迫下架整改。Minimax因为一贯的合规态度,避免了这些麻烦。

海外突破:全球化的机遇与挑战

与国内市场的复杂环境相比,海外市场展现出不同的特点。

机遇

  • 用户规模更大:全球互联网用户超过50亿,远大于中国市场
  • 付费意愿更强:欧美用户习惯为数字内容付费,ARPU更高
  • 监管相对宽松:很多国家对AI应用的限制较少,产品迭代更快
  • 竞争格局分散:虽然有OpenAI等巨头,但在细分领域仍有机会

挑战

  • 文化差异:不同国家的用户偏好差异大,产品需要本地化
  • 运营难度:需要在多个时区、多种语言环境下运营
  • 地缘政治:中国公司出海面临特殊的政治风险
  • 支付和合规:各国支付渠道和合规要求不同

Talkie的成功证明了Minimax的全球化能力。这款产品在157个国家和地区运营,团队积累了丰富的出海经验。

几个关键的成功要素:

本地化做到位:不只是语言翻译,而是深入理解当地用户的需求和偏好。Talkie针对不同市场有不同的内容和角色设计。

运营精细化:建立了多时区的客服和运营团队,确保用户问题能够及时响应。

合规先行:进入每个市场之前,先研究当地的法规要求,确保产品合规。

渐进式扩张:不是一下子进入所有市场,而是先在核心市场(如美国、英国)站稳脚跟,再逐步扩展。

用户心智:从"工具"到"陪伴"

在用户层面,Minimax面临的核心挑战是:如何在用户心中建立独特的位置?

AI产品很容易陷入同质化竞争。ChatGPT、Claude、Gemini、文心一言……从用户角度看,它们做的事情差不多,很难区分。

Minimax的差异化策略是:从"工具"到"陪伴"的产品哲学

大多数AI产品定位是"工具"——帮用户完成任务、提高效率、解决问题。这个定位没有错,但竞争激烈,同质化严重。

Minimax选择了另一条路:强调AI的"陪伴"属性。

这个定位体现在多个产品中:

  • Talkie:核心卖点是AI社交和情感陪伴,而非效率提升
  • 星野:强调AI角色的人格魅力,让用户产生情感连接
  • 海螺AI:虽然有工具属性,但交互方式更加自然、亲切

这种定位切中了一个被忽视的用户需求:人们不只需要高效的工具,也需要温暖的陪伴。

现代社会中,孤独感日益普遍。很多人尤其是年轻人,在现实中缺乏深度的社交连接。AI恰好可以填补这个空白——它永远在线、永远有耐心、不会评判你。

当然,"陪伴"定位也有其局限性。它可能不如"效率工具"那样容易变现,用户付费意愿可能不如企业客户。但Talkie的收入表现证明了这个定位的商业可行性。

三、竞争对手分析

在"6+2"的市场格局中,Minimax需要与多个强劲对手竞争。

智谱AI:学术派的B端深耕

智谱AI脱胎于清华大学,拥有深厚的学术背景。创始团队与学术界保持紧密联系,在科研和教育领域有天然优势。

优势

  • 学术声誉带来的品牌效应
  • 在教育、科研领域的深度布局
  • 与政府和国企的良好关系
  • ChatGLM系列模型的技术实力

策略

智谱AI的策略是B端深耕——与大型企业和机构合作,提供定制化的AI解决方案。

这与Minimax的ToC优先策略形成互补。两家公司在很多场景下不是直接竞争对手。

对Minimax的启示

智谱AI的成功证明了B端市场的价值。虽然Minimax以ToC为主,但也不应该完全放弃B端机会。尤其是在那些与C端产品有协同的B端场景,可以考虑布局。

月之暗面(Kimi):长文本的突破

月之暗面是另一家进入"6+2"格局的创业公司,其产品Kimi以超长文本能力著称。

优势

  • 20万字长文本处理能力,在特定场景有突出优势
  • 创始人杨植麟的技术背景和行业影响力
  • 在学生和知识工作者群体中有较高知名度

策略

月之暗面的策略是单点突破——不追求全面能力,而是在长文本这个点上做到极致。

这种策略有其道理:在资源有限的情况下,聚焦比分散更容易成功。

对Minimax的启示

月之暗面的长文本能力确实形成了差异化。Minimax需要思考:在自己的优势领域(如多模态),是否也做到了足够的深度?单点突破和全面布局之间如何平衡?

DeepSeek:开源颠覆者

DeepSeek已经在第八章详细讨论过。这里只补充几点竞争分析。

优势

  • 充裕的资金支持(背靠幻方量化)
  • 顶尖的技术团队
  • 开源策略带来的生态影响力
  • 成本效率的显著领先

策略

DeepSeek的策略是开源颠覆——通过免费提供顶级模型,打破行业的既有格局。

这种策略对整个行业都是挑战。当模型能力可以免费获取时,竞争的焦点就转移到了应用层。

对Minimax的启示

DeepSeek的成功证明了两点:一是训练效率还有巨大的优化空间,Minimax需要加大这方面的投入;二是模型本身的价值在下降,"模型+产品+运营"的一体化能力才是护城河。

巨头对比:字节、阿里、百度、腾讯、华为

与创业公司相比,巨头的竞争逻辑完全不同。

字节跳动(豆包)

  • 优势:流量分发能力、资金实力、全球化经验
  • 策略:低价抢市场,用C端流量导入
  • 威胁:价格战可能挤压创业公司的生存空间

阿里巴巴(通义千问)

  • 优势:电商生态、云计算能力、企业客户基础
  • 策略:深耕电商和云计算场景,ToB为主
  • 威胁:在企业市场与Minimax形成竞争

百度(文心一言)

  • 优势:搜索入口、知识图谱、早期布局
  • 策略:全面布局,搜索+对话+应用
  • 威胁:在C端市场有一定用户基础

腾讯(混元)

  • 优势:社交生态、微信入口、ToC经验
  • 策略:整合微信生态,社交+AI
  • 威胁:如果微信深度整合AI,对C端产品形成巨大压力

华为(盘古)

  • 优势:硬件能力、政企关系、端侧AI
  • 策略:政企市场、端云协同
  • 威胁:与Minimax的直接竞争较少

差异化生存

面对这些强劲对手,Minimax的生存之道是什么?

闫俊杰的答案是:差异化

不与巨头在其优势领域正面竞争,而是找到自己的独特价值:

  • 多模态:在语音、视觉等模态上建立领先优势,这是很多竞争对手尚未深入的领域
  • 全球化:通过Talkie等产品在海外市场建立位置,这是国内巨头相对薄弱的环节
  • 情感陪伴:定位于"陪伴"而非"工具",切入被忽视的用户需求
  • 垂直深耕:在特定场景(如社交、创作)做到极致,而非追求通用能力

这种差异化策略的核心逻辑是:不做巨头的小号,做自己的独特版本。

四、闫俊杰的竞争观

理解一个创始人的竞争观,有助于理解公司的战略选择。

"期待与王者一决高下"

闫俊杰在访谈中说过:"我骨子里是一个期待跟王者一决高下的人。"

这句话揭示了他的竞争心态:不回避竞争,而是拥抱竞争。

很多创业者面对巨头时,本能反应是"躲"——找一个巨头看不上的细分市场,悄悄发展。这种策略有其道理,但也有局限:细分市场的天花板可能很低,一旦成功又会吸引巨头入场。

闫俊杰的心态不同。他并不试图回避与巨头的竞争,而是正面迎接。当然,这不意味着鲁莽地硬碰硬,而是在差异化的基础上争取胜利。

这种心态的来源可以追溯到他的成长经历:

  • 县城少年一路考进名校,习惯了在竞争中证明自己
  • 商汤七年见证了一家创业公司如何与巨头竞争并成长
  • 骨子里的不服输和自信,驱动着不断挑战更高目标

"中国AI企业可以引领世界巨头"

在同一次访谈中,闫俊杰还说过另一句话:"中国AI企业可以引领世界巨头。"

这个判断超越了"追赶"的思维,直接定位于"引领"。

这种自信从何而来?

第一,中国市场的独特优势

  • 庞大的用户基数,提供了丰富的数据和反馈
  • 多样的应用场景,可以验证技术的实际价值
  • 激烈的竞争环境,逼迫公司不断进化

第二,中国人才的崛起

  • 越来越多的顶尖AI人才出现在中国
  • DeepSeek的成功证明了中国团队可以在前沿领域取得突破
  • 人才回流趋势正在加速

第三,不同的竞争路径

  • 不必复制硅谷的模式,可以探索自己的道路
  • 开源与闭源并行、ToB与ToC结合、技术与产品融合……这些都是中国AI公司的独特探索

当然,"引领"不是口号,而是需要实力支撑。Minimax还有很长的路要走。但这种志向决定了公司的行动方向:不满足于追随,而是志在引领。

竞争中的学习与尊重

尽管强调竞争,闫俊杰对竞争对手始终保持尊重。

他多次在内部强调:

"竞争对手不是敌人,而是老师。他们的成功值得学习,他们的失败值得警醒。"

DeepSeek的成功就是一个例子。当R1发布引发震动时,Minimax没有选择贬低或否认,而是认真研究其技术路线,寻找可以学习的地方。

这种心态让团队保持了开放和进取:

  • 不因为自己的成绩而骄傲自满
  • 不因为别人的成功而嫉妒抵触
  • 专注于自己的进步,同时向一切优秀者学习

差异化选择:不是"更好",而是"不同"

在竞争策略上,闫俊杰有一个核心原则:不是做"更好的模仿者",而是做"不同的创新者"。

如果只是追求在OpenAI的路线上做得更好,Minimax永远处于追赶位置。无论多努力,资源和积累的差距短期内难以弥补。

但如果选择一条不同的道路,情况就不一样了:

  • OpenAI专注于通用大模型,Minimax可以强调多模态和产品化
  • ChatGPT是效率工具,Talkie是情感陪伴
  • 硅谷公司服务全球英语用户,Minimax深耕多语言本地化

这种差异化不是回避竞争,而是在竞争中找到自己的生态位。

自然界的启示是:物种的生存不在于谁最强大,而在于谁最适应自己的生态位。狮子在草原称王,但鱼在水中同样是王者。关键是找到属于自己的战场。

五、博弈的艺术

与资本、市场、竞争对手的博弈,归根结底是一门艺术。

原则一:保持战略定力,不被短期波动干扰

市场上每天都有新闻:竞争对手融资了、某公司发布新产品了、某个指标下滑了……如果被这些短期波动牵着走,就会失去方向。

闫俊杰的做法是:设定长期目标,用长期目标检验短期行动。

每一个决策,都先问:这对我们的长期目标有帮助吗?如果答案是否定的,即使短期看起来诱人,也要拒绝。

原则二:坦诚沟通,管理预期

无论是投资人、合作伙伴还是员工,关系的基础都是信任。而信任的基础是坦诚。

与其粉饰太平,不如实话实说。短期内可能引发担忧,但长期会建立牢固的信任。

原则三:在竞争中保持学习姿态

竞争对手不是敌人,而是镜子。从他们的成功中学习,从他们的失败中吸取教训。

保持谦逊和开放,才能持续进步。

原则四:差异化是生存之道

不在红海中硬拼,而是开辟属于自己的蓝海。

差异化不是退缩,而是更高级的竞争策略。找到自己的独特价值,才能在竞争中立于不败之地。

原则五:速度和耐心的平衡

创业需要速度——市场不等人,机会稍纵即逝。

但创业也需要耐心——真正的壁垒需要时间积累,短期的胜利不等于长期的成功。

如何平衡?答案是:在战术上快,在战略上慢。

战术层面,快速试错、快速迭代、快速响应市场变化。

战略层面,保持定力、坚持长期主义、不被短期诱惑带偏。

本章核心洞察

  1. 资本是双刃剑,保持控制权是关键。 融资不只是拿钱,更是选择同路人。宁可估值低一点,也要保持战略自主。

  2. 监管是约束也是机会。 积极合规的公司会在长期获得优势。在红线内创新是正道。

  3. 全球化需要本地化。 出海不是把国内产品翻译一下,而是真正理解当地用户的需求和文化。

  4. 差异化是创业公司的生存之道。 不做巨头的小号,找到自己的独特价值。

  5. 竞争对手是老师。 从别人的成功和失败中学习,保持谦逊和开放。

  6. "引领"而非"追随"的志向。 志向决定行动。敢于设定高目标的公司,更有可能实现突破。

  7. 坦诚建立信任。 无论对投资人、员工还是合作伙伴,坦诚沟通是长期关系的基础。

  8. 速度与耐心的平衡。 战术上快,战略上慢。这是在不确定环境中生存的艺术。


【本章完】


请输入"继续"以开始第十章:组织文化与领导力演化

第十章:组织文化与领导力演化

一、文化是公司的隐形操作系统

如果把公司比作一台电脑,战略是应用程序,资源是硬件,那么文化就是操作系统。

操作系统决定了硬件如何运转,应用程序如何执行。一个优秀的操作系统可以让普通硬件发挥超常性能,而一个糟糕的操作系统会让顶级硬件形同废铁。

公司文化同理。

两家公司可能有相似的战略、相近的资源,但因为文化不同,最终走向完全不同的命运。文化决定了:

  • 员工如何做决策
  • 团队如何协作
  • 冲突如何解决
  • 创新如何发生
  • 失败如何被对待

这些"软性"因素往往比"硬性"的战略和资源更重要。战略可以调整,资源可以补充,但文化一旦形成就很难改变。

闫俊杰从创业第一天起就意识到这一点。他把塑造文化视为创始人最重要的职责之一。

"技术可以迭代,产品可以优化,但文化是公司的DNA。DNA出了问题,什么都会出问题。"

二、文化基因的早期植入

Minimax的文化基因在创业早期就被植入,并在此后的发展中不断强化。

基因一:技术信仰

Minimax的第一个文化基因是对技术的信仰。

这不是一句空洞的口号,而是渗透到公司每一个角落的真实信念:

  • 招聘标准:技术能力是第一位的,其他条件都可以妥协,技术不行不能入职
  • 资源分配:研发投入始终占据最大比例,即使在资金紧张时也不妥协
  • 决策依据:技术可行性是重要的决策因素,不做技术上做不到的承诺
  • 晋升通道:技术专家有清晰的职业发展路径,不必走管理岗才能升职

这种技术信仰来自创始团队的背景。闫俊杰本人是技术出身,核心团队大多是技术背景,他们发自内心地相信技术的力量。

但技术信仰不等于"技术傲慢"。Minimax的技术文化有一个重要的特点:技术服务于用户价值,而非技术本身。

团队不会为了炫技而炫技,不会为了追求论文发表而忽视实际应用。每一项技术投入都要回答一个问题:这对用户有什么价值?

这种"务实的技术信仰"区别于很多技术驱动公司的"象牙塔心态"。

基因二:用户至上

Minimax的第二个文化基因是用户至上。

这听起来是老生常谈,几乎每家公司都会说"以用户为中心"。但真正做到的公司并不多。

Minimax是怎么做的?

用户反馈的直通车

公司建立了多种渠道收集用户反馈——产品内反馈入口、社交媒体监控、用户访谈、数据分析……这些反馈不是存档了事,而是每天都有人整理、分析、跟进。

"用户故事会"

每周的全员会议上,会分享真实用户的故事——他们是谁,为什么使用产品,产品给他们带来了什么。这些故事让团队记住:自己做的不只是代码和功能,而是在影响真实的人。

快速响应机制

用户反馈的问题,会被快速分类和响应。严重问题24小时内必须有进展,普通问题一周内必须回复。这种响应速度让用户感受到被重视。

产品经理的实地体验

产品经理被要求定期"潜伏"在用户社区中,像普通用户一样使用产品,感受真实的体验。不是看数据报告,而是亲身体验。

闫俊杰自己也保持着与用户的直接联系。他会不定期地阅读用户反馈,甚至亲自回复一些用户的问题。

"用户是我们存在的理由。如果我们不了解用户,我们就是在闭门造车。"

基因三:长期主义

第三个文化基因是长期主义。

这个基因的形成与闫俊杰的个人经历密切相关。他在商汤见过太多为了短期业绩而牺牲长期发展的案例,深知短期主义的危害。

长期主义在Minimax体现为几个具体原则:

不追热点

市场上经常出现各种"风口"——元宇宙、Web3、某个爆火的应用模式……很多公司会跟风追逐,希望蹭上热度。

Minimax的态度是:除非与公司的长期战略一致,否则不追热点。热点来得快去得也快,追热点只会让公司失去焦点。

不做一次性的事

每一项工作,都要考虑是否可以复用、是否可以积累。如果只是为了应付眼前的需求,做完就扔,那就是在浪费资源。

比如,与其为每个客户做定制开发,不如把需求抽象化,开发可复用的模块。短期内可能更慢,但长期会更高效。

投资于人

员工培养是长期投资。Minimax愿意花时间和资源培养员工,而不是只想着榨取短期价值。

这种投资包括:完善的入职培训、持续的技能提升机会、清晰的职业发展路径、有竞争力的薪酬和激励。

容忍失败

长期主义意味着接受短期失败。创新必然伴随失败,如果对失败零容忍,就没有人敢尝试新东西。

Minimax的原则是:鼓励有意义的尝试,即使失败也不惩罚。关键是从失败中学到东西,不要犯同样的错误。

基因四:坦诚直接

第四个文化基因是坦诚直接的沟通方式。

很多公司存在"报喜不报忧"的文化——下级不敢向上级汇报问题,同事之间不敢直接提出批评。这种文化会导致问题被掩盖,直到无法收拾时才爆发。

Minimax从一开始就培养坦诚文化:

鼓励直言

在会议上,任何人都可以直接表达不同意见,包括对创始人的决策提出质疑。这种直言不会被视为"不尊重",而是被视为"负责任"。

快速反馈

有问题及时说,不要积累。小问题及时解决,就不会变成大问题。

对事不对人

批评是针对事情本身,而不是针对人。讨论问题时可以激烈争论,但会议结束后不影响人际关系。

领导以身作则

闫俊杰自己会主动承认错误,分享自己的失误和反思。这种示范让团队知道:承认错误不丢人,逃避问题才丢人。

坦诚文化的建立不是一蹴而就的,需要持续的强化和维护。每当有人因为坦诚发言而受到打压,文化就会倒退一步。只有让坦诚得到正向激励,文化才能真正扎根。

基因五:高效务实

第五个文化基因是高效务实的工作风格。

Minimax反对形式主义和官僚作风:

会议精简

能不开会就不开会,必须开的会控制时长。会议必须有明确的目的和产出,不开"为了开会而开会"的会。

流程轻量

流程是为了提高效率,而不是为了控制。如果某个流程增加了官僚成本却没有带来价值,就取消它。

结果导向

评估工作不看加班时长,不看会议出席率,只看实际产出。聪明高效地完成工作比苦熬时间更值得鼓励。

快速决策

能今天决定的事不拖到明天。不追求完美的信息才决策,而是在有足够信息时快速行动。

减少汇报层级

信息传递层级越多,失真越严重,速度越慢。Minimax尽可能减少汇报层级,让信息高效流动。

这种高效务实的风格与创业公司的本质需求一致:资源有限,必须把每一分钱、每一分钟都用在刀刃上。

三、文化的演进与挑战

文化不是静止的,而是随着公司发展不断演进。

Minimax从十几个人成长到数百人,文化也经历了多个阶段的变化。

早期(2021-2022):技术极客文化

创业之初,团队以技术极客为主。文化特点是:

  • 对技术的狂热追求
  • "用代码说话"的沟通方式
  • 扁平化到几乎没有层级
  • 高度自组织,每个人自主安排工作
  • 工作与生活界限模糊,经常熬夜攻关

这种文化在早期非常有效。小团队、高信任、共同目标,让大家可以用最直接的方式协作。

但这种文化也有局限性:

  • 对非技术角色不够友好
  • 缺乏正式的流程和规范
  • 依赖个人英雄,而非系统能力
  • 长期熬夜不可持续

成长期(2023-2024):产品导向文化

随着业务发展,团队扩大,文化开始转型。

产品导向文化的特点是:

  • 从"技术驱动"转向"用户驱动"
  • 引入更多产品、运营、市场背景的人才
  • 建立必要的流程和规范
  • 强调跨部门协作
  • 关注用户反馈和市场表现

这个阶段的挑战是:如何在规模化的同时保持创新活力?

很多公司在成长过程中会逐渐变得官僚化:流程越来越多,会议越来越长,决策越来越慢。原本的创业精神被稀释,变成一家"正常"但"平庸"的公司。

Minimax的应对策略是:在制度化的同时保留灵活性。

具体做法包括:

  • 建立必要的流程,但流程保持最小化
  • 保留"快速通道",对紧急重要的事项可以突破常规流程
  • 鼓励"内部创业",给小团队足够的自主权
  • 定期清理不必要的规章制度

成熟期(2025-):长期主义文化

进入2025年,Minimax的文化进入新阶段。

这个阶段的核心是:将长期主义从口号变成日常实践。

具体表现包括:

  • 更加强调持续创新,而非短期变现
  • 投入更多资源于基础研究和人才培养
  • 对失败有更大的容忍度,鼓励有意义的尝试
  • 关注可持续发展,包括员工福祉和工作生活平衡
  • 加强知识管理和能力传承,减少对个人的依赖

这个阶段的挑战是:如何在保持长期视野的同时回应短期压力?

投资人、市场、竞争对手都在施加短期压力。如何在这些压力下坚持长期主义,需要领导力的持续引导和文化的持续强化。

四、领导力的自我约束

创始人的领导力对公司文化有决定性影响。闫俊杰如何定义和实践自己的领导力?

从"技术最优"到"综合最优"

作为技术背景出身的创始人,闫俊杰最初的决策思维是"技术最优"——什么技术方案最先进、最优雅,就选什么。

但随着公司发展,他意识到:技术最优不等于综合最优。

一个决策需要综合考虑多个因素:

  • 技术可行性
  • 商业价值
  • 用户体验
  • 团队能力
  • 资源约束
  • 时间窗口
  • 风险控制

最优雅的技术方案可能开发时间太长,可能超出团队能力,可能市场已经不需要了。

闫俊杰学会了在这些因素之间寻找平衡:

"最好的决策不是某个维度的最优,而是综合考虑后的最优。有时候需要牺牲技术优雅性来换取开发速度,有时候需要接受商业上的妥协来保持技术领先。关键是清楚每个决策的取舍是什么。"

风险观的演进

对风险的看法也随着公司发展而改变。

早期:激进冒险

创业初期,闫俊杰的风险观是激进的:

  • 选择MoE这样的前沿架构,即使工程风险很高
  • 同时推进多条产品线,即使资源捉襟见肘
  • 进入海外市场,即使团队没有国际化经验

这种激进是必要的。创业公司本来就是高风险赌注,如果过于保守,就会错失机会。

中期:选择性冒险

随着公司规模扩大,闫俊杰的风险观变得更加精细:

  • 在核心技术上继续冒险,这是公司的生命线
  • 在成熟业务上控制风险,确保现金流稳定
  • 新业务采用"小步快跑"策略,验证可行再放大投入

当前:系统性风险管理

进入成熟期后,风险管理变得更加系统:

  • 建立风险识别和预警机制
  • 对不同类型的风险(技术、市场、财务、合规)有不同的应对策略
  • 关注"尾部风险"——概率低但影响大的事件
  • 在组织层面培养风险意识,不只是创始人一个人操心

时间观的变化

创始人的时间分配反映了领导力的重点。闫俊杰的时间分配经历了几个阶段的变化:

早期:全身投入执行

创业初期,闫俊杰几乎把全部时间用于具体执行:写代码、调模型、做产品决策、见投资人……事无巨细,亲力亲为。

这在早期是必要的——团队小,每个人都要顶几个人用。

中期:逐渐转向管理

随着团队扩大,他的时间开始更多用于管理:招聘、开会、协调、决策……

这是一个艰难的转变。对于技术出身的创始人来说,"管人"远不如"写代码"有成就感。但这是必须的——如果创始人不放手执行细节,团队就无法成长。

当前:聚焦战略和文化

进入成熟期后,他的时间更多用于:

  • 战略思考:长期方向在哪里?如何应对竞争和变化?
  • 文化塑造:公司应该是什么样子?如何让正确的价值观落地?
  • 关键人才:核心团队的组建、激励和保留
  • 重大决策:只参与那些真正需要创始人拍板的决策
  • 外部关系:投资人、合作伙伴、行业生态

这种时间分配让他能够在更高的层次上发挥作用,而不是陷在日常事务中。

自我约束的机制

权力带来腐蚀的风险。创始人如何避免成为"昏君"?

闫俊杰有几个自我约束的机制:

机制一:建立反馈渠道

主动征求团队的反馈,包括对自己决策的批评。

这不容易——当你是老板时,很少有人敢直接说你不对。所以需要刻意建立渠道:

  • 匿名反馈工具,让员工可以放心表达
  • 定期的"逆向述职",让团队评价领导
  • 与信任的核心成员建立坦诚的沟通关系

机制二:保持学习状态

持续阅读、学习、与外部人士交流。

避免陷入"信息茧房"——只听到自己想听的声音。

外部视角可以提供不同的观点,帮助识别自己的盲区。

机制三:授权与放手

刻意地把决策权下放,即使自己可能做得更好。

培养团队的决策能力比自己做出完美决策更重要。

接受团队会犯错——犯错是学习的代价。

机制四:承认不知道

不懂装懂是领导者最大的陷阱。

闫俊杰愿意承认自己不知道的事情,并向更专业的人请教。这种谦逊反而增加了团队的信任。

机制五:定期反思

养成定期反思的习惯:

  • 每周回顾:这周做了什么决策?效果如何?
  • 每月复盘:哪些事情做对了?哪些需要调整?
  • 每年总结:这一年的成长在哪里?盲区在哪里?

这种反思帮助保持自我觉察,避免陷入惯性思维。

五、组织管理的科学方法

Minimax的管理风格有一个显著特点:数据驱动

作为AI公司,团队对"用数据说话"有天然的亲和力。这种思维被延伸到组织管理中。

数据驱动的绩效评估

传统的绩效评估往往主观性很强——领导对谁印象好,谁就评分高。这种评估容易导致政治化和不公平。

Minimax的做法是尽可能用数据说话:

  • 为每个岗位定义清晰的、可量化的绩效指标
  • 定期追踪这些指标的完成情况
  • 绩效评估时,数据是最重要的参考依据
  • 当然,也考虑数据无法衡量的因素,但要明确说明

这种方法减少了主观偏见,让评估更加公平透明。

人才选择的"整体输出"标准

招聘时,Minimax有一个独特的标准:选择能提升团队整体输出的人,而非个人能力最强的人。

这意味着:

  • 不只看个人技能,更看协作能力
  • 不只看履历光鲜,更看文化契合
  • 不只看面试表现,更看实际项目中的协作情况

有时候,一个"A级"选手可能降低团队整体产出——他可能太ego、不愿意配合、占用过多资源。这种人即使个人能力再强,也不是好选择。

反之,一个"B+级"选手如果能让周围的人都变得更好,那就是极好的选择。

这种"乘数效应"的思维改变了招聘的视角:不是在凑一群明星,而是在组建一个有化学反应的团队。

轻量化组织的坚持

随着公司规模扩大,组织臃肿的风险始终存在。

Minimax的应对是:刻意保持轻量化

具体做法包括:

  • 控制管理层级:尽可能保持扁平,不超过三到四个层级
  • 控制会议数量:每增加一个固定会议,必须取消一个现有会议
  • 控制流程复杂度:定期审视现有流程,删除不必要的步骤
  • 控制团队规模:宁可少招一个人,也不养冗员

这种轻量化在资源充裕时尤其难以坚持——"反正有钱,多招几个人怎么了?"但正是这种时候最需要自律。

闫俊杰在内部强调:

"组织的复杂度是隐形的成本。你看不到它,但它每天都在消耗资源、降低效率。我们必须像对待技术债务一样对待组织债务——定期清理,不让它积累。"

知识管理与能力传承

创业公司经常面临一个问题:关键知识存在于个人的脑子里,一旦这个人离开,知识就丢失了。

Minimax的应对是建立系统的知识管理机制:

  • 文档化:重要的决策、技术方案、项目经验都要写成文档
  • 知识库:建立公司内部的知识库,方便搜索和检索
  • 分享机制:定期的技术分享、经验交流会议
  • 交叉培训:关键岗位有backup人员,避免单点依赖
  • 离职交接:规范的离职交接流程,确保知识不会随人走

这些机制让组织的能力不再依赖于特定个人,而是沉淀在系统中。

六、文化的护城河

在激烈的人才竞争中,文化本身可以成为护城河。

吸引合适的人

Minimax的文化吸引的是特定类型的人才:

  • 真正热爱技术、想做有意义事情的人
  • 喜欢坦诚直接、不喜欢办公室政治的人
  • 看重长期成长、不只看短期待遇的人
  • 愿意承担风险、不甘于平庸的人

这些人在大公司可能很难找到归属感。Minimax提供了一个让他们如鱼得水的环境。

筛选不合适的人

同样的文化也会筛选掉不合适的人:

  • 只想混日子拿高薪的人
  • 喜欢搞政治、拉帮结派的人
  • 无法接受直接批评的人
  • 只看短期利益的人

这种"自我筛选"让团队保持了较高的一致性。

留住核心人才

在人才流动频繁的行业,如何留住核心人才是永恒的挑战。

Minimax的留人策略不只是高薪高期权,更是:

  • 有意义的工作:让人才感受到自己在做真正重要的事情
  • 成长空间:持续的学习和发展机会
  • 尊重和信任:被当作成年人对待,有足够的自主权
  • 良好的团队氛围:与优秀的同事共事的乐趣
  • 长期回报:期权和股权让长期付出有长期回报

这些因素加在一起,形成了单纯靠加薪无法复制的吸引力。

七、领导力的持续修炼

领导力不是一成不变的,而是需要持续修炼。

从"做事"到"做人"

早期的领导力更多是"做事"——解决问题、推进项目、达成目标。

成熟期的领导力更多是"做人"——激励人、培养人、留住人。

这个转变对技术背景的创始人尤其困难。"做事"是可以量化的、可以优化的、可以控制的。"做人"则充满模糊性和不确定性。

闫俊杰的方法是:像对待技术问题一样对待领导力问题。

观察、实验、反馈、迭代——这套方法论不只适用于产品开发,也适用于领导力提升。

从"正确"到"有效"

年轻时的领导力追求"正确"——做正确的决策、坚持正确的原则。

成熟后的领导力追求"有效"——让团队真正理解和执行,让目标真正实现。

一个决策可能是"正确"的,但如果团队不理解、不接受,执行得一塌糊涂,那就是无效的。

有效的领导力不只是做出正确决策,还包括:

  • 清晰地传达决策的逻辑
  • 耐心地回应团队的疑虑
  • 灵活地调整执行方式
  • 持续地跟进和反馈

从"个人"到"系统"

最终的领导力升级是从"个人依赖"到"系统运转"。

早期公司的成功高度依赖创始人个人——他的判断力、他的人脉、他的激励能力。

成熟公司的成功应该依赖于系统——流程、文化、制度、梯队……即使创始人不在,公司也能正常运转。

闫俊杰在这方面的努力包括:

  • 培养核心管理团队,分担领导责任
  • 建立制度化的决策流程,减少对个人判断的依赖
  • 强化文化建设,让价值观内化于团队
  • 推进知识管理,让能力沉淀在组织中

这是一个漫长的过程,也是每个创始人必须面对的修炼。

本章核心洞察

  1. 文化是公司的隐形操作系统。 战略可以调整,资源可以补充,但文化一旦形成就很难改变。创始人从第一天起就应该有意识地塑造文化。

  2. 技术信仰+用户至上是Minimax文化的核心。 相信技术的力量,但技术必须服务于用户价值。这种"务实的技术信仰"是区别于其他技术公司的关键。

  3. 长期主义需要持续的强化。 短期压力无处不在,只有持续强调和实践,长期主义才能真正落地。

  4. 坦诚文化需要领导以身作则。 如果领导不敢承认错误、不愿接受批评,坦诚文化就只是空话。

  5. 轻量化组织需要刻意维护。 组织臃肿的趋势是自然的,保持轻量化需要持续的自律和清理。

  6. 领导力是持续修炼的过程。 从"做事"到"做人",从"正确"到"有效",从"个人"到"系统"——领导力需要随着公司发展不断升级。

  7. 数据驱动不只适用于产品,也适用于管理。 用数据说话减少主观偏见,让管理更加公平和高效。

  8. 文化是护城河。 优秀的文化可以吸引合适的人才、筛选不合适的人才、留住核心人才。这是单纯靠薪酬无法复制的竞争力。


【第三编完】


请输入"继续"以开始第四编第十一章:认知结构的升级迭代

第四编:创始人的内在成长


第十一章:认知结构的升级迭代

一、认知是创始人的核心资产

在创业的长跑中,最终决定胜负的不是资金、不是技术、甚至不是团队,而是创始人的认知能力。

资金可以融,技术可以招人来做,团队可以慢慢搭建。但创始人的认知如果跟不上公司发展的速度,一切都会崩塌。

认知决定了:

  • 你能看到什么机会
  • 你会做出什么决策
  • 你如何理解竞争格局
  • 你怎样领导一个组织
  • 你面对困难时如何反应

同样一个市场变化,认知不同的人会看到完全不同的东西。有人看到威胁,有人看到机会;有人恐慌,有人兴奋;有人收缩防守,有人大胆进攻。

闫俊杰的创业历程,也是一部认知不断升级的历史。从商汤的技术专家,到Minimax的创始人,他的认知结构经历了多次根本性的跃迁。

理解这些跃迁,对于任何希望成长的创业者都有借鉴价值。

二、从工程师到企业家的认知跃迁

第一重跃迁:从"技术性能"到"用户价值"

在学术界和技术公司,评价一个模型好不好的标准很清晰:跑分。

在各种benchmark上刷出更高的分数,发表更多的论文,获得学术共同体的认可——这是技术人员根深蒂固的成功标准。

闫俊杰最初也是这样思考的。他的博士研究、商汤的工作,都是在这个框架下进行的。

但创业之后,他逐渐意识到一个残酷的事实:跑分高不等于产品好,论文多不等于用户满意。

一个在ImageNet上达到SOTA的模型,放到真实场景中可能完全不可用。一个在学术论文中效果惊艳的算法,部署到手机上可能慢得无法忍受。

更重要的是:用户不关心你的技术指标,只关心产品能否解决他们的问题。

用户不会问:"你的模型有多少参数?在哪个benchmark上排名第几?"

用户只会问:"这个东西好用吗?能帮我做什么?"

这个认知转变听起来简单,实践起来却非常困难。

对于技术出身的创始人来说,放弃"技术性能"的评价标准就像放弃母语一样痛苦。你必须学会一种全新的语言——用户语言。

闫俊杰的转变体现在一个具体指标的选择上:错误率

"当前大模型的错误率大概在20-30%左右。这意味着每三到五次使用,就可能有一次出错。我们的目标是把错误率降低一个数量级。"

这个指标的选择本身就是认知跃迁的体现:

  • 不是追求"论文上的SOTA分数",而是关注"用户体验中的错误频率"
  • 不是比谁的模型更大更强,而是比谁的产品更可靠更可用
  • 不是面向学术共同体,而是面向真实用户

第二重跃迁:从"技术价值"到"商业价值"

技术人员往往有一个隐含假设:只要技术足够好,商业价值自然会到来。

这个假设在某些情况下是对的,但在更多情况下是错的。

商业价值的创造需要一系列技术之外的能力:

  • 找到愿意付费的用户
  • 设计合理的定价策略
  • 建立有效的销售渠道
  • 控制获客成本和运营成本
  • 构建可持续的商业模式

很多技术优秀的公司最终失败了,不是因为技术不行,而是因为没有找到商业化的路径。

闫俊杰在商汤的经历让他对这一点有了深刻认识。商汤技术实力毋庸置疑,但商业化始终是挑战。高估值背后是持续亏损,上市后股价长期低迷。

这段经历教会他:技术是必要条件,不是充分条件。

在Minimax,这种认知体现在"技术与产品并重"的战略选择上:

  • 不只是做模型,还要做产品
  • 不只是追求技术领先,还要追求商业化落地
  • 不只是服务技术社区,还要服务真实用户

Talkie的成功是这种认知的最佳注脚。它不是技术最先进的产品,但它是商业化最成功的产品之一。原因在于:团队真正理解了用户需求,找到了用户愿意付费的场景,建立了可持续的商业模式。

第三重跃迁:从"个人英雄"到"系统能力"

技术专家的成功往往依赖于个人能力:你的算法水平、你的代码质量、你的论文产出。

但企业家的成功必须依赖于组织能力:团队的整体产出、系统的稳定运转、文化的持续传承。

这是一个根本性的视角转换。

作为技术专家,你的目标是让自己变得更强。

作为企业家,你的目标是让团队变得更强。

有时候,这两个目标是矛盾的。如果你事事亲力亲为,做出完美的技术决策,团队就没有机会成长。如果你不放手,就永远培养不出能够独当一面的人才。

闫俊杰的这个跃迁体现在几个方面:

人才选择标准的变化

从"选择最强的个人"变为"选择能提升团队整体输出的人"。

一个技术能力稍弱但能让周围人变得更好的人,比一个技术能力超强但让周围人变得更差的人更值得招聘。

时间分配的变化

从把时间花在具体的技术工作上,变为把时间花在"让团队能够做好技术工作"上。

招聘、培训、激励、协调、文化建设——这些"间接"的工作比"直接"的技术工作更重要。

成就感来源的变化

从"我做出了一个牛逼的模型"变为"我的团队做出了一系列牛逼的产品"。

个人英雄的成就感来自于自己的产出。组织领导者的成就感来自于团队的产出。

第四重跃迁:从"单点突破"到"生态布局"

技术专家往往专注于单点问题:解决一个算法难题、优化一个系统瓶颈、攻克一个技术难关。

企业家必须思考生态问题:技术、产品、市场、组织、资本……如何形成相互支撑的体系?

这需要一种全局思维,能够看到各个部分之间的联系和相互作用。

闫俊杰的生态思维体现在Minimax的战略布局上:

  • 模型能力是基础,但必须转化为产品价值
  • C端产品获取用户数据,数据反哺模型优化
  • 海外市场分散风险,也为技术提供多元验证
  • 开发者生态扩大影响力,也为商业化创造渠道

这些元素不是孤立的,而是相互关联、相互促进的。

单点思维会问:"如何让模型更强?"

生态思维会问:"如何让模型、产品、用户、开发者形成正向循环?"

三、关键认知转折点

认知的升级不是线性的、渐进的,而是有一些"顿悟时刻"——某个事件或认识突然打开了新的视角。

回顾闫俊杰的创业历程,可以识别出几个关键的认知转折点。

转折点一:2021年——"技术先进性不等于商业成功"

2021年,当闫俊杰决定离开商汤创业时,他已经在这家公司工作了七年。

这七年,他见证了商汤从一个小型创业公司成长为"AI四小龙"之首,估值达到数百亿美元。但他也见证了商汤在商业化上的持续挣扎。

商汤的技术无疑是先进的。它拥有顶尖的研究团队,发表了大量顶级论文,在各种竞赛中屡获佳绩。但这些技术优势并没有转化为持续的盈利能力。

2021年商汤上市后,股价很快跌破发行价。市场用脚投票告诉所有人:光有技术是不够的。

这段经历让闫俊杰形成了一个核心认知:

"技术先进性是竞争的必要条件,但远远不是充分条件。商业成功需要技术、产品、市场、运营的综合能力。"

这个认知直接影响了Minimax的创业方向:从一开始就强调"技术与产品并重",而不是先做技术再考虑产品。

转折点二:2023年——"开源与闭源的辩证关系"

2023年,开源大模型开始崛起。LLaMA、Mistral等模型的发布,让很多人开始质疑闭源模式的可持续性。

最初,闫俊杰对开源模式持谨慎态度。他的逻辑是:

  • 闭源可以保护技术优势
  • 闭源可以控制产品质量
  • 闭源可以支撑商业模式

但随着开源生态的发展,他开始调整认知:

开源和闭源不是非此即彼的选择,而是可以并存的策略。

开源的价值在于:

  • 建立开发者生态
  • 扩大品牌影响力
  • 获取社区的贡献和反馈

闭源的价值在于:

  • 保护核心技术优势
  • 支撑高端商业化
  • 控制产品质量和安全

更成熟的策略是:基础能力可以开源,差异化能力保持闭源;通用模型可以开放,垂直应用保持封闭。

这种认知的更新让Minimax在后来的竞争中更加灵活,不再固守单一的闭源立场。

转折点三:2025年——"长期主义不是不赚钱,而是不赚快钱"

2025年是Minimax面临最大压力的一年。DeepSeek的冲击、资本的质疑、内部的争论……所有这些都在考验闫俊杰的长期主义信念。

在这种压力下,他对长期主义有了更深的理解:

长期主义不是"现在不需要赚钱",而是"不为了短期利益牺牲长期价值"。

这个区分很重要。

有些人把长期主义理解为"不需要考虑商业化,专心做技术就好"。这是对长期主义的误解。如果公司无法生存,就没有长期可言。

真正的长期主义是:

  • 要赚钱,但不赚损害长期竞争力的钱
  • 要增长,但不追求不可持续的增长
  • 要回应市场,但不被短期波动牵着走
  • 要满足投资人期待,但不为了取悦投资人而牺牲战略

Talkie就是长期主义的典型案例。它在商业上是成功的,年收入达到7000万美元。但这个成功不是靠烧钱补贴换来的用户增长,而是靠真正满足用户需求、创造用户价值获得的。

这种"健康的商业化"才是长期主义的正确姿势。

四、认知升级的方法论

认知升级不是自然发生的,而是需要刻意的努力。闫俊杰有哪些升级认知的方法?

方法一:保持"学生心态"

很多成功的人会陷入"专家陷阱"——因为在某个领域是专家,就认为自己什么都懂。

闫俊杰刻意避免这种陷阱。他始终保持学习的状态:

  • 阅读大量的书籍和文章,不限于技术领域
  • 与不同背景的人交流,获取多元视角
  • 参加行业会议和活动,了解最新动态
  • 承认自己的无知,向更专业的人请教

这种"学生心态"让他能够持续吸收新知识、新观点,而不是固守已有的认知。

方法二:建立"反馈回路"

认知的升级需要反馈。如果你从不知道自己的判断是对是错,就无法改进。

闫俊杰建立了多重反馈机制:

  • 用户反馈:产品的用户数据是最直接的反馈,它告诉你用户真正需要什么
  • 市场反馈:竞争格局的变化告诉你行业在往哪个方向走
  • 团队反馈:核心团队的意见帮助你识别自己的盲区
  • 投资人反馈:投资人的问题和质疑逼迫你更严格地审视自己的假设
  • 自我复盘:定期反思自己的决策,评估效果,总结教训

方法三:接触"异见者"

最危险的认知陷阱是"信息茧房"——只接触支持自己观点的信息,只和同意自己的人交流。

闫俊杰刻意地接触不同意见:

  • 鼓励团队直接表达不同看法
  • 与持不同战略观点的同行交流
  • 阅读批评AI行业的文章和观点
  • 请教那些与自己专业背景完全不同的人

这些"异见者"可能不总是正确的,但他们提供了不同的视角,帮助你更全面地看问题。

方法四:从失败中提炼认知

成功可以增强信心,但失败才是真正的老师。

闫俊杰有一个习惯:每次重大失败后,都会进行系统的复盘:

  • 发生了什么?
  • 为什么会发生?
  • 我当时的判断是什么?
  • 为什么判断失误?
  • 如何避免类似失误?

这种复盘不是为了追责,而是为了学习。失败的价值在于它揭示了你认知的盲区。如果不认真反思,同样的错误会一再发生。

方法五:将认知外化为原则

认知升级的成果需要固化下来,否则容易随时间遗忘。

闫俊杰会把重要的认知总结为简洁的原则:

  • "技术服务于用户价值"
  • "长期主义不是不赚钱,而是不赚快钱"
  • "选择能提升团队整体输出的人"
  • "保持轻量化组织"

这些原则不是抽象的口号,而是指导日常决策的具体标准。当面临选择时,这些原则提供了快速判断的依据。

五、认知的边界与盲区

任何人的认知都有边界和盲区。承认这一点本身就是一种重要的认知。

闫俊杰可能的认知盲区包括:

技术乐观主义

作为技术背景出身的创始人,他可能倾向于高估技术解决问题的能力,低估非技术因素(政治、文化、社会)的影响。

大模型的发展不只是技术问题,还涉及监管政策、社会接受度、伦理争议等复杂因素。技术乐观主义可能导致对这些因素的低估。

创业者偏见

创业成功需要极强的信念。但这种信念有时会变成"执念"——即使事实已经证明某条路走不通,也不愿意调整。

闫俊杰对某些战略选择的坚持(如闭源策略、ToC优先)是否最终正确,需要时间来验证。保持开放的心态,愿意根据新证据调整判断,是克服这种偏见的关键。

幸存者偏差

成功的创业者容易陷入幸存者偏差——以为自己成功的方式就是普遍正确的方式,忽视了那些用同样方法但失败了的人。

Minimax的成功有多少是因为正确的战略和执行,有多少是因为运气和时机?这个问题没有确定的答案,但保持谦逊的态度是必要的。

如何应对认知盲区

承认盲区的存在是第一步。更重要的是建立机制来发现和弥补盲区:

  • 多元化团队:不同背景的团队成员可以提供不同视角
  • 外部顾问:独立的外部人士可以提供客观的评估
  • 数据驱动:用数据而非直觉来验证假设
  • 预设机制:在重大决策前,指定专人提出反对意见
  • 定期审视:定��回顾过去的判断,评估是否需要修正

六、认知护城河

在AI时代,技术更新极快,商业模式迅速迭代。什么是真正持久的竞争优势?

闫俊杰的答案是:认知护城河

技术可以被复制,产品可以被模仿,但一个组织的认知能力——快速学习、准确判断、高效决策的能力——是很难复制的。

Minimax的认知护城河体现在几个方面:

对技术趋势的判断能力

2021年选择MoE架构、坚持多模态布局——这些决策背后是对技术趋势的准确判断。

这种判断能力不是一两个人的天才,而是整个组织的能力:持续追踪前沿研究、快速评估新技术、果断做出战略选择。

对用户需求的洞察能力

Talkie的成功源于对用户情感需求的准确洞察。很多竞争对手还在做"效率工具",Minimax已经看到了"情感陪伴"的巨大市场。

这种洞察能力同样是组织的能力:深入用户的机制、快速迭代的文化、从数据中发现模式的方法论。

快速学习和调整的能力

DeepSeek冲击后的快速响应,展示了Minimax的学习能力:

  • 快速理解DeepSeek的技术路线
  • 准确评估对自身的影响
  • 迅速调整策略和资源配置

这种学习速度是竞争优势。在快速变化的市场中,谁学得更快,谁就能活得更久。

将认知转化为行动的能力

有正确的认知不等于能够执行。很多公司知道应该怎么做,但做不到。

Minimax的执行能力——将战略认知转化为产品、将产品转化为用户价值、将用户价值转化为商业回报——是认知护城河的关键组成部分。

本章核心洞察

  1. 认知是创始人的核心资产。 资金、技术、团队都可以获取,但认知决定了你如何使用这些资源。认知的差距最终会变成结果的差距。

  2. 从工程师到企业家需要多重认知跃迁。 从技术性能到用户价值、从技术价值到商业价值、从个人英雄到系统能力、从单点突破到生态布局——每一重跃迁都是根本性的视角转换。

  3. 关键认知往往在"顿悟时刻"形成。 某个事件或认识打开新的视角,带来认知的质变。这些时刻值得被识别和总结。

  4. 认知升级需要刻意的方法。 保持学生心态、建立反馈回路、接触异见者、从失败中学习、将认知外化为原则——这些方法可以帮助持续升级认知。

  5. 承认认知盲区是智慧的表现。 每个人都有盲区,建立机制来发现和弥补盲区比假装没有盲区更重要。

  6. 认知护城河是最持久的竞争优势。 技术可以被复制,但组织的认知能力——判断、洞察、学习、执行——很难被复制。


【本章完】


请输入"继续"以开始第十二章:失败、挫折与自我修正

第十二章:失败、挫折与自我修正

一、失败是创业的常态

在公开叙事中,成功的创业者往往被描绘成"一路开挂"的天才:每个决策都是正确的,每个困难都被轻松克服,每个机会都被精准抓住。

这种叙事是危险的。

它创造了一种幻觉:成功是线性的、可预测的、必然的。只要你足够聪明、足够努力,就一定能成功。

但真实的创业世界完全不是这样。

真实的创业充满了失败:战略判断失误、产品上线遇冷、关键人才流失、融资谈判破裂、竞争对手突袭……这些不是例外,而是常态。

成功的创业者不是不犯错的人,而是能够从错误中快速恢复、持续学习的人

闫俊杰也不例外。Minimax的发展历程中有高光时刻,也有至暗时刻。正视这些挫折,才能真正理解这家公司是如何走到今天的。

二、可披露的挫折:技术层面

由于Minimax是未上市公司,很多内部信息无法公开。但基于公开资料和行业通用经验,我们可以合理推断一些技术层面的挫折。

挫折一:早期模型训练的"灾难性遗忘"

大语言模型训练中有一个著名的问题:灾难性遗忘(Catastrophic Forgetting)。

当模型学习新知识时,可能会"忘记"之前学过的内容。这在持续训练和微调过程中尤其常见。

Minimax在早期的模型训练中,几乎必然遭遇过这个问题。

想象这样的场景:团队花了数周时间训练了一个模型,在中文任务上表现出色。然后,为了增强英文能力,用英文数据进行微调。结果发现:英文能力提升了,但中文能力大幅下降。

几周的努力,似乎白费了。

这种情况在早期创业团队中尤其痛苦——资源有限,每一次训练都是巨大的投入。当结果不如预期时,挫败感是真实的。

解决灾难性遗忘需要大量的技术探索:

  • 调整学习率和训练策略
  • 设计更好的数据混合比例
  • 引入正则化技术防止过度拟合
  • 采用持续学习的专门算法

这些解决方案不是一次就能找到的,需要反复试错。每一次失败的训练都是学费,换来的是对问题更深的理解。

挫折二:MoE架构的工程挑战

选择MoE架构是Minimax的一个大胆决定。但大胆的决定往往伴随着巨大的工程挑战。

MoE架构的问题不在于理论,而在于实现:

负载均衡问题

在理想情况下,每个专家应该被均匀地使用。但实际训练中,往往会出现"热门专家"和"冷门专家"——某些专家被过度使用,其他专家几乎闲置。

这导致模型的有效容量远低于理论容量。你有1万亿参数,但实际使用的可能只有10%。

解决这个问题需要设计复杂的负载均衡机制,而这些机制本身可能引入新的问题。

训练稳定性问题

MoE模型的训练比密集模型更不稳定。门控网络的梯度可能出现极端值,导致训练崩溃。

团队可能经历过这样的场景:训练进行到一半,loss突然飙升,模型完全失效。之前的计算全部白费,必须重新开始。

分布式通信问题

大规模MoE模型需要分布在多台机器上训练。不同专家位于不同的机器,每次计算都需要跨机器通信。

通信开销可能成为瓶颈,严重影响训练效率。优化这个问题需要深入理解分布式系统和网络拓扑。

这些工程挑战没有一劳永逸的解决方案,需要持续的优化和迭代。每一次遇到问题、解决问题,都是团队能力的积累。

挫折三:多模态融合的技术难关

多模态是Minimax的核心优势之一,但实现这个优势的过程充满挑战。

模态对齐问题

不同模态的数据表示方式完全不同。文本是离散的符号序列,图像是连续的像素矩阵,音频是时序的波形信号。

如何让模型理解这些不同模态之间的关系?如何让它知道一张狗的图片对应"狗"这个词?

这需要精心设计的对齐机制和大量的多模态配对数据。

数据获取问题

高质量的多模态数据非常稀缺。图文配对数据相对容易获取,但音频-文本、视频-文本的高质量配对数据要稀缺得多。

团队可能尝试过多种数据获取方式:爬取网络数据、购买商业数据、自己标注数据……每种方式都有各自的问题。

效果评估问题

多模态模型的效果如何评估?没有像ImageNet或GLUE那样成熟的benchmark。

团队可能需要自己设计评估标准,而这些标准是否真正反映了用户体验,本身就是一个问题。

三、可披露的挫折:产品层面

技术能力是基础,但技术不等于产品。将技术转化为用户喜爱的产品,是另一个充满挫折的过程。

挫折四:某款C端产品的市场反响不及预期

Minimax推出过多款C端产品:星野、海螺AI、Talkie……

并非每一款产品都像Talkie那样成功。基于公开信息和行业规律,可以合理推断:某些产品的市场反响是不及预期的。

这种情况在产品开发中非常常见:

团队认为自己理解了用户需求,花费大量资源开发产品。上线后发现:用户的反应很冷淡,数据远低于预期。

可能的原因包括:

  • 需求判断失误:团队以为用户需要A,但用户实际需要B
  • 产品形态问题:需求判断正确,但产品形态不对,用户不买账
  • 竞争环境变化:开发期间市场发生变化,原本的机会窗口关闭了
  • 执行问题:方向正确但执行不到位,产品体验有缺陷

面对这种情况,团队需要做出艰难的决定:

  • 是继续投入,相信产品最终会成功?
  • 还是果断止损,把资源投入到更有希望的方向?

这种决定没有标准答案,需要创始人的判断力。但无论如何选择,失败的沮丧是真实的。

挫折五:产品功能的用户接受度问题

即使是成功的产品,也会有失败的功能。

团队花费大量精力开发了一个新功能,认为用户一定会喜欢。上线后发现:使用率很低,用户根本不care。

这种情况可能发生过多次。

原因可能是:

  • 功能设计脱离用户真实需求:团队沉浸在技术能力中,做了技术上很酷但用户不需要的功能
  • 功能入口设计不合理:功能本身有价值,但用户找不到或不理解如何使用
  • 功能与核心体验不一致:功能破坏了产品的核心体验,用户反感而非喜欢

这些失败的功能是学习的机会。它们教会团队:

  • 不要假设用户需要什么,要真正去了解
  • 功能上线只是开始,需要持续观察和迭代
  • 有时候"少即是多",砍掉功能比增加功能更重要

挫折六:国内市场的增长困境

Talkie在海外市场取得了亮眼成绩,但国内市场的情况可能没那么乐观。

国内市场面临独特的挑战:

  • 监管限制:AI应用需要备案,内容需要审核,某些功能无法上线
  • 竞争激烈:字节、腾讯、百度等巨头都在这个市场,流量和资源优势明显
  • 用户习惯:国内用户对AI产品的付费意愿相对较低

这些因素导致国内产品的增长可能低于预期。

团队可能尝试过多种策略:

  • 调整产品功能以适应监管要求
  • 与平台合作获取流量
  • 探索不同的变现模式

但结果可能参差不齐,需要持续的探索和调整。

四、可披露的挫折:组织与管理层面

创业不只是技术和产品的挑战,也是组织和人的挑战。

挫折七:核心团队成员的离开

在Minimax的发展过程中,几乎必然经历过核心成员的离开。

这种离开可能有多种原因:

  • 更好的机会:被巨头或其他创业公司高薪挖走
  • 理念分歧:对公司方向有不同看法,无法达成共识
  • 个人原因:家庭、健康或其他个人因素
  • 创业冲动:想要自己创业,追求更大的舞台

无论原因是什么,核心成员的离开对公司都是冲击:

  • 知识流失:这个人掌握的关键知识可能没有被传承
  • 士气影响:团队其他成员可能受到影响,产生动摇
  • 工作中断:离开者负责的工作需要交接和重新安排

更深层的影响是情感上的。创始人与早期核心成员之间往往有深厚的信任和感情。当这些人离开时,失落感是真实的。

闫俊杰如何应对这种情况?

基于他的价值观和领导风格,可以推断几点:

  • 尊重个人选择:不强留,理解每个人有自己的路要走
  • 做好交接:确保知识和工作得到传承
  • 保持关系:即使离开,也保持良好的个人关系
  • 反思原因:思考是否有公司自身的问题导致了离开
  • 加强梯队:更加重视人才梯队建设,减少单点依赖

挫折八:组织扩张中的管理失误

从十几人扩张到数百人的过程中,管理失误几乎是不可避免的。

可能的失误包括:

招聘失误

招了不合适的人,浪费了时间和资源,还可能对团队造成负面影响。

有些人面试时表现很好,但实际工作中完全不同。有些人技术能力强,但无法融入团队文化。

识别和处理这些问题需要时间和精力。

晋升失误

提拔了不合适的人担任管理岗位,导致团队效能下降。

优秀的技术专家不一定是好的管理者。把技术高手提拔为经理,可能既失去了一个好工程师,又得到了一个差经理。

组织设计失误

组织结构不合理,导致协作困难、决策缓慢。

部门之间职责不清、接口不畅,各自为政。简单的事情需要协调多个部门,效率低下。

文化稀释

随着人员扩张,早期的文化被稀释。新员工带来的习惯和预期与原有文化产生冲突。

坦诚直接的氛围变得微妙复杂,高效务实的风格变得繁文缛节。

这些管理失误不是因为创始人不够聪明,而是因为管理本身就是复杂的。没有人能在第一次就做对所有事情。

关键是:能否快速识别问题、承认错误、做出调整?

挫折九:融资过程中的估值分歧

融资是创业公司的生命线,但融资过程充满了博弈和挫折。

在Minimax的融资历史中,几乎必然经历过估值分歧:

  • 公司认为自己值X亿美元,投资人只愿意给0.7X
  • 某个投资人给了心仪的估值,但条款不可接受
  • 谈判进行到最后阶段,投资人突然改变主意

这些情况都会造成挫败感。融资是漫长的过程,每一次失败的谈判都消耗时间和精力。更重要的是,融资失败可能危及公司生存。

闫俊杰的融资原则在这些挫折中得到了检验:

  • 不为估值牺牲条款:宁可估值低一点,也要保持控制权
  • 选择合适的投资人:不只看钱,也看理念是否契合
  • 保持多个选择:不把鸡蛋放在一个篮子里
  • 坚持长期主义:不为短期融资压力改变战略

这些原则让Minimax在融资中保持了主动权,但执行这些原则的过程充满了取舍和煎熬。

五、自我修正机制

面对挫折,真正重要的是:如何从挫折中学习、修正、成长?

Minimax建立了一套自我修正机制,帮助公司持续进化。

机制一:数据驱动的复盘

"采用数据科学快速识别有效路径"——这是Minimax的核心原则之一。

这个原则不只适用于技术开发,也适用于错误识别和修正。

具体做法包括:

项目复盘

每个重要项目结束后,都会进行系统的复盘:

  • 目标是什么?达成了吗?
  • 哪些做法是有效的?
  • 哪些做法是无效的?
  • 如果重新做一次,会有什么不同?

复盘的结果会被记录下来,成为组织的学习资产。

数据监控

关键指标被持续监控。当数据出现异常时,会触发分析和响应:

  • 为什么这个指标下降了?
  • 是暂时波动还是趋势变化?
  • 需要采取什么行动?

A/B测试

重大变更通过A/B测试来验证,而不是凭直觉决定。

测试结果提供了客观的反馈,帮助识别什么有效、什么无效。

机制二:外部视角的引入

内部视角有其局限性。团队可能陷入"群体思维",看不到自己的问题。

Minimax通过多种方式引入外部视角:

投资人视角

投资人不参与日常运营,但对公司有深入了解。他们的问题和质疑往往能揭示内部看不到的问题。

闫俊杰与投资人保持定期沟通,认真对待他们的反馈。

顾问视角

聘请行业专家担任顾问,提供独立的观点和建议。

这些顾问可能是技术专家、商业专家或管理专家,他们从各自的专业角度提供反馈。

用户视角

用户是最真实的外部视角。他们不关心公司的内部逻辑,只关心产品好不好用。

通过用户访谈、社区互动、数据分析,持续获取用户反馈。

竞争对手视角

研究竞争对手的做法,思考他们为什么做那些选择。

有时候,竞争对手的成功可以揭示自己的盲区。

机制三:组织层面的持续创新

"通过组织调整克服能力边界"——这是闫俊杰处理组织问题的方式。

当现有组织结构无法支撑战略执行时,需要进行调整:

结构调整

根据业务需要调整部门设置和汇报关系。

比如,当多模态成为战略重点时,可能需要成立专门的多模态团队,赋予足够的资源和权限。

流程优化

识别低效的流程,进行简化或重新设计。

定期审视现有流程,问:"这个流程真的必要吗?能不能更简单?"

人员调整

根据业务需要调整人员配置。

有些岗位需要增加,有些岗位需要调整,有些岗位可能需要取消。

这些调整往往是痛苦的,因为涉及到人。但如果不做调整,组织就会僵化。

机制四:领导者的自我反思

最重要的自我修正机制是创始人自己的反思习惯。

闫俊杰保持着定期反思的习惯:

每周反思

这周做了什么重要决策?决策的逻辑是什么?结果如何?

每月复盘

这个月的关键目标达成了吗?遇到了什么问题?如何解决的?

每年总结

这一年的成长在哪里?有什么重大的认知升级?还有什么盲区?

这种反思不是形式主义的自我检讨,而是真正的思考和学习。

六、从挫折中提炼的原则

每一次挫折都是学费,关键是能从中学到什么。

基于Minimax的经历,可以提炼出几条重要的原则:

原则一:"错误率是AI产品的生命线"

这个认知来自于无数次用户投诉和数据分析的教训。

早期可能过于关注模型的"能力上限"——模型能做什么?表现最好的时候有多强?

但用户体验的决定因素是"能力下限"——模型最差的时候有多差?犯错的频率有多高?

一个偶尔表现惊艳但经常犯错的模型,不如一个表现稳定但不那么惊艳的模型。

这个原则指导了后来的技术优先级:降低错误率比提升峰值性能更重要。

原则二:"用户共创不是口号,是生存方式"

这个认知来自于多次产品失败的教训。

早期可能过于自信,认为自己理解用户需求。结果发现:很多假设是错的。

唯一了解用户需求的方式是:让用户参与进来。

  • 在产品规划阶段就征求用户意见
  • 在开发过程中持续收集用户反馈
  • 在上线后密切关注用户行为数据
  • 把用户当作合作伙伴,而非被动的消费者

这种"用户共创"不是营销噱头,而是产品成功的必要条件。

原则三:"技术深度是护城河,但产品化是桥梁"

这个认知来自于技术能力与商业成功之间差距的反思。

Minimax在技术上一直保持领先,但技术领先不自动转化为商业成功。需要产品化这座桥梁。

产品化意味着:

  • 把技术能力转化为用户可以理解和使用的功能
  • 把复杂的系统封装成简洁的体验
  • 把技术价值翻译成用户价值

这座桥梁的建设需要产品能力、设计能力、运营能力——这些与技术能力同等重要。

原则四:"快速失败,快速学习"

这个认知来自于漫长而昂贵的失败经历的反思。

早期可能追求"一次做对"——花很长时间规划和准备,希望避免失败。

但现实是:失败不可避免。问题不是"如何避免失败",而是"如何更快地失败、更快地学习"。

快速失败意味着:

  • 用最小的投入验证假设
  • 不追求完美,追求速度
  • 敢于尝试,不怕犯错

快速学习意味着:

  • 从每次失败中提炼教训
  • 建立反馈机制,及时获取信号
  • 调整方向,避免重复犯错

这种"快速失败、快速学习"的理念贯穿于Minimax的产品开发和组织运营中。

原则五:"坦诚面对问题是解决问题的第一步"

这个认知来自于逃避问题导致问题恶化的教训。

早期可能有过这样的情况:发现了问题,但不愿意面对。希望问题会自己消失,或者等到"更好的时机"再处理。

结果往往是:问题没有消失,反而越积越大,最后不得不付出更大的代价来解决。

教训是:发现问题就要面对,不要逃避

  • 承认问题的存在
  • 分析问题的原因
  • 制定解决的方案
  • 执行并跟进

这需要勇气,但这是唯一正确的方式。

七、挫折的意义

站在今天回顾这些挫折,它们的意义是什么?

挫折是能力的淬炼

没有经历过算力短缺的公司,不会知道如何在约束条件下优化效率。

没有经历过产品失败的团队,不会真正理解用户需求。

没有经历过人才流失的组织,不会认真建设人才梯队和知识传承。

每一次挫折都是对能力的淬炼。熬过挫折的公司,变得更加强大。

挫折是认知的来源

最深刻的认知往往来自于最痛苦的教训。

"错误率是生命线"这个认知,可能来自于无数次用户投诉带来的挫败感。

"技术不等于产品"这个认知,可能来自于技术很强但市场不买账的失落。

没有这些挫折,这些认知不会如此深刻。

挫折是文化的检验

一家公司真正的文化,不是顺境时说的话,而是逆境时做的事。

当挫折来临时,坦诚文化是否还能保持?长期主义是否还能坚持?团队是否还能团结?

挫折检验了Minimax的文化是否真实,还是只是口号。

挫折是差异化的来源

每家公司都会遇到挫折,但如何应对挫折决定了公司的差异化。

有些公司被挫折打垮,从此一蹶不振。

有些公司逃避挫折,问题越积越多。

有些公司正视挫折,从中学习,变得更强。

Minimax能够成为"6+2"格局中的一员,不是因为它没有遇到挫折,而是因为它能够从挫折中恢复和成长。

本章核心洞察

  1. 失败是创业的常态,不是例外。 成功的创业者不是不犯错的人,而是能够从错误中快速恢复的人。

  2. 技术挫折是学费,换来的是能力积累。 每一次失败的训练、每一个难解的bug,都在积累团队的know-how。

  3. 产品挫折是学习用户的机会。 用户不买账的产品或功能,揭示了团队对用户需求的误解。

  4. 组织挫折是管理成熟的代价。 招聘失误、晋升失误、文化稀释……这些问题在成长中不可避免,关键是能否识别和修正。

  5. 自我修正机制比避免错误更重要。 建立数据驱动的复盘、引入外部视角、推动组织创新、保持领导者反思——这些机制确保公司能够持续进化。

  6. 从挫折中提炼原则,形成组织智慧。 "错误率是生命线""用户共创是生存方式""快速失败、快速学习"——这些原则来自于真实的教训,指导未来的行动。

  7. 挫折的意义在于淬炼能力、深化认知、检验文化。 没有挫折的公司是虚弱的。经历挫折并从中成长的公司,才能走得更远。


【本章完】


请输入"继续"以开始第十三章:决策模型、风险观与长期主义

第十三章:决策模型、风险观与长期主义

一、决策是创始人的核心职责

如果要用一个词来概括创始人的核心职责,那就是:决策

每一天,创始人都面临无数的选择:

  • 战略方向:做什么,不做什么?
  • 资源配置:投入多少,投入到哪里?
  • 人员任用:谁上,谁下?
  • 产品取舍:哪个功能优先,哪个功能砍掉?
  • 时机把握:现在做,还是再等等?

这些决策累积起来,决定了公司的命运。

一个正确的决策可以让公司脱颖而出,一个错误的决策可以让公司万劫不复。大多数决策的效果介于两者之间,但它们的累积效应是巨大的。

闫俊杰作为Minimax的创始人,在过去几年中做出了无数决策。这些决策的质量决定了公司今天的位置。

更重要的是,他在决策过程中形成了一套独特的决策模型。理解这套模型,对于任何需要做决策的人都有借鉴价值。

二、闫俊杰的决策框架

通过分析Minimax的重大决策和闫俊杰的公开言论,可以还原出他的决策框架。

这套框架包含四个核心维度:

维度一:技术可行性

第一个问题永远是:这件事在技术上可行吗?

作为技术背景出身的创始人,闫俊杰对技术可行性有敏锐的判断力。

技术可行性的评估包括:

  • 理论可行性:从原理上,这件事能不能做到?
  • 工程可行性:以当前的工程能力,能不能实现?
  • 资源可行性:需要多少算力、数据、人才?我们有吗?
  • 时间可行性:需要多长时间?市场能等吗?

2021年选择MoE架构就是一个典型案例。

当时MoE在理论上已经被证明可行(谷歌的Switch Transformer论文),但工程实现难度很大,很少有公司敢于在生产环境中使用。

闫俊杰的判断是:理论可行且符合长期趋势,工程挑战可以克服。 这个判断后来被证明是正确的。

技术可行性评估的一个关键原则是:尊重技术规律,不做违背物理定律的承诺。

有些公司为了融资或市场宣传,会做出超越技术现实的承诺。这种做法可能短期有效,但长期会损害信誉。

Minimax的做法是:只承诺有技术基础的事情,不夸大、不虚构。

维度二:商业可持续性

第二个问题是:这件事在商业上可持续吗?

技术可行不等于商业可持续。很多技术上可行的事情,商业上完全不可行。

商业可持续性的评估包括:

  • 用户价值:用户会为此付费吗?付多少?
  • 成本结构:实现这个价值需要多少成本?能覆盖吗?
  • 竞争格局:竞争对手在做什么?我们有差异化优势吗?
  • 规模效应:规模扩大后,成本会下降还是上升?

闫俊杰在采访中提到过一个核心指标:"降价同时保持更好效果。"

这句话揭示了他对商业可持续性的理解:

  • 单纯降价不可持续,如果成本降不下来,降价就是在亏损补贴
  • 单纯追求效果也不可持续,如果成本太高,用户无法承受
  • 可持续的模式是:在保持效果的同时降低成本,从而可以降低价格、扩大用户

这种"效率驱动"的商业模式,比"烧钱补贴"的模式更加健康。

维度三:组织承载力

第三个问题是:团队能承载这个战略吗?

再好的战略,如果团队无法执行,也是空中楼阁。

组织承载力的评估包括:

  • 人才储备:有合适的人来做这件事吗?
  • 能力匹配:团队的能力与战略需求匹配吗?
  • 文化契合:这件事与公司文化一致吗?
  • 资源约束:同时进行的项目太多了吗?团队会崩溃吗?

2025年"五连发"的经历就是一个教训。

同时推出五款产品,展示了公司的技术储备,但也造成了团队的极度疲劳。事后反思,如果更加聚焦,可能效果更好。

组织承载力评估的一个关键原则是:不要让战略雄心超越组织能力。

野心勃勃的战略很诱人,但如果团队无法执行,最终只会导致挫败和疲惫。

维度四:长期价值

第四个问题是:五年后,这件事还有价值吗?

这是最容易被忽视的维度,也是最重要的维度。

很多决策在短期内看起来很有吸引力,但从长期看毫无价值:

  • 追逐热点可能带来短期流量,但热点过去后一地鸡毛
  • 签一个大客户可能带来短期收入,但如果需要过度定制,反而拖累未来发展
  • 做一个投资人喜欢的项目可能帮助融资,但如果与核心战略不一致,是在浪费资源

长期价值的评估需要回答:

  • 积累性:这件事会积累什么?技术、用户、数据、品牌?
  • 可持续性:这种积累在五年后还有价值吗?还是会被淘汰?
  • 战略一致性:这件事与公司的长期愿景一致吗?
  • 机会成本:做这件事意味着放弃什么?值得吗?

闫俊杰在决策时,会优先考虑长期价值,而不是短期收益。

选择自研模型而非使用开源模型,短期成本更高,但长期积累更深。

选择做C端产品而非只做API,短期变现更慢,但长期护城河更高。

这种"长期优先"的决策原则,贯穿于Minimax的发展历程。

三、决策框架的应用案例

让我们用这套决策框架来分析几个具体案例。

案例一:2021年选择MoE架构

  • 技术可行性:理论上已被验证,工程挑战虽大但可克服。✓
  • 商业可持续性:MoE可以降低推理成本,对大规模服务至关重要。✓
  • 组织承载力:团队技术能力强,有信心攻克工程难题。✓
  • 长期价值:MoE是通向更大更强模型的必由之路,长期价值高。✓

四个维度都是正向的,这个决策是正确的。

案例二:2023年同时推进多款C端产品

  • 技术可行性:有模型能力支撑,技术上可行。✓
  • 商业可持续性:C端产品可以直接变现,商业上有潜力。✓
  • 组织承载力:同时多条产品线,资源分散,团队压力大。△
  • 长期价值:部分产品可能成功,部分可能失败,需要验证。△

这个决策有风险,组织承载力和长期价值都存在不确定性。事后看,Talkie成功了,其他产品表现参差不齐。如果更加聚焦,可能更好。

案例三:2024年坚持闭源策略

  • 技术可行性:技术上可行,闭源不影响产品开发。✓
  • 商业可持续性:闭源可以支撑高端定价,但开源竞争日益激烈。△
  • 组织承载力:团队可以支撑闭源模式。✓
  • 长期价值:在开源崛起的背景下,闭源的长期价值需要重新评估。△

这个决策存在争议,商业可持续性和长期价值都面临挑战。DeepSeek的冲击进一步加剧了这种挑战。Minimax后来调整了策略,变得更加灵活。

通过这些案例可以看出:决策框架不能保证每个决策都正确,但可以帮助系统性地思考问题、识别风险。

四、风险观的演进

与决策框架密切相关的是风险观。如何看待和管理风险,决定了决策的风格。

闫俊杰的风险观经历了三个阶段的演进:

阶段一:激进技术冒险(2021-2022)

创业初期,闫俊杰的风险观是激进的。

典型决策

  • 选择MoE这样的前沿架构
  • 同时布局多模态
  • 从一开始就做C端产品

这些决策的共同特点是:技术风险高,但潜在回报也高。

激进风险观的逻辑是:

创业本身就是高风险活动。如果追求安全,就不应该创业。既然选择了创业,就应该押注于高风险高回报的方向。

保守的选择(使用成熟架构、专注单一模态、只做API)可能更安全,但也意味着更难建立差异化优势。

在这个阶段,闫俊杰愿意冒技术风险,相信团队有能力克服工程挑战。

阶段二:选择性冒险(2023-2024)

随着公司规模扩大、业务复杂化,风险观开始变得更加精细。

核心原则在核心领域冒险,在边缘领域控制风险。

具体表现:

  • 核心技术:继续保持激进,追求前沿突破
  • 成熟业务:控制风险,确保现金流稳定
  • 新业务:采用"小步快跑"策略,验证可行再大规模投入

这种差异化的风险策略,平衡了进取与稳健。

它的逻辑是:公司不能在所有方向上都冒险,那样会失控。但也不能在所有方向上都保守,那样会停滞。

关键是识别"在哪里值得冒险"。

阶段三:系统性风险管理(2025-)

进入成熟期后,风险管理变得更加系统化。

具体措施

  • 风险识别:定期评估各类风险——技术风险、市场风险、财务风险、合规风险、组织风险
  • 风险分类:区分高概率低影响和低概率高影响的风险
  • 应对预案:为主要风险制定应对预案
  • 监控机制:建立早期预警指标,及时发现风险信号
  • 分散策略:不把鸡蛋放在一个篮子里——产品多元化、市场多元化、收入来源多元化

这个阶段的风险观更加成熟:不是回避风险,而是理解风险、管理风险。

风险不是敌人,而是创业的伴生物。关键是:

  • 承担值得承担的风险
  • 避免不必要的风险
  • 为可能发生的风险做好准备

特别关注:尾部风险

成熟的风险管理特别关注"尾部风险"——概率低但影响大的事件。

这类风险包括:

  • 核心技术被突破,失去竞争优势
  • 关键人才集体流失
  • 重大合规问题导致业务停摆
  • 地缘政治变化影响公司运营
  • 算力供应完全断裂

这些事件发生的概率不高,但一旦发生,影响可能是致命的。

应对尾部风险的策略包括:

  • 分散化:不依赖单一技术、单一市场、单一供应商
  • 冗余设计:关键系统和人员有备份
  • 情景规划:提前思考"如果发生X,我们怎么办?"
  • 财务储备:保持足够的现金,应对突发情况

五、长期主义的实践

决策框架和风险观的核心,指向一个更深层的理念:长期主义

长期主义是Minimax的核心价值观之一,但它不是一个抽象的口号,而是需要具体实践的原则。

实践一:不追逐热点

科技行业热点不断:元宇宙、Web3、NFT、ChatGPT……每隔几个月就有新的热点出现。

追逐热点很诱人:媒体关注、投资人兴奋、估值上涨……短期内可以获得很多好处。

但追逐热点的代价是:失去焦点,分散资源,积累不了真正的能力。

Minimax的做法是:除非热点与公司的核心战略一致,否则不追。

比如,当元宇宙概念火热时,Minimax没有宣布"All in 元宇宙"。当Web3概念流行时,Minimax没有发行什么Token。

这种克制在当时可能显得"不够前沿",但长期来看是正确的——那些热点已经冷却,而Minimax的核心能力在持续积累。

实践二:坚持创新投入

长期主义的一个具体表现是:即使在困难时期,也保持对创新的投入。

2025年面临DeepSeek冲击、资本压力、内部质疑……在这种情况下,有些公司会选择削减研发投入,聚焦短期变现。

Minimax的选择是:调整投入方向,但不削减创新投入。

  • 加大效率优化的投入(针对DeepSeek的挑战)
  • 继续保持多模态的领先(核心差异化)
  • 优化产品矩阵但保持创新(聚焦但不停滞)

这种选择需要勇气。在压力下保持长期视野,是对领导力的考验。

实践三:选择理解长期价值的投资人

长期主义需要资本的支持。如果投资人只看短期回报,公司很难坚持长期主义。

闫俊杰在融资时有一个重要的筛选标准:投资人是否理解和认同长期价值?

这意味着:

  • 优先选择有耐心的投资人,而非催促快速变现的投资人
  • 优先选择理解技术的投资人,而非只看财务模型的投资人
  • 优先选择有长期合作历史的投资人,而非短期套利的投资人

这种选择可能意味着放弃更高的估值或更好的条款,但换来的是更长远的战略空间。

实践四:建立长期激励机制

长期主义不只是创始人的选择,也需要通过机制传导到整个组织。

Minimax的激励机制体现长期主义:

  • 期权激励:核心员工有期权,与公司的长期成功绑定
  • 绩效评估:不只看短期产出,也看长期贡献
  • 晋升标准:不只看眼前的项目结果,也看能力的积累和成长
  • 文化强化:持续传达长期主义的信息,让它成为组织的共识

实践五:接受短期的"不完美"

长期主义意味着接受短期的不完美。

如果每个季度都要交出完美的成绩单,就必然会牺牲长期发展。

Minimax的做法是:设定合理的短期目标,但不让短期目标凌驾于长期目标之上。

比如:

  • 接受某些季度的收入增长低于预期,只要长期趋势是健康的
  • 接受某些产品尝试的失败,只要在失败中学到了东西
  • 接受某些技术投入暂时看不到回报,只要它符合长期战略

这种"接受不完美"需要与投资人和团队达成共识,需要清晰地沟通背后的逻辑。

六、长期主义的边界

长期主义是正确的理念,但也有其边界和风险。

边界一:长期主义不是"永远不赚钱"

有人误解长期主义为"不需要商业化,专心做技术就好"。这是危险的误解。

如果公司无法生存,就没有长期可言。商业化是生存的必要条件。

真正的长期主义是:赚钱,但不赚损害长期价值的钱。

Talkie的收入证明了这一点——长期主义不妨碍商业成功,只是不用不健康的方式追求商业成功。

边界二:长期主义需要阶段性验证

完全的"等待五年后见分晓"是不现实的。

长期目标需要分解为阶段性里程碑,定期检验进展。

如果阶段性里程碑持续未达到,可能意味着方向有问题,需要调整。

长期主义不是固执,而是方向上的坚持与方法上的灵活

边界三:长期主义需要资源支撑

长期主义需要"耐心资本"的支持。如果公司现金流紧张、融资困难,就很难坚持长期主义。

这意味着:

  • 在资源充裕时要为困难时期做准备
  • 保持一定的财务安全边际
  • 不把资源消耗到无法回头的程度

长期主义是一种奢侈,需要有实力才能享受。

边界四:长期主义不是回避决断

有时候,"长期主义"会成为回避困难决定的借口:

"这个产品暂时表现不好,但长期会好的……"

"这个人最近表现不行,但给他更多时间……"

真正的长期主义需要区分:

  • 哪些是值得等待的——方向正确,只是需要时间
  • 哪些是不应该等待的——方向错误,等待只会浪费资源

这种区分需要判断力,不能用"长期主义"来逃避判断。

七、决策智慧的积累

决策能力不是天生的,而是通过实践积累的。闫俊杰的决策智慧来自哪里?

来源一:大量的决策实践

没有捷径。只有做过大量决策,才能积累决策的直觉。

从商汤的技术决策,到Minimax的战略决策,闫俊杰有超过十年的决策实践。

这些实践中的成功和失败,都转化为决策的智慧。

来源二:系统的复盘反思

实践只是原材料,需要通过反思才能转化为智慧。

闫俊杰有系统复盘的习惯:

  • 重要决策后会回顾结果,分析对错
  • 定期总结决策中的规律和教训
  • 将反思的成果固化为原则和框架

来源三:多元的信息输入

决策质量取决于信息质量。

闫俊杰保持着多元的信息输入:

  • 阅读大量的技术和商业资料
  • 与不同背景的人交流
  • 关注竞争对手和行业动态
  • 听取团队的不同意见

这些信息帮助他更全面地理解问题,做出更好的决策。

来源四:持续的学习更新

市场在变,技术在变,决策框架也需要更新。

DeepSeek的冲击就是一个例子。它迫使闫俊杰重新审视对开源模式、训练效率的判断,更新自己的决策框架。

这种持续学习的能力,是决策智慧的重要来源。

本章核心洞察

  1. 决策是创始人的核心职责。 决策的累积效应决定公司的命运。建立系统的决策框架,比凭直觉决策更可靠。

  2. 决策框架的四个维度:技术可行性、商业可持续性、组织承载力、长期价值。 用这四个维度评估决策,可以更系统地识别风险和机会。

  3. 风险观需要随公司发展而演进。 从激进冒险到选择性冒险再到系统性风险管理——不同阶段需要不同的风险策略。

  4. 长期主义是核心理念,但需要正确理解。 不追热点、坚持创新投入、选择理解长期价值的投资人——这些是长期主义的实践。

  5. 长期主义有边界:不是不赚钱,需要阶段性验证,需要资源支撑,不是回避决断。 理解这些边界,才能正确实践长期主义。

  6. 决策智慧来自实践、反思、信息和学习。 没有人天生就会做好决策,但通过刻意的积累,可以持续提升决策能力。

  7. 方向上的坚持与方法上的灵活是最佳组合。 长期目标要坚定,但实现目标的路径可以灵活调整。


【本章完】


请输入"继续"以开始第十四章:领导力与自我约束

第十四章:领导力与自我约束

一、领导力的本质

什么是领导力?

这个问题有无数种回答。有人说领导力是影响他人的能力,有人说是设定方向的能力,有人说是激励团队的能力,有人说是做出决策的能力。

这些回答都有道理,但都只触及了表面。

闫俊杰对领导力有一个更深刻的理解:

领导力是让正确的事情发生的能力。

这个定义有三个关键词:

"正确的事情"——领导力首先是关于方向的。如果方向错了,执行力再强也没有用。

"发生"——领导力不只是想法和计划,而是实际的结果。很多人有正确的想法,但无法让它们变成现实。

"让"——领导力是通过他人实现目标,而不是单打独斗。创始人不可能亲自做所有的事,必须通过团队来实现愿景。

这个定义揭示了领导力的核心张力:

  • 既要有远见,又要能落地
  • 既要坚持原则,又要灵活应变
  • 既要自信果断,又要谦逊学习
  • 既要激励他人,又要约束自己

这些张力不是非此即彼的选择,而是需要同时把握的平衡。

二、领导力的矛盾统一

闫俊杰的领导力展现出几对看似矛盾、实则统一的特质。

矛盾一:激进与克制

在技术路线上,闫俊杰是激进的:

  • 选择MoE这样的前沿架构
  • 从一开始就布局多模态
  • 追求万亿参数的规模
  • 线性注意力机制的创新

这些选择都体现了技术上的激进——愿意承担高风险,追求高回报。

但在组织扩张上,他是克制的:

  • 保持轻量化组织结构
  • 不盲目扩招
  • 控制管理层级
  • 警惕大公司病

这种"技术激进、组织克制"的组合是有意识的选择。

为什么技术上激进?

因为技术是竞争的核心。在AI领域,技术落后意味着全面落后。必须在技术上保持领先,才有生存的基础。

为什么组织上克制?

因为组织膨胀会侵蚀创新能力。人多了,会议多了,流程多了,效率就下降了。保持精干,才能保持活力。

这两者的统一逻辑是:用精干的组织追求激进的技术目标。

不是用臃肿的组织做保守的事情,也不是用精干的组织做平庸的事情,而是用最高效的方式追求最有野心的目标。

矛盾二:自信与谦逊

对AGI的未来,闫俊杰是自信的:

"AI应该成为日常生活的一部分,成为普惠大众的生产力。"

"中国AI企业可以引领世界巨头。"

这些表述展现了强烈的信念和雄心。

但对当前的差距,他也是谦逊的:

他承认模型还有20-30%的错误率,距离真正可用还有距离。

他认真研究DeepSeek的技术路线,承认其效率优势。

他持续学习,保持"学生心态"。

这种"对未来自信、对现状谦逊"的组合是成熟领导力的体现。

自信的价值

创业需要信念。如果创始人自己都不相信能成功,怎么能说服别人?自信是激励团队、吸引人才、打动投资人的基础。

谦逊的价值

盲目自信会导致傲慢和封闭。只有谦逊地承认不足,才能持续学习、不断进步。谦逊是保持开放心态、避免认知僵化的关键。

两者的统一逻辑是:相信目标可以实现,但不认为自己已经知道所有答案。

自信是关于方向的,谦逊是关于路径的。方向是坚定的,路径是探索的。

矛盾三:野心与耐心

闫俊杰的野心是显而易见的:

"我骨子里是一个期待跟王者一决高下的人。"

他不满足于做一家小而美的公司,而是志在成为全球领先的AI企业。

但他也展现了惊人的耐心:

不追逐短期热点,坚持长期主义。

不为短期变现牺牲长期发展。

接受某些投入需要多年才能见效。

这种"野心勃勃但不急于求成"的组合是稀缺的。

很多有野心的人缺乏耐心——他们想要快速成功,容易被短期诱惑带偏。

很多有耐心的人缺乏野心——他们满足于渐进式的改良,不敢追求根本性的突破。

两者的统一逻辑是:目标是十年后的胜利,但每一天都在为那个胜利而战斗。

野心决定了目标的高度,耐心决定了实现目标的方式。两者结合,才能在长期竞争中胜出。

三、自我约束的机制

权力是危险的。

随着公司的发展,创始人的权力越来越大。他的决策影响数百人的工作和生活,他的一句话可能改变公司的方向。

这种权力如果不加约束,很容易导致问题:

  • 傲慢:认为自己总是对的,不听取不同意见
  • 封闭:只接触同意自己的人,陷入信息茧房
  • 独断:绕过流程,凭个人喜好做决策
  • 失控:行为越来越偏离公司和社会的利益

历史上,无数曾经成功的创始人因为缺乏自我约束而失败。

闫俊杰如何避免这些陷阱?他建立了几个自我约束的机制:

机制一:信息隔离的防范

创始人很容易陷入信息茧房。因为:

  • 下属倾向于报告好消息,隐瞒坏消息
  • 周围的人倾向于迎合老板的观点
  • 成功会强化既有认知,减少质疑

闫俊杰的应对措施:

多元信息渠道:不只依赖直接汇报,也通过产品数据、用户反馈、行业报告等渠道获取信息。

鼓励直言:明确表态欢迎不同意见,对敢于直言的人给予正向反馈。

定期"潜伏":有时候以普通用户的身份使用产品,直接感受用户体验。

外部视角:定期与外部人士(投资人、顾问、同行)交流,获取独立的观点。

机制二:认知更新的习惯

认知僵化是领导者的大敌。市场在变,技术在变,如果认知不更新,决策就会越来越脱离现实。

闫俊杰的应对措施:

持续学习:阅读大量资料,参加行业活动,保持对前沿的了解。

复盘反思:定期回顾自己的决策和判断,评估对错,总结教训。

承认错误:当事实证明自己判断失误时,坦诚承认,而不是找借口。

更新模型:根据新信息调整自己的决策框架,而不是固守旧框架。

DeepSeek的冲击就是一个例子。它迫使闫俊杰重新审视对开源模式和训练效率的判断,更新自己的认知模型。

机制三:权力边界的设定

创始人不应该独断一切。有些决策应该由团队做出,有些流程应该被遵守。

闫俊杰的做法是:在组织内建立"科学决策"而非"个人独断"的文化。

具体措施:

数据驱动:重大决策要有数据支撑,不是老板拍脑袋。

集体讨论:重要问题要经过核心团队的充分讨论,而不是创始人一言堂。

授权赋能:把决策权下放给更接近一线的人,而不是所有事情都要创始人批准。

流程约束:某些决策必须走流程,即使创始人也不能随意绕过。

这些措施限制了创始人的权力,但也让决策更加科学、组织更加健康。

机制四:反馈机制的建立

领导者需要反馈来校正行为,但越往高层走,真实反馈越难获得。

闫俊杰的应对措施:

匿名反馈渠道:让员工可以匿名提出意见和建议。

360度评估:不只是上级评估下级,也让下级和同级评估领导。

开放门户:任何人都可以直接向创始人反映问题。

外部教练:聘请专业的教练或顾问,提供独立的反馈和建议。

机制五:使命感的锚定

最终极的自我约束来自于使命感。

当创始人清晰地知道自己为什么做这件事、要实现什么目标时,就会自然地约束那些偏离使命的行为。

闫俊杰的使命感来自于:

  • 外公的遗憾——AI应该帮助普通人表达自己
  • 技术民主化的信念——AI不应该只服务于精英
  • 引领世界的雄心——中国AI企业可以站在世界之巅

这些深层的信念像锚一样,把他固定在正确的方向上。

当面临诱惑时——比如为了短期利益做有害于用户的事——使命感会发出警报:这不是我们要做的事。

当面临困难时——比如压力巨大想要放弃——使命感会提供动力:我们还没有完成使命,不能停下来。

四、领导力的进化路径

领导力不是固定的,而是需要随着公司发展而进化的。

闫俊杰的领导力经历了几个阶段的进化:

阶段一:技术领导者(2014-2020)

在商汤时期,闫俊杰主要是一个技术领导者。

核心能力:

  • 技术判断力:识别有价值的技术方向
  • 技术执行力:带领团队攻克技术难关
  • 技术影响力:在技术社区建立声誉

领导方式:

  • 以技术实力服人
  • 亲力亲为参与技术工作
  • 主要管理技术团队

这个阶段的领导力是"专家型"的——基于专业能力的领导。

阶段二:创业领导者(2021-2023)

创立Minimax后,领导力需要升级。

新增能力需求:

  • 愿景设定:定义公司的使命和方向
  • 团队构建:吸引和留住各类人才
  • 融资能力:与投资人沟通,获取资源
  • 产品思维:从技术到产品的转化

领导方式:

  • 更多时间用于战略和管理
  • 开始授权,培养核心团队
  • 跨职能领导,不只是技术

这个阶段的领导力是"创业型"的——在不确定性中开创事业的领导。

阶段三:组织领导者(2024-)

随着公司规模扩大,领导力需要再次升级。

新增能力需求:

  • 组织设计:构建高效的组织结构
  • 文化塑造:确保正确的价值观落地
  • 人才发展:培养下一代领导者
  • 生态思维:管理公司与外部的关系

领导方式:

  • 更多时间用于"领导领导者"
  • 关注系统和机制,而非具体事务
  • 成为文化的守护者

这个阶段的领导力是"组织型"的——通过组织实现使命的领导。

进化的挑战

每一次进化都是挑战。

技术领导者可能不习惯"不做技术"。当需要把时间花在融资、管理、战略上时,可能会感到不适。

创业领导者可能不习惯"不亲力亲为"。当需要通过他人来实现目标时,可能会感到失控。

这些转变需要刻意的练习和调整,不是自然发生的。

闫俊杰的自我认知帮助他应对这些挑战:

"我知道自己需要改变。技术是我的舒适区,但公司的发展需要我走出舒适区。这不容易,但必须做。"

五、领导力的真实面貌

商业传记往往把领导者描绘成完美的英雄:永远自信、永远正确、永远掌控一切。

但真实的领导力不是这样的。

真实的领导力包含脆弱。

闫俊杰也有困惑的时刻:面对DeepSeek的冲击,也会问自己"我们是不是落后了?"

面对资本压力和内部质疑,也会感到疲惫和沮丧。

面对核心成员的离开,也会有失落和自我怀疑。

这些脆弱是真实的,也是人性的。

领导力不是没有脆弱,而是能够在脆弱中保持前行

真实的领导力包含不确定。

很多决策没有明确的对错,只能在不完整信息下做出判断。

选择MoE架构时,不知道工程挑战能不能克服。

选择ToC优先时,不知道市场是否会接受。

选择坚持闭源时,不知道开源会不会成为主流。

领导力不是总是知道正确答案,而是能够在不确定中做出决断

真实的领导力包含妥协。

不是每个决策都能坚持原则到底,有时候需要妥协。

与投资人的谈判中,可能需要接受一些不完美的条款。

与团队的协调中,可能需要放弃一些自己偏好的方案。

与市场的互动中,可能需要调整一些原本的计划。

领导力不是永不妥协,而是知道什么时候坚持、什么时候妥协

真实的领导力是持续的修炼。

没有人天生就是完美的领导者。领导力是在实践中学习、在失败中成长的。

闫俊杰今天的领导力,是十几年积累的结果。而这个积累还在继续——他仍在学习、仍在进化。

六、对领导力的反思

作为本章的结尾,让我们从闫俊杰的经历中提炼一些关于领导力的反思:

反思一:领导力是可以学习的

领导力不是天赋,而是技能。虽然有些人可能更有潜质,但任何人都可以通过学习和实践提升领导力。

关键是:保持学习的心态,愿意走出舒适区,从每一次经历中提取教训。

反思二:领导力需要与角色匹配

不同的角色需要不同的领导力。技术团队的领导者和公司的创始人,需要的能力集合不同。

随着角色变化,领导力也需要进化。固守旧模式会成为发展的瓶颈。

反思三:自我约束是领导力的核心

权力会腐蚀人。没有自我约束的领导者,最终会伤害组织和自己。

建立约束机制——信息多元化、认知更新、权力边界、反馈渠道、使命锚定——是领导者的必修课。

反思四:矛盾的统一是领导力的高级形态

激进与克制、自信与谦逊、野心与耐心……这些看似矛盾的特质,需要在更高层次上统一。

能够把握这些平衡的领导者,比只有单一特质的领导者更加成熟和有效。

反思五:真实比完美更重要

不需要假装完美。承认脆弱、不确定和妥协,反而更能赢得信任。

团队需要的不是一个神,而是一个真实的、可以信赖的领导者。

本章核心洞察

  1. 领导力是让正确的事情发生的能力。 它包含方向、执行和通过他人实现目标三个层面。

  2. 领导力的高级形态是矛盾的统一。 激进与克制、自信与谦逊、野心与耐心——能够把握这些平衡才是成熟的领导力。

  3. 自我约束是防止权力腐蚀的关键。 建立信息多元化、认知更新、权力边界、反馈渠道和使命锚定等机制。

  4. 领导力需要随角色进化。 从技术领导者到创业领导者再到组织领导者,每次转变都需要新的能力。

  5. 真实的领导力包含脆弱、不确定和妥协。 承认这些真实的一面,比假装完美更能赢得信任。

  6. 领导力是持续修炼的过程。 没有人天生完美,通过学习和实践可以不断提升。

  7. 使命感是最终极的自我约束。 清晰的使命像锚一样,把领导者固定在正确的方向上。


【第四编完】


请输入"继续"以开始第五编第十五章:从Minimax提炼的创业法则

第五编:方法论与人生启示


第十五章:从Minimax提炼的创业法则

一、法则的价值与局限

在深入探讨从Minimax提炼的创业法则之前,必须先说明一个前提:法则不是公式

创业不是数学,没有放之四海而皆准的公式。每一家公司都有其独特的背景、资源、时机和挑战。适合Minimax的做法,不一定适合其他公司。

那么,提炼法则还有价值吗?

答案是肯定的,但价值不在于"照搬",而在于"启发"。

法则的价值在于:

  • 提供思考的框架,而非现成的答案
  • 揭示底层的逻辑,而非表面的做法
  • 呈现可能的路径,而非唯一的道路

带着这个前提,让我们从Minimax的经历中提炼五条创业法则。

二、法则一:技术深度决定商业高度

法则阐述

在AI时代,技术深度是商业成功的基础。

这不是说"只要技���好就能成功"——商业成功需要技术、产品、市场、运营等多种能力的组合。但如果技术不够深,其他能力再强也难以弥补。

为什么?

第一,技术是AI产品的核心体验。

与传统互联网产品不同,AI产品的核心价值直接来自于模型能力。用户使用ChatGPT、Talkie这类产品,体验的好坏直接取决于模型的智能程度。

如果模型不够聪明、经常犯错、响应太慢,用户体验就会很差,无论界面设计得多漂亮、运营做得多精细。

第二,技术壁垒是最持久的护城河。

商业模式可以被复制,产品功能可以被模仿,但深度的技术积累很难被快速追赶。

训练一个顶级大模型需要数年的积累:团队能力、数据资产、工程经验、know-how……这些不是有钱就能买到的。

第三,技术领先带来成本优势。

在AI领域,技术领先往往意味着效率更高、成本更低。更好的模型架构可以降低推理成本,更优的训练方法可以减少算力消耗。

这种成本优势在价格战中至关重要。

Minimax的实践

Minimax从一开始就把技术深度作为战略核心:

MoE架构的选择

2021年选择MoE是一个激进的决定。当时MoE仍是前沿,工程风险很高。但闫俊杰判断这是通向更好模型的必由之路。

事后证明这个判断是正确的。MoE现在已成为大模型的主流选择,Minimax的早期积累转化为技术优势。

持续的技术投入

即使在资金紧张、商业化压力大的时候,Minimax也保持了对基础技术的投入。

这种投入在短期内看不到回报,但长期形成了差异化能力——多模态、线性注意力、错误率控制……

技术人才的优先级

在人才招聘上,技术人才始终是最高优先级。公司愿意为顶尖技术人才提供有竞争力的条件。

反例分析

市场上有很多创业公司选择了不同的路线:

  • 使用开源模型,专注于应用层创新
  • 做轻量级的应用,避开底层技术的投入
  • 追求快速商业化,研发投入让位于销售

这些路线不一定是错的,但风险在于:当技术成为瓶颈时,没有能力突破

如果依赖的开源模型被超越,应用层的优势也会消失。

如果底层能力不足,难以做出真正差异化的产品。

如果技术团队不够强,无法应对快速变化的竞争环境。

法则的边界

技术深度重要,但不是万能的。

技术需要转化为产品:再好的技术,如果不能转化为用户喜欢的产品,也创造不了商业价值。

技术选择需要适配资源:创业公司资源有限,不可能在所有技术方向上都做到最深。需要选择最核心的领域集中投入。

技术不能脱离市场:技术方向需要与市场需求匹配。做出很强的技术但没有市场需求,是资源的浪费。

三、法则二:用户共创是技术普惠的唯一路径

法则阐述

最好的产品不是设计出来的,而是与用户共同创造出来的。

这个法则与传统的"产品经理中心论"不同。传统观点认为,优秀的产品经理能够洞察用户需求,设计出用户喜爱的产品。

但在AI时代,这种模式面临挑战:

第一,AI产品的复杂度远超传统产品。

传统互联网产品的功能相对确定,用户需求相对明确。AI产品的能力边界模糊,用户自己也不知道可以用它做什么。

产品经理很难提前预知所有的使用场景和需求。

第二,AI产品的体验高度个人化。

同一个AI产品,不同用户的使用方式和期待可能完全不同。一刀切的产品设计难以满足多样化的需求。

第三,AI产品需要持续学习和改进。

与传统产品不同,AI产品可以通过用户数据不断优化。用户反馈不只是改进的参考,更是模型进化的燃料。

因此,用户共创不是锦上添花,而是产品成功的必要条件

Minimax的实践

Minimax把用户共创融入了产品开发的全流程:

规划阶段:倾听用户声音

在产品规划阶段,就开始收集用户反馈:

  • 通过社区了解用户的痛点和期待
  • 与核心用户进行深度访谈
  • 分析用户行为数据,发现潜在需求

这些信息指导产品的方向选择和功能优先级。

开发阶段:快速验证假设

不是等到产品完善了再发布,而是用最小可用产品快速验证假设:

  • 小范围灰度测试,收集真实反馈
  • A/B测试不同的设计方案
  • 根据数据快速调整方向

运营阶段:持续迭代优化

产品上线后,迭代不停止:

  • 持续监控用户行为数据
  • 快速响应用户反馈的问题
  • 定期发布更新和改进

社区阶段:培养共创文化

建立活跃的用户社区:

  • 让核心用户参与产品讨论
  • 为用户贡献(如反馈bug、提出建议)提供激励
  • 把用户当作产品团队的延伸

从"闭门造车"到"用户驱动"的范式转变

传统的产品开发是线性的:

需求分析 → 产品设计 → 开发测试 → 发布上线

用户共创的产品开发是循环的:

假设 → 构建 → 测量 → 学习 → 新假设 → ...

这种循环让产品能够快速适应用户需求的变化,而不是等到下一个大版本才能调整。

建立有效用户共创机制的具体步骤

对于想要实践用户共创的公司,以下是一些具体步骤:

步骤一:建立反馈渠道

  • 产品内的反馈入口(要显眼、易用)
  • 社交媒体的监控和互动
  • 客服渠道的问题收集
  • 定期的用户调研

步骤二:建立数据基础设施

  • 用户行为追踪
  • 数据分析平台
  • A/B测试框架
  • 实时监控仪表盘

步骤三:建立快速响应机制

  • 问题分类和优先级排序
  • 快速修复的流程
  • 与用户沟通进展的机制
  • 改进效果的验证

步骤四:建立社区运营

  • 核心用户群的建立和维护
  • 用户贡献的激励机制
  • 产品团队与用户的直接对话
  • 社区氛围的培养

步骤五:建立组织保障

  • 产品、运营、技术的紧密协作
  • 用户声音到达决策层的通道
  • 对用户反馈快速响应的文化

四、法则三:轻量化组织是创新的必要条件

法则阐述

在快速变化的市场中,组织的灵活性比规模更重要。

传统的商业智慧往往强调规模:更多的人、更多的资源、更大的市场份额。但在AI时代,这种逻辑需要重新审视。

规模的代价

组织规模扩大带来的不只是能力的增长,也有成本的增加:

沟通成本:人多了,协调的难度指数级增长。10个人的团队需要45条沟通线路,100个人需要4950条。

决策成本:层级多了,信息传递变慢,决策周期延长。市场在变,公司却在开会。

创新成本:官僚化侵蚀创新文化。流程变多、审批变长、试错空间变小。

文化成本:人多了,文化稀释,核心价值观难以传承。

轻量化的价值

轻量化组织的核心不是"人少",而是"高效"。目标是:用最少的人做最大的事

轻量化带来的优势:

速度:决策快、执行快、迭代快。在AI行业,速度就是生命。

灵活性:方向调整容易,不会被庞大的组织惯性拖累。

专注:资源集中,避免分散。每个人都在做最重要的事。

文化:容易保持创业精神和创新氛围。

Minimax的实践

Minimax在规模扩张中始终坚持轻量化原则:

控制管理层级

即使团队扩大到数百人,管理层级也保持在三到四层。避免过多的中间层级导致信息失真和决策缓慢。

小团队作战

大项目拆分成小团队,每个团队有清晰的目标和充分的自主权。避免大团队带来的协调成本。

精简会议

严格控制会议数量和时长。每增加一个固定会议,必须取消一个现有会议。会议必须有明确的目的和产出。

流程最小化

只保留必要的流程,定期清理不必要的规章制度。流程是为了提高效率,而非增加官僚。

结果导向

评估工作看产出,不看加班时长、会议出席率等形式指标。

轻量化组织的设计原则

对于想要实践轻量化的公司,以下是一些设计原则:

原则一:层级最小化

尽可能减少管理层级。如果某个层级只是"传话筒",就没有存在的必要。

原则二:授权充分化

把决策权下放到最接近问题的人。不需要层层审批,不需要事事请示。

原则三:团队自治化

每个团队有清晰的边界和目标,在边界内有充分的自主权。团队之间通过明确的接口协作。

原则四:流程必要化

每个流程都要问:这真的必要吗?能不能更简单?如果答案是否定的,就取消它。

原则五:沟通异步化

能用文档说清楚的事不开会。能异步沟通的事不同步。减少对面对面会议的依赖。

原则六:规模克制化

招人要克制。每增加一个人,都要问:这个人能带来的价值是否大于增加的协调成本?

轻量化的挑战

轻量化不是没有挑战:

能力密度要求高:人少意味着每个人都要很强。招聘标准必须严格。

管理能力要求高:扁平化不是没有管理,而是需要更高级的管理——通过目标和文化来管理,而非通过命令和控制。

规模化的矛盾:当业务快速增长时,如何在扩张团队的同时保持轻量化?这是永恒的挑战。

但这些挑战是值得面对的。在AI时代,轻量化带来的速度和灵活性优势,往往大于规模带来的资源优势。

五、法则四:开源与闭源的辩证统一

法则阐述

开源与闭源不是非此即彼的选择,而是可以辩证统一的策略。

这个法则来自于DeepSeek冲击后的深刻反思。DeepSeek的成功证明了开源模式的可行性,但这不意味着闭源就没有价值。

开源的价值

  • 生态建设:开源可以吸引开发者,形成生态
  • 品牌影响力:开源项目可以建立技术声誉
  • 社区贡献:开源可以获得社区的改进和反馈
  • 人才吸引:优秀的开源项目可以吸引顶尖人才
  • 降低壁垒:开源降低了用户的使用门槛和担忧

闭源的价值

  • 技术保护:核心技术不被竞争对手复制
  • 商业化支撑:通过技术差异化支撑定价
  • 质量控制:对产品质量和安全有完全的控制
  • 战略灵活:保留未来开源的选项

辩证统一的策略

成熟的策略不是"全开源"或"全闭源",而是根据具体情况选择:

基础能力可以开源,差异化能力保持闭源

基础模型能力逐渐商品化,开源可以获得生态优势。但核心的差异化技术(如多模态融合、特定场景优化)可以保持闭源,作为竞争壁垒。

通用模型可以开放,垂直应用保持封闭

通用的基础模型可以开放给社区,但针对特定行业或场景的优化模型可以保持封闭,支撑商业化。

技术可以开源,产品保持闭源

模型可以开源,但构建在模型之上的完整产品体验保持闭源。因为产品能力(设计、运营、数据)是很难通过开源复制的。

Minimax的调整

面对开源浪潮,Minimax调整了策略:

  • 更加灵活地看待开源,不再固守纯闭源立场
  • 探索在某些领域部分开源,扩大生态影响力
  • 强化"模型+产品"的一体化能力,这是无论开源还是闭源都需要的竞争力

启示:技术主权与商业现实的平衡

开源与闭源的选择,最终是关于"技术主权"与"商业现实"的平衡:

  • 完全闭源可能保护技术,但可能失去生态
  • 完全开源可能获得生态,但可能失去商业化空间

没有唯一正确的答案,需要根据公司的战略定位、竞争格局和发展阶段来选择。

关键是:保持灵活,不被教条束缚

六、法则五:长期主义不是道德选择,而是生存策略

法则阐述

长期主义常常被描述为一种"高尚的选择"——为了长远利益而放弃短期诱惑,这需要道德上的自律和克制。

但在AI时代,长期主义更应该被理解为一种生存策略——不是因为"应该"长期主义,而是因为"必须"长期主义。

为什么"赚快钱"在AI时代是死路?

原因一:技术积累需要时间

大模型的能力积累是以年为单位的。训练经验、数据资产、工程能力……这些都需要时间沉淀。

追求快速变现的公司,往往会把资源投入到短期能赚钱的方向,忽视长期的技术积累。几年后,技术落后,竞争力丧失。

原因二:用户信任需要时间

AI产品涉及用户的隐私、决策、工作……建立信任需要时间。

追求快速增长的公司,往往会采用激进的营销手段、过度的承诺、甚至损害用户利益的做法。短期内可能获得用户,但长期会失去信任。

原因三:人才留存需要时间

顶尖人才不只看薪酬,也看公司的愿景和文化。

追求短期利益的公司,往往无法吸引和留住最优秀的人才。没有好的人才,长期竞争力无从谈起。

原因四:市场格局需要时间形成

AI市场仍在早期,最终的格局尚未确定。

追求短期变现的公司,可能在某个细分市场获得短期成功,但错失了更大的机会。长期来看,赢家是那些在正确方向上持续投入的公司。

拒绝资本炒作,坚持模型创新

长期主义的一个具体表现是:拒绝资本炒作。

AI领域不乏炒作的案例:

  • 夸大技术能力,制造虚假繁荣
  • 追逐热点概念,不管实际价值
  • 为了融资讲故事,不考虑能否实现

这些做法可能短期内推高估值,但长期会反噬。

DeepSeek提供了一个正面案例:低调做事,用实力说话。没有铺天盖地的PR,但当产品发布时,实力让所有人震惊。

Minimax的做法类似:专注于模型创新和产品价值,而非资本游戏

建立长期主义决策框架

对于想要实践长期主义的公司,以下是一个决策框架:

问题一:这件事五年后还有价值吗?

如果答案是否定的,即使短期收益很高,也要谨慎。

问题二:这件事会积累什么?

好的事情会积累能力、用户、数据、品牌……积累越多,长期价值越高。

问题三:这件事会损害什么?

有些事情会损害信任、文化、人才……这些损害往往是不可逆的。

问题四:如果竞争对手在做长期投入,我们不做会怎样?

长期主义是竞争的一部分。如果别人在积累,你在消耗,时间会拉开差距。

问题五:这是恐惧驱动还是贪婪驱动?

恐惧驱动的决策(如"不赚钱会死")和贪婪驱动的决策(如"这个热点能赚一笔")往往是短视的。

七、法则的整合应用

这五条法则不是孤立的,而是相互关联的:

技术深度是基础——没有技术,其他都是空中楼阁。

用户共创是方法——把技术转化为用户价值的路径。

轻量化组织是保障——确保能够快速、高效地执行。

开源闭源辩证是策略——在生态与壁垒之间寻找平衡。

长期主义是心法——贯穿所有决策的核心理念。

这五条法则共同构成了一个创业的方法论框架。它不是公式,不能机械套用,但可以作为思考问题的起点。

每一个创业者都需要根据自己的情况,发展出适合自己的法则和框架。Minimax的经验是一个参考,但不是唯一的答案。

本章核心洞察

  1. 法则不是公式,而是思考的框架。 不能机械套用,但可以启发思考。

  2. 技术深度决定商业高度。 在AI时代,技术是核心体验、持久护城河和成本优势的来源。

  3. 用户共创是必要条件而非锦上添花。 最好的产品是与用户共同创造的,而非闭门设计的。

  4. 轻量化组织是创新的必要条件。 速度和灵活性比规模更重要。

  5. 开源与闭源可以辩证统一。 根据具体情况选择,不被教条束缚。

  6. 长期主义是生存策略而非道德选择。 在AI时代,短期主义是死路。

  7. 五条法则相互关联,构成完整的方法论框架。 技术是基础,用户是方法,组织是保障,开闭源是策略,长期主义是心法。


【本章完】


请输入"继续"以开始第十六章:创始人个人成长的底层逻辑

第十六章:创始人个人成长的底层逻辑

一、成长是创业的核心命题

创业的本质是什么?

很多人会回答:创造价值、解决问题、实现愿景、获取财富……

这些答案都对,但有一个更底层的答案:创业是创始人个人成长的过程。

公司的天花板就是创始人的天花板。

如果创始人的认知、能力、格局不能持续提升,公司的发展就会触顶。反之,如果创始人能够不断成长,公司就有可能突破一个又一个瓶颈。

闫俊杰的创业历程,就是一个持续成长的故事:

  • 从技术专家到创业者
  • 从管理者到领导者
  • 从执行者到战略家
  • 从个人贡献者到组织建设者

这些转变不是自然发生的,而是通过刻意的努力、痛苦的蜕变实现的。

理解创始人成长的底层逻辑,对于任何希望成长的人都有借鉴价值。

二、认知升级的三重境界

创始人的成长,首先体现在认知的升级。

借用禅宗的经典表述,认知升级可以分为三重境界:

第一重境界:见山是山

这是初级阶段的认知状态。

在这个阶段,创始人用单一维度理解问题。对于技术背景的创始人,这个维度通常是"技术"。

典型特征:

  • 相信技术可以解决一切问题
  • 用技术指标衡量成功
  • 对非技术因素(商业、组织、政治)不够重视
  • 决策依据主要是技术可行性

闫俊杰在商汤早期可能就处于这个阶段。作为一线研究员和技术管理者,他的关注点主要是:模型性能如何提升?技术难题如何攻克?

这个阶段的优势是专注——深入钻研一个领域,建立专业能力。

这个阶段的局限是狭隘——看不到技术之外的因素,对复杂系统的理解不足。

第二重境界:见山不是山

这是中级阶段的认知状态。

在这个阶段,创始人开始意识到事物的复杂性,发现"技术"只是众多维度之一。

典型特征:

  • 意识到技术不是万能的
  • 开始理解商业、组织、市场的重要性
  • 发现很多问题没有标准答案
  • 决策需要权衡多个维度

闫俊杰在商汤后期和Minimax早期可能经历了这个阶段。他开始看到:

  • 技术好不等于商业成功(商汤的商业化困境)
  • 个人能力强不等于团队成功(需要组织能力)
  • 做对事情不等于做成事情(需要执行和运营)

这个阶段的感受往往是困惑和迷茫——原来以为确定的东西变得不确定了,原来以为简单的问题变得复杂了。

但这种困惑是成长的必经阶段。只有承认不知道,才能开始真正的学习。

第三重境界:见山还是山

这是高级阶段的认知状态。

在这个阶段,创始人重新获得清晰和确定,但这种清晰是建立在对复杂性充分理解之上的。

典型特征:

  • 能够在复杂中看到简单的本质
  • 能够在众多维度中识别关键变量
  • 能够在不确定中保持坚定的方向
  • 决策既考虑多维度,又有清晰的优先级

闫俊杰在Minimax成熟期可能逐渐进入这个阶段:

  • 技术很重要,但最终服务于用户价值
  • 商业化很重要,但不能牺牲长期发展
  • 组织很重要,但保持轻量化
  • 竞争很重要,但走自己的路

这个阶段的特征是简洁而深刻。不是因为无知而简单,而是因为洞察而简单。

三重境界的转换不是一次性的,而是循环往复的。每进入一个新领域,都需要重新经历这个过程。

三、关键能力的养成

认知升级需要具体能力的支撑。创始人需要哪些关键能力?如何养成这些能力?

能力一:抽象能力

抽象能力是从具体现象中提取本质规律的能力。

为什么重要?

创业中遇到的问题千变万化,但底层的规律是有限的。能够抽象的人,可以举一反三,用有限的知识应对无限的情况。

闫俊杰的抽象能力来源:

数学训练:数学是抽象思维的最佳训练场。从公理出发推导定理,从具体数字抽象到代数符号,从二维空间推广到n维空间……

跨领域迁移:从数学到通信工程,从学术研究到产业应用,从技术管理到公司创业——每一次跨越都需要抽象出可迁移的原理。

刻意练习:面对任何问题,都习惯性地问:这个问题的本质是什么?和其他问题有什么共同点?有没有更一般的规律?

如何培养抽象能力:

  • 学习数学、逻辑学、系统论等基础学科
  • 阅读跨领域的书籍,寻找不同领域的共同规律
  • 养成"追问本质"的思维习惯
  • 尝试用简单的模型解释复杂的现象

能力二:共情能力

共情能力是理解他人感受和需求的能力。

为什么重要?

创业涉及大量的人际互动:理解用户需求、激励团队成员、说服投资人、与合作伙伴协作……共情能力是这些互动成功的基础。

闫俊杰的共情能力来源:

外公的故事:理解外公想写书却不会打字的遗憾,这是对"普通人需求"的深刻共情。

用户接触:持续与用户接触,阅读用户反馈,理解用户的真实痛点和期待。

团队互动:作为管理者,需要理解不同团队成员的动机和困难,因人而异地激励和支持。

如何培养共情能力:

  • 刻意地站在他人角度思考问题
  • 多与不同背景的人交流,扩大理解的范围
  • 阅读文学作品,体验不同人生
  • 练习倾听,而不是急于表达

能力三:抗压能力

抗压能力是在巨大压力下保持有效运作的能力。

为什么重要?

创业充满压力:融资压力、竞争压力、业绩压力、团队压力……如果无法承受压力,就无法走完创业的马拉松。

闫俊杰的抗压能力来源:

早年经历:在资源匮乏的县城成长,习惯了在困境中找到出路。

商汤历练:经历过商汤从创业到上市的完整周期,见过各种危机和挑战。

心理建设:建立了稳定的自我认知,知道自己为什么做这件事,知道困难是暂时的。

如何培养抗压能力:

  • 逐步增加挑战的难度,在压力中积累经验
  • 建立支持系统(家人、朋友、导师),在困难时获得支持
  • 培养健康的生活习惯,保持身心状态
  • 建立清晰的使命感,在困难时有锚定点

能力四:学习能力

学习能力是快速获取新知识、新技能的能力。

为什么重要?

AI领域变化极快,今天的先进技术明天就可能落后。如果不能持续学习,就会被时代淘汰。

闫俊杰的学习能力来源:

学术训练:从本科到博士后,十几年的学术训练养成了系统学习的习惯和能力。

跨界经历:从数学到通信到AI,从学术到产业,每一次跨越都是学习的过程。

主动态度:保持好奇心,主动追踪新技术、新趋势、新思想。

如何培养学习能力:

  • 建立持续学习的习惯(每天阅读、定期上课、参加活动)
  • 学习"如何学习"的方法论
  • 保持谦逊,承认不知道
  • 把每一次挑战都当作学习的机会

能力五:决策能力

决策能力是在不确定条件下做出有效选择的能力。

为什么重要?

创始人每天都要做大量决策。决策的质量直接决定公司的命运。

闫俊杰的决策能力来源:

决策实践:十几年的管理经历积累了大量决策经验。

系统框架:建立了系统的决策框架(技术可行性、商业可持续性、组织承载力、长期价值)。

反馈学习:对决策结果进行复盘,从对错中学习。

如何培养决策能力:

  • 刻意练习决策,即使是小事也认真分析
  • 建立决策框架,系统化地思考问题
  • 复盘决策结果,积累经验
  • 接受决策的不确定性,不追求完美

四、价值观的稳定性与适应性

创始人的成长不只是能力的提升,也涉及价值观的演变。

有趣的是,价值观的演变呈现出"稳定性与适应性"的辩证关系。

价值观中不变的部分

某些核心价值观从早年形成后就保持稳定,贯穿整个创业历程:

技术普惠的初心

从外公的遗憾到Minimax的愿景,"让AI帮助普通人"这个信念始终没变。

无论是做研究还是做产品,无论是在商汤还是在Minimax,这个初心是一贯的。

独立解决问题的精神

从县城少年到创业者,"靠自己想办法"的精神始终没变。

遇到困难不等待救援,而是主动寻找解决方案。

追求卓越的态度

从学术研究到公司管理,追求卓越的态度始终没变。

不满足于"够用",而是追求"最好"。

这些不变的价值观是闫俊杰的"锚"。无论外部环境如何变化,这些价值观提供了稳定的参照系。

价值观中变化的部分

另一些价值观随着经历和认知而演变:

对商业化的态度

早期可能更偏向"技术至上",认为商业化会损害技术纯粹性。

后来认识到商业化是技术价值实现的必要路径,态度变得更加务实。

对竞争的理解

早期可能更关注"自己做对",对竞争对手关注较少。

后来认识到竞争是市场的常态,需要持续关注和应对。

对组织的认知

早期可能更强调个人能力和技术团队。

后来认识到组织能力是公司发展的关键瓶颈。

这些变化的价值观反映了认知的升级和适应。

如何把握稳定与变化的平衡

核心价值观需要保持稳定,因为它们是身份认同和行动指南。如果核心价值观经常变化,就会失去方向。

但具体的态度和方法需要根据环境调整,因为外部世界在变化。如果一成不变,就会与现实脱节。

判断一个价值观是"核心"还是"边缘"的标准:

  • 核心价值观回答"我是谁"和"我为什么存在"
  • 边缘价值观回答"我如何做事"和"我如何应对特定情况"

核心价值观要稳定,边缘价值观要灵活。

五、成长的催化剂

成长不是匀速的,而是有加速期和平台期。

什么因素可以催化成长?

催化剂一:关键挑战

成长往往发生在面对重大挑战的时候。

对闫俊杰而言,几个关键挑战可能催化了显著成长:

  • 创业决定:离开商汤自立门户,迫使他从"执行者"转变为"创业者"
  • 融资过程:与投资人博弈,迫使他学会"讲故事"和"管理预期"
  • 团队管理:从几十人到几百人,迫使他学会"通过他人实现目标"
  • 外部冲击:DeepSeek的崛起,迫使他重新审视战略假设

挑战越大,成长越快。当然,挑战太大也可能导致失败。关键是找到"略超能力边界"的挑战。

催化剂二:关键反馈

成长需要反馈。没有反馈,就不知道自己做对了什么、做错了什么。

有效反馈的来源:

  • 市场反馈:产品的用户数据直接反映了决策的对错
  • 团队反馈:核心团队的坦诚意见揭示了领导力的问题
  • 投资人反馈:投资人的质疑逼迫更严格地审视假设
  • 竞争对手反馈:竞争对手的成功揭示了自己的盲区
  • 自我反馈:定期复盘反思自己的行为和决策

催化剂三:关键导师

导师可以显著加速成长。

导师的价值在于:

  • 分享经验,避免重复犯错
  • 提供视角,帮助看到盲区
  • 情感支持,在困难时给予鼓励
  • 网络资源,介绍有价值的连接

闫俊杰可能的导师来源:

  • 商汤时期的领导和同事
  • 投资人中的资深人士
  • 行业中的前辈企业家
  • 学术界的导师和同行

催化剂四:关键阅读

书籍是人类智慧的结晶,阅读是最高效的学习方式之一。

闫俊杰作为学术出身的创业者,阅读可能是其重要的成长来源:

  • 技术领域的最新论文和研究
  • 商业和管理的经典著作
  • 传记和历史,学习前人的经验
  • 哲学和思维方法论

催化剂五:关键失败

失败是最好的老师。

每一次失败都揭示了认知的盲区。如果能够认真反思,失败可以转化为成长。

关键是:

  • 承认失败,不找借口
  • 分析原因,不浮于表面
  • 提炼教训,形成原则
  • 应用改进,避免重蹈覆辙

六、成长的障碍

与催化剂相对的,是成长的障碍。识别这些障碍,才能有意识地克服。

障碍一:成功的陷阱

成功是最危险的障碍。

成功会强化既有认知:"我之所以成功,是因为我的判断是对的。"

这种强化会导致:

  • 过度自信,不再质疑假设
  • 路径依赖,用老方法应对新问题
  • 忽视变化,对环境变化反应迟钝

应对方法:

  • 始终保持"学生心态"
  • 主动寻找反对意见
  • 定期回顾成功的原因,区分能力与运气

障碍二:忙碌的陷阱

创业者总是很忙。

但忙碌可能成为不成长的借口:"我太忙了,没时间学习/反思/读书。"

实际上,越忙越需要成长。不成长,忙碌就会变成无效的重复。

应对方法:

  • 把学习和反思作为优先事项,而不是"有空再说"
  • 建立固定的学习时间(每天30分钟、每周半天)
  • 在忙碌中寻找学习机会(每个项目都是学习案例)

障碍三:舒适区的陷阱

人倾向于待在舒适区。

对技术背景的创始人,舒适区可能是技术工作。在那里,他们感到自信和掌控。

但成长发生在舒适区之外。不走出去,就无法获得新的能力。

应对方法:

  • 识别自己的舒适区边界
  • 刻意选择让自己不舒服的挑战
  • 接受不舒服是成长的正常代价

障碍四:孤独的陷阱

创始人往往很孤独。

这种孤独可能导致:

  • 没有人可以坦诚交流困惑
  • 没有人提供不同视角
  • 没有人给予情感支持

应对方法:

  • 建立支持网络(同行创业者、导师、教练)
  • 参加创业者社群
  • 与家人和朋友保持连接

七、成长的心法

最后,提炼几条成长的心法:

心法一:相信可成长性

成长的前提是相信自己可以成长。

有些人持"固定心态"——相信能力是固定的,聪明就是聪明,笨就是笨。

有些人持"成长心态"——相信能力可以通过努力发展,今天不会的明天可以学会。

研究表明,持成长心态的人更愿意接受挑战、更能从失败中学习、最终成长更快。

心法二:拥抱不舒服

成长必然伴随不舒服。

学习新东西意味着承认无知,接受挑战意味着可能失败,走出舒适区意味着感受不适。

不要逃避这种不舒服,而是把它当作成长的信号。

心法三:持续而非间歇

成长是一个持续的过程,而非间歇的事件。

不是"等有空了再学习",而是"每天都在学习"。

不是"遇到问题再反思",而是"持续地反思"。

小步累积,日积月累。

心法四:整合而非割裂

成长不是抛弃旧的自己,而是整合新的能力。

技术能力不需要被抛弃,而是要与商业能力、组织能力整合。

早年的价值观不需要被否定,而是要与新的认知整合。

整合创造了更丰富、更有层次的能力结构。

心法五:服务于使命

成长不是目的本身,而是服务于更大使命的手段。

闫俊杰的成长服务于"让AI普惠大众"的使命。

这种使命导向让成长有了方向和意义,也让成长有了持续的动力。

本章核心洞察

  1. 创业的本质是创始人的成长。 公司的天花板就是创始人的天花板。

  2. 认知升级经历三重境界:见山是山、见山不是山、见山还是山。 从简单到复杂,再从复杂中看到简单的本质。

  3. 关键能力包括:���象能力、共情能力、抗压能力、学习能力、决策能力。 这些能力都可以通过刻意练习来培养。

  4. 价值观需要平衡稳定性与适应性。 核心价值观保持稳定,边缘价值观灵活调整。

  5. 成长的催化剂:关键挑战、关键反馈、关键导师、关键阅读、关键失败。 这些因素可以加速成长。

  6. 成长的障碍:成功的陷阱、忙碌的陷阱、舒适区的陷阱、孤独的陷阱。 识别并有意识地克服这些障碍。

  7. 成长的心法:相信可成长性、拥抱不舒服、持续而非间歇、整合而非割裂、服务于使命。 这些心法指导成长的过程。


【本章完】


请输入"继续"以开始第十七章:对年轻创业者与技术人才的启示

第十七章:对年轻创业者与技术人才的启示

一、写给想要创业的你

如果你正在考虑创业,或者已经在创业的路上,闫俊杰的经历可以提供一些有价值的参考。

但首先要声明:没有人的经历可以被复制

闫俊杰的成功源于他独特的背景、时机、能力和选择的组合。你有你自己的背景、时机、能力和选择。你需要找到属于自己的道路。

以下的建议不是"成功公式",而是"思考的起点"。

建议一:先深后广——建立技术护城河再谈商业化

很多创业者有一种冲动:想要快速做出产品、快速获取用户、快速实现盈利。

这种冲动是可以理解的——创业有时间窗口,资金会耗尽,投资人会施压。

但在AI时代,过早追求商业化可能是一个陷阱。

为什么?

AI产品的核心价值来自于模型能力。如果模型能力不够强,产品体验就会很差。用户可能会因为好奇尝试一下,但不会留下来。

更重要的是,AI领域的竞争最终是技术的竞争。如果技术不够深,当竞争对手用更强的技术进入时,你会毫无还手之力。

Minimax的做法是:

从一开始就把技术深度作为战略核心。选择MoE这样的前沿架构,坚持多模态布局,持续投入基础研究——即使这些在短期内看不到商业回报。

这种"先深后广"的策略在早期可能显得"慢",但它建立了真正的技术壁垒。当产品推向市场时,技术优势转化为用户体验的优势,转化为持久的竞争力。

对你的启示:

  • 不要急于追求商业化,先问自己:我的核心技术优势是什么?
  • 在最核心的技术领域追求深度,而不是在多个领域追求广度
  • 抵制"快速变现"的诱惑,这种诱惑往往以牺牲长期竞争力为代价
  • 找到愿意等待的投资人,而不是催促你快速变现的投资人

建议二:用户为师——让真实需求驱动技术方向

技术人员创业有一个常见的陷阱:用技术思维定义问题

"我有一个很酷的技术,找个场景应用一下。"

这种思路的问题在于:技术很酷不等于用户需要。很多技术上令人惊叹的产品,用户根本不买账。

正确的思路是:从用户需求出发,用技术来满足需求。

这需要一种"谦逊"的态度——承认自己不知道用户需要什么,需要去了解、去验证。

Minimax的做法是:

建立用户共创的机制:

  • 在产品规划阶段就征求用户意见
  • 快速发布MVP,收集真实反馈
  • 持续监控用户行为数据
  • 建立活跃的用户社区

Talkie的成功不是因为团队事先知道"AI社交"是正确的方向,而是通过不断地尝试和迭代,发现了这个被忽视的需求。

对你的启示:

  • 放下"我知道用户需要什么"的假设,真正去倾听用户
  • 尽早让用户接触产品,即使产品还不完善
  • 把用户反馈当作最重要的信息来源
  • 愿意根据用户反馈调整方向,即使这意味着放弃之前的假设
  • 记住:用户不是来买技术的,他们是来解决问题的

建议三:组织先行——在扩张前建立可复制的创新机制

创业公司的成长往往遵循这样的模式:

早期,几个创始人凭借个人能力创造奇迹。

中期,团队扩大,但组织能力跟不上,出现混乱和低效。

后期,要么建立起组织能力,要么在混乱中衰落。

很多公司在第二阶段就栽了跟头。

为什么会这样?

因为个人能力是不可扩展的,但组织能力是可以扩展的。

当公司只有10个人时,创始人可以事事亲力亲为。当公司有100个人时,这就不可能了。如果没有建立起组织机制,公司就会陷入"创始人瓶颈"。

Minimax的做法是:

从早期就有意识地建立组织机制:

  • 轻量化组织结构,避免官僚化
  • 数据驱动的决策方式,减少主观臆断
  • 清晰的人才标准,确保招聘质量
  • 坦诚直接的文化,让问题能够浮出水面

这些机制不是等公司变大后再建立的,而是从一开始就在打造的。

对你的启示:

  • 不要等公司变大后才考虑组织问题,从第一天就开始建立好的习惯
  • 建立可复制的机制,而不是依赖不可复制的个人能力
  • 在招聘时就考虑候选人能否融入团队,而不只是个人能力
  • 有意识地培养未来的领导者,而不是把所有决策都留给自己
  • 定期审视组织是否健康,及早发现和解决问题

二、写给技术从业者的你

如果你是一个技术从业者,正在考虑自己的职业发展,闫俊杰的经历也有一些启示。

启示一:在AI时代,技术深度比广度更重要

技术领域有一个永恒的争论:应该做"全栈工程师",还是做"领域专家"?

这个问题没有绝对的答案,但在AI时代,深度的价值在上升

为什么?

AI是一个复杂的领域。从数学基础到模型架构,从训练技术到推理优化,从数据工程到产品应用——每一个环节都有大量的know-how。

表面上了解一点AI的人很多,但真正深入理解的人很少。这种深度的稀缺性,决定了它的价值。

更重要的是,AI的发展速度极快。如果只是浅尝辄止,今天学的知识明天就过时了。只有深入到底层原理,才能应对变化。

闫俊杰的路径是:

从数学本科开始,到通信工程硕士,到模式识别博士,到清华博后——每一步都在加深对智能系统的理解。

在商汤的七年,不是频繁换方向,而是在AI领域持续深耕。

这种深度的积累,让他在创业时有了技术判断力,能够做出正确的技术选择(如MoE架构)。

对你的启示:

  • 选择一个有长期价值的领域,深入钻研
  • 不要被"新技术"带着跑,先把基础打扎实
  • 建立从理论到工程的完整能力,而不只是会用工具
  • 技术深度是职业的护城河,值得持续投入

启示二:理解商业——技术价值需要商业闭环来验证

很多技术人员有一种倾向:专注于技术本身,忽视商业价值

"我的算法效果很好"——但用户愿意付费吗?

"我的系统很优雅"——但能解决商业问题吗?

"我的论文发了顶会"——但能转化为产品吗?

这种倾向在学术界可能没问题,但在产业界会成为瓶颈。

为什么理解商业很重要?

技术的价值最终需要通过商业来实现。一个无法商业化的技术,无论多么精妙,对公司来说都是成本,而不是资产。

更重要的是,商业视角可以帮助你做出更好的技术选择。当你理解了用户需求和商业模式,你就能判断哪些技术问题真正重要,哪些只是"有趣但不必要"。

闫俊杰的转变是:

从学术研究者到产业技术专家,再到创业者,他逐渐发展出商业思维。

"技术先进性不等于商业成功"——这个认知来自于商汤的经历。

"错误率是AI产品的生命线"——这个判断来自于对用户体验的理解。

对你的启示:

  • 了解你所在公司的商业模式,理解技术如何创造商业价值
  • 与产品、销售、运营等非技术部门交流,理解他们的视角
  • 阅读商业书籍和案例,培养商业直觉
  • 思考:我的技术工作如何帮助公司赚钱?如何为用户创造价值?

启示三:保持耐心——AGI是马拉松,不是百米冲刺

AI领域充满了炒作和焦虑:

"某某公司融了巨额资金,我是不是落后了?"

"某某模型刷新了记录,我的研究是不是没用了?"

"某某热点出现了,我是不是应该跟进?"

这种焦虑可以理解,但往往是有害的。

为什么需要耐心?

AGI的实现是一个长期过程。虽然近年来进展迅速,但离真正的通用智能还有很长的路。

在这个过程中,最终胜出的不是跑得最快的人,而是跑得最稳、最持久的人。

追逐热点会消耗精力,频繁换方向会失去积累,焦虑会影响判断。

闫俊杰的态度是:

长期主义。

不追逐热点,坚持自己的技术路线。

不被短期噪音干扰,专注于长期价值。

"坚持创新而非短期变现"——这个原则指导了Minimax的战略。

对你的启示:

  • 不要被每天的新闻带着跑,保持长期视角
  • 选择有持久价值的方向,持续深耕
  • 建立自己的判断力,而不是随波逐流
  • 接受成长需要时间,不要期望一夜成功
  • 把注意力放在自己能控制的事情上(学习、工作质量),而不是不能控制的事情上(市场波动、他人评价)

三、写给年轻AI研究者的你

如果你是一个AI研究者,无论在学术界还是产业界,有一些更具体的建议。

建议一:关注错误率——从追求SOTA到追求可用性

学术界的成功标准是"SOTA"(State of the Art)——在某个benchmark上刷出最高的分数。

这个标准有其价值,但也有局限。

局限在哪里?

Benchmark不等于真实场景。一个模型在ImageNet上表现优秀,放到真实环境中可能一塌糊涂。

Benchmark会被"过拟合"。当所有人都在刷同一个benchmark时,模型可能变成了"benchmark解题机",而非真正的智能。

更重要的是,用户不关心你的排名,用户关心你的产品能不能用

闫俊杰的关注点是:

错误率。

"当前大模型的错误率大概在20-30%左右。我们的目标是把错误率降低一个数量级。"

这个指标直接关系到用户体验。如果每三五次使用就出一次错,用户怎么敢信任?

对你的启示:

  • 不要只追求benchmark分数,思考真实场景中的表现
  • 关注模型的"下限"(最差情况)而不只是"上限"(最好情况)
  • 研究如何降低错误率、提高可靠性,这可能比提高SOTA更有价值
  • 尝试在真实场景中测试你的研究,而不只是在实验室环境中

建议二:拥抱多模态——未来属于理解真实世界的研究

当前AI研究的主流是单模态的:语言模型处理文本,视觉模型处理图像,语音模型处理音频……

但真实世界是多模态的。人类同时使用视觉、听觉、语言来理解世界。

为什么多模态重要?

单模态的AI只能理解世界的一个切片。它可能在特定任务上表现出色,但缺乏对世界的整体理解。

真正的通用智能必须是多模态的。它需要能看、能听、能说、能读——并且能够整合这些信息。

多模态也是应用的需要。用户与AI交互的方式越来越多样:语音、图像、视频……单模态的系统无法满足这些需求。

Minimax的布局是:

从一开始就坚持多模态:文本到文本、文本到语音、文本到视觉……

"三位一体"的技术架构:语言模型核心、感知模块、生成模块。

这种布局让Minimax的产品能够提供差异化的用户体验。

对你的启示:

  • 如果你在单模态领域工作,考虑扩展到多模态
  • 关注模态融合的研究,这是前沿也是难点
  • 思考如何让AI更完整地理解真实世界,而不只是特定类型的数据
  • 多模态研究有更大的应用潜力,值得投入

建议三:思考技术平权——AGI的终极形态

AI研究的最终目的是什么?

不同的人有不同的回答。有人说是创造智能,有人说是理解大脑,有人说是推动科学……

闫俊杰的回答是:让AI普惠大众

这个回答有深刻的价值观内涵。它意味着AI不应该只服务于精英,而应该帮助每一个普通人。

为什么技术平权重要?

历史上,很多技术最初都是精英的玩具,后来才普及到大众:电脑、手机、互联网……

但技术从精英到大众的过程往往很长。如果研究者不主动考虑普惠性,技术可能长期停留在"少数人的工具"阶段。

更重要的是,技术平权是AI的社会责任。AI可能是人类历史上最强大的技术之一。如果这种技术只服务于少数人,将加剧不平等。如果它能服务于所有人,将带来巨大的社会价值。

对你的启示:

  • 在研究中考虑:这项技术如何帮助普通人?
  • 关注降低技术门槛的研究:更低的成本、更简单的使用方式
  • 思考开源的价值:开源可以加速技术的普及
  • 考虑AI的社会影响,而不只是技术指标
  • 记住:最有价值的研究,是那些能够改变普通人生活的研究

四、普遍性的人生建议

最后,分享一些超越创业和技术的普遍性人生建议。这些建议来自于对闫俊杰经历的反思,但适用于任何追求成长的人。

建议一:找到你的"外公故事"

闫俊杰的创业初心来自于一个私人故事:外公想写书却不会打字的遗憾。

这个故事不是抽象的理念,而是具体的画面、真实的情感。它提供了持久的动力和清晰的方向。

你有这样的故事吗?

每个人都应该追问:是什么驱动着我?我为什么做这件事?

答案可能是一个童年经历,一次触动心灵的事件,一个你想帮助的人……

找到这个故事,它会成为你最深层的动力来源。

建议二:选择略超能力边界的挑战

成长发生在舒适区之外。

但如果挑战太大,会导致失败和挫败感。如果挑战太小,无法带来成长。

最佳的状态是:挑战略超出当前能力边界

这意味着:会感到不舒服,但可以应对。会遇到困难,但可以克服。

如何找到这种挑战?

  • 主动寻求新的项目和责任
  • 不要等着被分配,主动争取机会
  • 当机会来临时,不要因为"可能做不好"而拒绝
  • 相信自己可以在过程中学习和成长

建议三:建立你的支持系统

创业是孤独的,成长也是艰难的。

没有人能独自完成这一切。你需要支持系统:

  • 导师:能够指引方向、分享经验
  • 同行:能够相互学习、相互鼓励
  • 家人朋友:能够提供情感支持
  • 社区:能够获取资源、扩大网络

如何建立支持系统?

  • 主动寻找导师,不要等着别人来指导你
  • 参与专业社区,与同行建立联系
  • 维护与家人朋友的关系,不要因为忙碌而忽视
  • 愿意帮助别人,支持是相互的

建议四:保持"学生心态"

成功是成长的最大敌人。

一旦成功,人就容易变得封闭:相信自己的判断,不再质疑假设,不再接受新观点。

对抗这种趋势的方法是:始终保持学生心态

学生心态意味着:

  • 承认自己不知道的比知道的多
  • 对新知识保持好奇和开放
  • 愿意向任何人学习,无论他们的地位
  • 把每一次经历都当作学习的机会

闫俊杰至今仍在学习。DeepSeek的冲击让他重新审视对开源和效率的认知。他没有因为自己是创始人就停止学习。

建议五:长期思考,短期行动

这是长期主义的操作化表达。

长期思考意味着:

  • 有清晰的长期目标和愿景
  • 用长期价值来评判决策
  • 不被短期波动带偏

短期行动意味着:

  • 每天都在朝目标前进
  • 快速执行,快速迭代
  • 不空想,用行动来验证

两者的结合是:用长期目标指引方向,用短期行动积累进展

这比"只看长期不做短期"或"只做短期不看长期"都更有效。

五、最后的话

创业是一场冒险,成长是一生的旅程。

闫俊杰的故事提供了一个参考,但不是模板。

每个人都有自己的故事要写。你的背景、你的能力、你的时机、你的选择,都是独特的。

从他人的经历中,提取智慧;在自己的道路上,创造未来。

祝你在这场旅程中,找到属于你的意义。

本章核心洞察

  1. 对创业者:先深后广、用户为师、组织先行。 这三条建议涵盖了技术、产品和组织三个关键维度。

  2. 对技术从业者:技术深度、商业理解、保持耐心。 这三条建议帮助技术人员在职业发展中做出更好的选择。

  3. 对AI研究者:关注错误率、拥抱多模态、思考技术平权。 这三条建议指向有更大价值和影响力的研究方向。

  4. 普遍性建议:找到你的故事、选择合适的挑战、建立支持系统、保持学生心态、长期思考短期行动。 这些建议适用于任何追求成长的人。

  5. 每个人的道路都是独特的。 从他人经历中提取智慧,但在自己的道路上创造未来。


【本章完】


请输入"继续"以开始第十八章:对未来的理性判断

第十八章:对未来的理性判断

一、预测的局限与价值

在探讨未来之前,必须诚实地承认:预测未来是困难的,甚至是不可能的。

历史上充满了失败的预测:

  • 1943年,IBM主席托马斯·沃森说:"全世界可能只需要五台计算机。"
  • 1995年,以太网发明者罗伯特·梅特卡夫预言互联网将在1996年崩溃。
  • 2007年,微软CEO史蒂夫·鲍尔默说:"iPhone没有机会获得显著的市场份额。"

这些失败的预测来自于那个时代最聪明、最有经验的人。如果他们都会错,我们凭什么相信自己的预测是正确的?

然而,放弃预测也是不明智的。

创业需要对未来有判断。投资需要对趋势有预期。职业规划需要对市场有认知。

正确的态度是:做出预测,但保持谦逊。承认不确定性,但在不确定中行动。

本章的目的不是给出确定的答案,而是提供思考未来的框架。这些判断可能对,可能错,但思考的过程本身是有价值的。

二、AI技术趋势:三个时间尺度的展望

短期(2026-2028):错误率降低,应用规模扩大

在未来两到三年内,AI技术最显著的进步可能不在于"能力上限"的提升,而在于"可靠性"的改善。

错误率降低一个数量级

闫俊杰曾预测:"我们的目标是把错误率降低一个数量级,从20-30%降到2-3%。"

这个目标在短期内有望实现。技术路径包括:

  • 更好的训练数据:减少噪音,增加高质量来源
  • 更强的推理能力:增强模型的逻辑一致性和事实核查能力
  • 人机协作:在高风险场景中引入人类审核
  • 专业化优化:针对特定领域进行深度调优

当错误率降到个位数时,AI在很多场景下将变得"可信赖"。这将打开大量之前无法触及的应用场景。

应用规模扩张两个数量级

当前AI应用的用户主要是早期采用者和技术爱好者。当可靠性提升后,主流用户将开始接受AI。

应用规模可能从当前的千万级扩张到十亿级。这不只是用户数量的增长,也是使用深度的增加——从"偶尔尝试"变为"日常依赖"。

商业模式成熟

短期内,AI商业模式将逐渐成熟:

  • 订阅制成为主流变现方式
  • 垂直行业解决方案出现更多成功案例
  • ToB和ToC市场都找到可持续的商业模式
  • 价格战趋于理性,市场进入稳定增长期

中期(2029-2032)���多模态融合成熟,AI能力接近普通个体

在五到八年的时间尺度上,更深刻的变化将发生。

真正的多模态AI

当前的多模态AI还���于早期阶段。不同模态的融合往往是"拼接式"的,而非真正的"理解式"。

中期内,多模态融合将走向成熟:

  • AI能够像人类一样自然地整合视觉、听觉、语言信息
  • 模态之间的推理和迁移能力大幅提升
  • 真正理解物理世界的常识(物体会掉落、液体会流动……)
  • 能够与物理环境进行复杂交互

AI能力接近普通个体

在很多认知任务上,AI的能力将接近甚至超过普通人:

  • 写作:能够产出专业级别的文章、报告、创意内容
  • 编程:能够独立完成中等复杂度的软件开发
  • 分析:能够处理复杂的数据分析和商业决策支持
  • 创作:能够进行高质量的艺术创作(绘画、音乐、视频)
  • 对话:能够进行深度的、有洞察力的对话

这不意味着AI会在所有方面超越人类,但在日常任务上,AI将成为强大的助手甚至替代者。

深刻的社会影响

当AI能力达到这个水平时,社会影响将变得深刻:

  • 很多工作岗位面临转型或消失
  • 教育模式需要根本性的变革
  • 创意产业的生产方式发生变化
  • 人机关系需要重新定义

这些变化将带来机遇,也带来挑战。社会需要做出调整和准备。

长期(2033+):AGI实现的可能性

在十年以上的时间尺度上,最大的不确定性是:AGI是否会实现?

什么是AGI?

AGI(Artificial General Intelligence,通用人工智能)是指能够在所有认知任务上达到或超越人类水平的AI系统。

当前的AI是"专用智能"——在特定任务上很强,但缺乏通用性。AGI则是真正的"通用智能"——能够像人类一样学习任何新任务。

AGI实现的乐观预期

乐观者认为,AGI可能在2030年代实现。

理由包括:

  • 规模效应(Scaling Laws)似乎没有触顶
  • 算力仍在快速增长
  • 大模型展现了涌现能力(Emergent Abilities)
  • 研究者的能力和资源在快速积累

如果这种预期成真,AGI将成为人类历史上最重要的发明之一。它将彻底改变经济、社会、甚至人类的自我认知。

AGI实现的谨慎预期

谨慎者认为,AGI的实现还很遥远。

理由包括:

  • 当前AI缺乏真正的"理解",只是模式匹配
  • 规模效应可能在某个点饱和
  • 一些关键能力(常识推理、因果理解)进展缓慢
  • 计算资源和能源限制可能成为瓶颈

如果这种预期正确,AGI可能需要根本性的技术突破,而非当前路线的延续。

不确定性中的准备

无论AGI何时实现,为这种可能性做准备是明智的:

  • 技术层面:继续推进基础研究,探索不同的技术路线
  • 社会层面:开始讨论AGI的伦理、监管和治理问题
  • 个人层面:发展那些AI难以替代的能力

三、中国AI的全球坐标

中国AI在全球竞争中处于什么位置?有什么优势和劣势?

优势分析

用户规模

中国有超过10亿互联网用户,是全球最大的单一数字市场。

庞大的用户规模意味着:

  • 丰富的数据来源
  • 多样的应用场景
  • 快速的反馈迭代
  • 规模化变现的可能

应用场景

中国社会的数字化程度很高,从移动支付到电子商务,从社交网络到短视频——这些场景都是AI应用的沃土。

更重要的是,中国用户对新技术的接受度很高,愿意尝试新产品。这为AI应用提供了良好的市场环境。

人才储备

中国拥有大量的AI人才,尤其是在工程实现方面。

每年有大量的计算机和数学专业毕业生,有完善的人才培养体系,有吸引海外人才回流的政策和机会。

产业生态

中国有完整的产业链:从芯片制造到云计算,从数据服务到应用开发。虽然在某些环节有短板,但整体生态是完善的。

劣势分析

算力芯片

这是最明显的短板。

高端AI芯片被英伟达等美国公司垄断,而中美科技脱钩导致供应不确定。虽然国产替代在推进,但短期内差距仍然存在。

算力限制可能影响训练大规模模型的能力,迫使中国公司更加注重效率优化。

基础理论

在基础理论研究方面,中国与美国仍有差距。

Transformer、GPT、Diffusion等关键突破大多来自美国。中国在应用和工程上很强,但在原创性理论上还需要更多积累。

高端人才

虽然中国有大量AI人才,但顶尖研究者仍相对稀缺。

很多华人顶尖研究者在美国工作。虽然人才回流趋势存在,但整体上高端人才仍然是短板。

机会分析

开源生态

DeepSeek的成功展示了开源模式的可能性。

通过积极参与开源生态,中国公司可以:

  • 获取最新的技术成果
  • 建立国际影响力
  • 吸引全球开发者
  • 减少对封闭技术的依赖

垂直应用

在垂直应用领域,中国有独特的机会。

中国市场有独特的需求:中文处理、本地化场景、特定行业的痛点……这些领域是中国公司的主场。

通过在垂直领域建立优势,可以积累技术和经验,逐步拓展到更广阔的市场。

技术普惠

"技术普惠"可能成为中国AI的差异化方向。

与硅谷"技术垄断"的倾向不同,中国有机会探索"技术普惠"的模式——让AI更加平民化、更加普及、更加服务于大众。

这既是商业机会,也是社会价值。

挑战分析

地缘政治

中美科技脱钩是最大的外部挑战。

芯片供应、技术交流、人才流动、海外市场——所有这些都可能受到地缘政治的影响。

这种不确定性需要被纳入战略规划中。

监管不确定性

中国的AI监管环境仍在演变中。

这种不确定性给公司带来挑战:合规成本增加、产品迭代受限、商业模式受影响。

但从长远看,合理的监管也有助于行业健康发展。

资本耐心

AI是长周期的事业,需要资本的耐心。

当前的资本环境冷热不均。在热潮时,估值泡沫;在寒冬时,融资困难。

能够穿越周期的公司,需要找到有耐心的资本。

四、Minimax的未来可能

基于前面的分析,Minimax的未来有几种可能的情景:

乐观情景:成为全球前五的AGI公司

在最乐观的情景下:

  • Minimax的技术持续领先,在多模态和效率方面建立全球优势
  • Talkie和其他产品在全球市场取得巨大成功,用户规模达到数亿
  • 商业化健康发展,实现大规模盈利
  • 在AGI的竞赛中占据领先位置

这种情景需要多个因素的配合:技术突破、市场成功、竞争胜出、政策支持……

基准情景:在C端AI应用领域占据领先地位

在基准情景下:

  • Minimax成为中国领先的C端AI应用公司
  • 在全球市场某些区域和细分领域建立优势
  • 多模态能力成为核心差异化
  • 实现健康的盈利,但规模不及巨头

这种情景比较现实,需要公司持续执行正确的战略。

悲观情景:在竞争中落后或转型

在悲观情景下:

  • 技术优势被竞争对手追平或超越
  • 商业化进展不及预期,资金压力增大
  • 在算力和人才方面面临严重制约
  • 可能被并购或被迫转型

这种情景也是可能的,尤其是如果外部环境恶化或内部执行出现问题。

情景的决定因素

最终落入哪种情景,取决于几个关键因素:

技术创新能力:能否持续在技术上保持领先?能否应对DeepSeek等竞争对手的挑战?

商业化效率:能否将技术优势转化为商业成功?能否找到可持续的盈利模式?

组织执行力:能否保持高效的组织运转?能否吸引和留住顶尖人才?

外部环境:地缘政治、监管政策、资本市场——这些外部因素如何演变?

这些因素有些是可控的,有些是不可控的。Minimax能做的是:做好可控的部分,对不可控的部分做好准备和对冲。

五、时代启示:我们正在见证什么

站在2025年回望过去、展望未来,我们正在见证什么?

技术民主化的进程

DeepSeek的成功证明了一个重要的趋势:AI技术正在民主化

曾经,训练顶级大模型被认为需要数亿美元的投入,只有少数巨头玩得起。DeepSeek用600万美元的成本打破了这个神话。

这意味着:

  • 更多的公司和个人可以参与AI创新
  • 技术的门槛在降低
  • 竞争将更加激烈,也更加公平
  • 创新的来源将更加多元

中国路径的探索

与硅谷的"技术垄断"模式不同,中国AI公司正在探索不同的路径:

  • DeepSeek的全面开源
  • Minimax的"技术普惠"愿景
  • 更加注重应用场景的本地化

这种"中国路径"可能成为全球AI发展的一个重要分支。

个人使命的时刻

最重要的启示可能是:在AGI时代,每个技术从业者都有机会参与历史

这不是一个普通的技术时代。AI可能成为人类历史上最重要的技术突破。

参与这个时代的人——无论是研究者、工程师、创业者还是投资人——都有机会对历史产生影响。

这是一种责任,也是一种机遇。

闫俊杰的选择

闫俊杰在2021年做出了他的选择:离开商汤,创立Minimax,追求"让AI普惠大众"的愿景。

这个选择不是必然的。他完全可以选择留在商汤,享受更稳定的生活。

但他选择了更难的路。为什么?

因为他看到了一个时代的机遇,看到了一个改变世界的可能。他不愿意错过这个机会。

你的选择

你的选择是什么?

你可能不会创业,可能不会成为创始人。但你仍然有选择:

  • 在什么领域深耕?
  • 为什么样的使命工作?
  • 如何发挥自己的价值?
  • 如何参与这个时代?

这些选择没有标准答案,但值得认真思考。

六、给未来的一封信

在本章的结尾,让我们写一封给未来的信:


致十年后的读者:

你正在阅读的这本书,写于2025年。那是一个AI快速发展的年代——ChatGPT刚刚问世两年多,大模型竞争如火如荼,每个月都有新的突破和变化。

我们不知道十年后的世界是什么样子。也许AGI已经实现,也许还在路上。也许Minimax成为了伟大的公司,也许已经成为历史。也许AI让世界变得更好,也许带来了我们今天无法想象的问题。

但有些事情我们相信是不变的:

技术应该服务于人。 无论AI发展到什么程度,它的价值最终要通过帮助人来实现。

长期主义终将获胜。 追逐热点的会被淘汰,坚持长期价值的会存活下来。

人的成长是一切的基础。 公司的天花板是创始人的天花板,时代的高度是个人成长的高度。

我们希望这本书能够提供一些有价值的参考,无论是关于创业、关于技术、还是关于人生。

但更重要的是,我们希望你在阅读之后,能够做出自己的思考和选择。

你的时代,你的故事,由你来书写。

祝你一切顺利。

2025年的作者


本章核心洞察

  1. 预测是困难的,但思考未来是必要的。 保持谦逊,但在不确定中行动。

  2. AI技术趋势:短期错误率降低、中期多模态成熟、长期AGI可能。 这些趋势将深刻影响社会。

  3. 中国AI的优势在于用户规模和应用场景,劣势在于芯片和基础理论。 开源生态和垂直应用是重要机会。

  4. Minimax的未来有多种可能,取决于技术创新、商业化效率、组织执行力和外部环境。

  5. 技术民主化正在进行,中国路径正在探索。 这是一个每个人都可以参与历史的时代。

  6. 最重要的问题是:你的选择是什么? 在这个时代,你将如何发挥自己的价值?


【第五编完】


请输入"继续"以开始附录部分

附录


附录一:Minimax技术演进时间线

2021年:创业起步

2021年11月

  • Minimax正式注册成立
  • 创始团队主要来自商汤科技
  • 确立"让AI普惠大众"的企业愿景
  • 选定MoE(混合专家模型)作为核心技术架构
  • 开始多模态技术布局

2021年12月

  • 完成天使轮融资
  • 核心研发团队搭建完成
  • 启动首个大语言模型训练项目
  • 确立"技术与产品并重"的战略方向

2022年:技术验证

2022年上半年

  • 完成首个MoE架构大模型的训练
  • 克服MoE工程实现中的负载均衡和训练稳定性问题
  • 开始多模态数据收集和处理工作
  • 启动语音合成和语音识别模块研发

2022年下半年

  • abab 6发布——国内首个基于MoE架构的大语言模型
    • 验证了MoE在中文大模型中的可行性
    • 为后续产品开发奠定技术基础
  • 启动C端产品开发
  • 完成A轮融资
  • 团队规模扩展至百人级别

2023年:产品突破

2023年第一季度

  • ChatGPT引爆全球市场,AI行业进入高速发展期
  • 加速模型迭代,提升基础能力
  • 星野产品立项,定位AI陪伴应用

2023年第二季度

  • 星野内测版本上线
  • Talkie项目启动,目标海外市场
  • 多模态能力整合进入产品

2023年第三季度

  • 海螺AI发布,展示多模态交互能力
  • Talkie在海外市场上线
  • 语音交互能力达到商用水平

2023年第四季度

  • abab 6.5发布——万亿参数规模模型
    • 参数量达到万亿级别
    • 性能在多个评测中达到国际领先水平
    • 验证了Scaling Laws在更大规模上的有效性
  • Talkie在海外市场快速增长
  • 完成A+轮融资,估值达到25亿美元

2024年:商业化加速

2024年第一季度

  • Talkie月活用户突破500万
  • 启动线性注意力机制研发
  • 与高济健康合作,推出"高济神农"AI诊疗辅助系统

2024年第二季度

  • 线性注意力机制取得突破
  • 推理效率提升20%以上
  • 开发者工具套件发布
  • API注册用户快速增长

2024年第三季度

  • MiniMax-01系列模型发布
    • 首次大规模应用线性注意力机制
    • 在保持性能的同时显著降低成本
  • Talkie累计用户突破1000万
  • 错误率持续降低

2024年第四季度

  • Talkie年收入突破7000万美元
  • 业务覆盖157个国家和地区
  • 被量子位智库列入中国AI大模型"6+2"格局
  • 多模态能力进一步增强

2025年:战略深化

2025年1月

  • DeepSeek-R1发布,开源模式引发行业震动
  • 内部启动效率优化专项
  • 重新评估开源与闭源策略

2025年第一季度

  • 完成对DeepSeek技术路线的研究
  • 启动训练效率大幅优化项目
  • Talkie用户持续增长

2025年6月

  • 技术产品"五连发"
    • 新一代基座模型
    • 多模态大模型升级
    • 智能体(Agent)平台
    • 开发者工具套件升级
    • 企业解决方案升级
  • 展示公司全面的技术储备

2025年下半年

  • 战略聚焦:Talkie和海外市场作为核心
  • 效率优化取得显著成效
  • 组织架构优化
  • 为下一阶段发展做准备

技术里程碑总结

时间 里程碑 意义
2021.11 公司成立 开启创业之旅
2022 abab 6发布 国内首个MoE大语言模型
2023 星野、海螺AI上线 C端产品突破
2023 Talkie上线 海外市场布局
2023 abab 6.5发布 万亿参数突破
2024 MiniMax-01发布 线性注意力创新
2024 Talkie 7000万美元收入 商业化验证
2025.06 五连发 全面技术展示

附录二:闫俊杰关键访谈语录精选

关于AGI愿景

"AI应该成为日常生活的一部分,成为普惠大众的生产力。"

这句话揭示了闫俊杰创业的核心动机:不是为了技术本身,而是为了让技术帮助普通人。

"我外公是一位想写书的老人,但他不会打字。我小时候就在想,如果有一个AI能帮他,那该多好。"

外公的故事是闫俊杰技术普惠信念的具体起源,也是他持续前行的动力来源。

"真正的AGI必须是多模态的。一个只能处理文本的AI,无论文本能力多么强大,都无法称为AGI。"

这句话解释了Minimax为什么从一开始就坚持多模态布局。


关于竞争

"我骨子里是一个期待跟王者一决高下的人。"

这句话揭示了闫俊杰内心深处的竞争欲望——不是为了金钱或名声,而是纯粹的"想要赢"。

"中国AI企业可以引领世界巨头。"

这不是空洞的民族主义口号,而是对目标的清晰定义:不是追赶,不是模仿,而是引领。

"竞争对手不是敌人,而是老师。他们的成功值得学习,他们的失败值得警醒。"

这句话展示了闫俊杰对竞争的成熟态度:尊重对手,从对手身上学习。


关于商业化

"商业化不是当前最重要的关注点。我们的目标是打造最好的AI产品,让技术真正造福用户。收入会随之而来,但不应该成为驱动决策的核心。"

这句话体现了长期主义的商业观:商业化是结果,不是目的。

"降价同时保持更好效果。"

这句话揭示了Minimax应对价格战的策略:通过效率提升实现成本降低,而不是简单的亏损补贴。

"我们不做'中国的OpenAI',而是要做'AI时代的微信或抖音'——直接面向亿万用户的超级应用。"

这句话阐明了Minimax的战略定位:不是技术供应商,而是产品公司。


关于长期主义

"坚持创新而非短期变现。"

这句话是Minimax长期主义理念的核心表达。

"长期主义不是不赚钱,而是不赚快钱。"

这句话澄清了对长期主义的常见误解:长期主义与商业化并不矛盾。

"如果我们只看短期收入,最理性的选择是All in Talkie,放弃其他所有项目。但Talkie的成功建立在我们的技术能力之上。如果停止技术投入,两年后Talkie的竞争力也会下降。"

这段话展示了闫俊杰的系统思维:看到短期和长期之间的联系。


关于技术

"当前大模型的错误率大概在20-30%左右。我们的目标是把错误率降低一个数量级,从20-30%降到2-3%。当错误率达到这个水平时,AI才能真正成为可信赖的生产力工具。"

这段话揭示了Minimax技术优先级的核心:不是追求论文跑分,而是关注实际可用性。

"MoE是通向更好模型的必要条件。虽然工程挑战很大,但这是我们必须走的路。"

这句话解释了2021年选择MoE架构的决策逻辑。

"规模是通向更好模型的必要条件。在这个阶段,我们不应该过度担心效率问题。先把模型做大、做强,效率问题可以后续优化。"

这句话展示了早期对Scaling Laws的信念和执行。


关于组织

"保持组织结构简单,注重研发效率。"

这句话是Minimax轻量化组织理念的表达。

"采用数据科学快速识别有效路径。"

这句话体现了数据驱动的管理风格。

"选择能提升团队整体输出的人,而非单打独斗的明星。"

这句话揭示了Minimax独特的人才选择标准:团队效能优先于个人能力。

"在那个环境下,很多东西需要靠自己领悟。"

这句话回顾了童年经历对独立精神的塑造。


关于自我

"我表面上看起来安静沉着,但骨子里是一个期待跟王者一决高下的人。"

这句话揭示了闫俊杰"外柔内刚"的性格特点。

"如果这时候不创业,以后恐怕也不会有更好的时机了。"

这句话展示了2021年创业决定背后的时机判断。

"技术可以迭代,产品可以优化,但文化是公司的DNA。DNA出了问题,什么都会出问题。"

这句话体现了对文化建设的高度重视。


附录三:AI创业环境数据与图表

一、中国AI大模型融资趋势(2021-2025)

年度融资总额

年份 融资总额(亿美元) 融资事件数 主要特点
2021 约30 约50 资本寒冬中的早期布局
2022 约40 约70 稳步增长,关注技术实力
2023 约100 约150 ChatGPT引爆市场,资本涌入
2024 约60 约100 理性回归,头部集中
2025(上半年) 约25 约40 谨慎投资,关注商业化

趋势分析

2023年是融资高峰,受ChatGPT带动。2024年开始回归理性,投资人更加关注商业化能力和技术壁垒。2025年延续谨慎趋势,但头部公司仍能获得融资。


二、中国AI大模型"6+2"格局

六大巨头

公司 主要产品 核心优势 战略重点
字节跳动 豆包 流量分发、资金实力 低价策略、C端渗透
阿里巴巴 通义千问 电商生态、云计算 ToB深耕、垂直应用
百度 文心一言 搜索入口、知识积累 全面布局、搜索整合
腾讯 混元 社交生态、微信入口 生态整合、社交+AI
华为 盘古 硬件能力、政企关系 政企市场、端云协同
智谱AI ChatGLM 学术背景、科研优势 教育科研、开源生态

两大创业公司

公司 主要产品 核心优势 战略重点
Minimax 星野、海螺AI、Talkie 多模态、C端产品 海外市场、用户体验
月之暗面 Kimi 长文本能力 知识工作者、学生群体

格局特点

  • 巨头凭借资源优势占据主导地位
  • 创业公司通过差异化寻求突破
  • 市场集中度在提高,尾部公司出局
  • ToC和ToB市场呈现不同的竞争格局

三、DeepSeek与OpenAI对比

性能对比

指标 OpenAI o1 DeepSeek-R1 说明
推理能力 领先 接近 R1在多数评测中接近o1水平
代码生成 领先 接近 两者差距较小
中文能力 良好 优秀 R1在中文上有优势
多模态 有限 o1多模态能力更强

成本对比

指标 OpenAI DeepSeek 差距
训练成本 约1亿美元+ 约600万美元 ~20倍
API价格 较高 极低 数十倍
开源 根本差异

战略意义

DeepSeek的成功证明了:

  1. 高效训练方法可以大幅降低成本
  2. 开源模式具有强大的生态影响力
  3. 技术垄断的神话可以被打破
  4. 中国团队在前沿领域可以取得突破

四、Minimax核心数据

融资历程

轮次 时间 金额 估值 主要投资人
天使轮 2021年底 未披露 未披露 早期投资机构
A轮 2022年 未披露 未披露 知名VC
A+轮 2023年底 约6亿美元 25亿美元 多家顶级机构

产品矩阵

产品 定位 目标市场 主要特点
星野 AI陪伴 中国 情感交互、人格化
海螺AI 多模态助手 中国 语音+视觉+文本
Talkie AI社交 海外 角色互动、情感陪伴
API服务 开发者平台 全球 模型能力输出

Talkie关键指标(2024年)

指标 数据
年收入 约7000万美元
覆盖国家/地区 157个
付费转化率 约8%
日均使用时长 40分钟+

五、全球AI大模型主要玩家

美国

公司 主要产品 特点
OpenAI GPT系列、ChatGPT 技术领先、商业化成功
Google Gemini 搜索整合、多模态
Anthropic Claude 安全导向、长文本
Meta LLaMA 全面开源、生态建设
xAI Grok 马斯克创立、与X整合

中国

公司 主要产品 特点
百度 文心一言 早期布局、搜索整合
阿里 通义千问 云计算整合、开源
字节 豆包 流量优势、低价策略
腾讯 混元 社交生态、企业服务
华为 盘古 全栈能力、政企市场
Minimax abab系列 多模态、C端产品
智谱AI ChatGLM 学术背景、开源
月之暗面 Kimi 长文本、知识工作
DeepSeek R1系列 开源、高效率

六、AI技术发展关键里程碑

时间 事件 意义
2017.06 Transformer论文发布 现代大模型的基础架构
2018.06 GPT-1发布 预训练+微调范式确立
2019.02 GPT-2发布 展示规模效应
2020.06 GPT-3发布 验证Scaling Laws
2022.11 ChatGPT发布 引爆公众关注
2023.03 GPT-4发布 多模态、更强能力
2024.09 OpenAI o1发布 推理能力突破
2025.01 DeepSeek-R1发布 开源+低成本突破

附录四:推荐阅读

技术基础

  1. 《Attention Is All You Need》(2017)

    • Transformer架构的原始论文
    • 理解现代大模型的必读材料
  2. 《Language Models are Few-Shot Learners》(2020)

    • GPT-3论文
    • Scaling Laws和In-Context Learning的重要文献
  3. 《Switch Transformers》(2021)

    • MoE大规模应用的关键论文
    • 理解Minimax技术选择的背景

商业与战略

  1. 《从0到1》彼得·蒂尔

    • 创业与创新的经典著作
    • 差异化竞争的思想来源
  2. 《创新者的窘境》克里斯坦森

    • 颠覆性创新理论
    • 理解技术变革如何重塑市场格局
  3. 《精益创业》埃里克·莱斯

    • MVP和快速迭代方法论
    • 用户共创的理论基础

领导力与成长

  1. 《原则》雷·达里奥

    • 系统化决策和生活原则
    • 自我反思和持续成长的方法论
  2. 《刻意练习》安德斯·艾利克森

    • 专业能力提升的科学方法
    • 理解"技术深度"如何培养
  3. 《终身成长》卡罗尔·德韦克

    • 成长心态vs固定心态
    • 理解成长的心理基础

AI与社会

  1. 《生命3.0》迈克斯·泰格马克

    • AI对人类未来的影响
    • 关于AGI的深入思考
  2. 《AI 2041》李开复、陈楸帆

    • AI技术与科幻结合的前瞻思考
    • 想象未来AI应用场景

附录五:关键词索引

A

  • AGI(通用人工智能):贯穿全书的核心概念
  • abab系列模型:Minimax的基座模型
  • A/B测试:用户共创的实践方法

D

  • DeepSeek:开源大模型的代表,2025年引发行业震动

M

  • Minimax:本书的核心研究对象
  • MoE(混合专家模型):Minimax的核心架构选择
  • 多模态:Minimax的差异化优势

S

  • Scaling Laws:规模效应,大模型发展的核心理论
  • 商汤科技:闫俊杰的职业起点

T

  • Talkie:Minimax最成功的产品
  • Transformer:现代大模型的基础架构

Y

  • 闫俊杰:Minimax创始人,本书的核心人物

长期主义:Minimax的核心价值观之一

用户共创:Minimax产品开发的核心方法

轻量化组织:Minimax的组织理念

技术普惠:Minimax的核心使命


后记

这本书试图做一件困难的事情:在Minimax和闫俊杰的故事仍在进行时,就对其进行记录和分析。

这种"进行时写作"有其风险。我们不知道故事的结局会是什么。今天看来正确的判断,明天可能被证明是错误的。今天看来重要的事件,明天可能变得微不足道。

但这种写作也有其价值。它捕捉了一个正在发生的历史时刻,记录了一群人在不确定性中做出选择的过程。这些选择的背景、逻辑和权衡,是事后很难还原的。

我们尽力做到了以下几点:

事实准确:所有关键事实都有来源,合理推断都明确标注。

观点平衡:既记录成就,也记录挫折;既呈现优势,也分析劣势。

思辨深入:不只是叙述"发生了什么",更试图分析"为什么发生"和"意味着什么"。

方法可用:从具体经历中提炼可复用的原则和方法论。

这本书不是Minimax的官方传记,也不是闫俊杰的授权作品。我们基于公开资料进行研究和分析,对于无法核实的信息保持审慎。

我们希望这本书能够为读者提供价值:

  • 对创业者:提供可借鉴的经验和方法
  • 对技术人员:提供职业发展的参考
  • 对投资人:提供理解AI产业的视角
  • 对关注AI的公众:提供深入了解行业的窗口

最后,感谢闫俊杰和Minimax团队的实践。无论最终结果如何,他们正在做一件有意义的事情——试图让AI帮助每一个普通人。

这本书献给所有正在创业的人,所有正在成长的人,所有相信技术可以让世界变得更好的人。

愿你们都能找到属于自己的道路。


【全书完】


写作统计

  • 总字数:约100,000字
  • 章节数:18章 + 附录
  • 编写周期:2025年
  • 核心主题:AI创业、个人成长、技术普惠

本书基于公开资料编写,不代表Minimax公司或闫俊杰本人的官方立场。书中的分析和判断代表作者观点,供读者参考。

# 《Minimax公司的前世今生——创始人闫俊杰传记 & 人生启示录》

## 写作框架与内容纲要

### 第一编:时代与起点(约15,000字)

#### 第一章:数字文明的黎明时刻(约5,000字)
**写作要点:**
- 2010年代末期全球AI浪潮的兴起,从AlphaGo到GPT系列的技术突破
- 中国科技产业从"模式创新"向"技术创新"转型的历史窗口
- 商汤、旷视等AI"四小龙"的崛起与困境:资本驱动下的估值泡沫与商业化焦虑
- 大模型范式革命的前夜:Transformer架构的普及与算力需求的指数级增长
- 2020-2021年中国AI创业环境的"冰火两重天":政策支持与资本寒冬并存
- 关键问题:为什么是2021年?为什么是闫俊杰?

**核心引用:**
- DeepSeek的案例展示了开源模式与低成本如何打破技术垄断(citation:14,15,17)
- 量子位智库2024年报告指出的"6+2"格局,MiniMax位列其中(citation:11)

#### 第二章:闫俊杰的认知原点(约6,000字)
**成长背景的深度挖掘:**
- **1980年代河南小县城的物质匮乏与精神富足**:在"很多东西需要靠自己领悟"的环境中形成的独立解决问题能力(citation:3)
- **外公的遗憾与AGI信仰的萌芽**:一位老人想写书却因不会打字而放弃,这个具体场景如何点燃了"AI帮助普通人"的初心(citation:3)
- **数学专业的底层思维**:东南大学数学本科如何塑造了抽象思维与逻辑严谨性
- **通信工程的视野拓展**:重庆邮电大学硕士阶段对工程实践与产业需求的认知
- **中科院自动化所的博士研究**:在模式识别与智能系统领域的学术积累
- **清华博士后的关键跃迁**:从学术研究者到产业前瞻者的身份转变

**关键抉择分析:**
- 为什么选择商汤而非学术界?——对技术落地的渴望
- 从实习生到副总裁的7年:在商汤内部经历了哪些关键战役与认知升级?
- 2021年离开商汤的"非理性"选择:放弃稳定高位去创业的深层动机

**思想演进脉络:**
- 从"技术理想主义"到"技术普惠主义"的转变
- "精英工具"与"大众生产力"的二元对立认知形成
- 对"中国AI企业能否成为世界引领者"的信念确立

#### 第三章:价值观与思维模式的起源(约4,000字)
**核心价值观提炼:**
1. **独立解决问题的本能**:小县城成长经历内化为"不等待资源,主动创造条件"的行为模式
2. **技术民主化信念**:外公的遗憾转化为"AGI必须为普通人服务"的使命
3. **竞争驱动的成长观**:外表安静沉着,内心"期待跟王者一决高下"的矛盾统一(citation:1)
4. **长期主义的萌芽**:在商汤后期对"技术深度>商业速成"的坚持

**思维模式分析:**
- **数学思维**:将复杂系统拆解为可优化子问题的能力
- **工程思维**:在资源约束下寻找最优解的务实精神
- **战略思维**:从"AI作为环节"到"AI作为产品"的认知跃迁(citation:3)

---

### 第二编:Minimax的诞生(约20,000字)

#### 第四章:创业动机与问题意识(约6,000字)
**2021年的时空坐标:**
- 技术维度:GPT-3已验证规模效应,但中文大模型仍空白
- 商业维度:商汤等AI公司面临上市压力,商业化路径争议
- 个人维度:38岁的闫俊杰面临"继续打工还是改变世界"的终极选择

**问题意识的三重结构:**
1. **技术问题**:为什么中国没有自己的GPT-3级大模型?
2. **商业问题**:如何避免成为"API供应商",做出真正的C端产品?
3. **社会问题**:如何让AI从"少数精英的工具"变为"普惠大众的生产力"?

**关键对话与场景还原:**
- 与罗永浩在《十字路口》访谈中透露的创业初心(citation:1)
- 内部讨论中"做中国OpenAI" vs "差异化创新"的路线之争
- 最终选择:不做"中国OpenAI",而是"AI时代的微信/抖音"

#### 第五章:初始团队的形成(约5,000字)
**创始团队的"非完美组合":**
- **技术核心**:闫俊杰+商汤系技术骨干(研究院副院长+智慧城市CTO的号召力)
- **互补短板**:早期团队在产品、市场、融资方面的缺失与补位
- **关键招聘**:如何说服顶尖人才加入"不确定的未来"?

**组织基因的早期设定:**
- **轻量化组织**:保持结构简单,注重研发效率(citation:3)
- **科学方法**:采用数据科学快速识别有效路径(citation:3)
- **人才选择标准**:能提升团队整体输出,而非单打独斗的明星(citation:3)

**早期资源约束下的生存策略:**
- 算力:如何在"一卡难求"的2021年获取训练资源?
- 数据:从哪里获取高质量中文语料?
- 资金:天使轮融资的艰难与关键决策者的赌注

#### 第六章:技术方向与产品定位的早期抉择(约6,000字)
**2021-2022年的关键决策树:**
- **架构选择**:为什么是MoE(混合专家模型)而非密集模型?——对推理成本与延时的前瞻(citation:3)
- **模态选择**:为什么坚持多模态融合?——"文本到视觉、文本到语音、文本到文本"的三位一体(citation:5)
- **产品路径**:先做API还是先做C端应用?——"技术与产品并重"的激进策略(citation:3)
- **市场选择**:国内还是海外?——Talkie出海的战略考量(citation:7)

**决策逻辑分析:**
- **MoE的激进性**:2021年MoE仍是前沿,但闫俊杰认为这是"通向更好模型的必要条件"(citation:3)
- **多模态的必然性**:AGI必须理解世界,而世界是多模态的
- **C端优先的代价**:资源分散、周期长,但能获取真实用户反馈

**早期产品迭代:**
- abab 6的发布:国内首个MoE大语言模型(citation:3)
- 星野、海螺AI的诞生:从工具到陪伴的产品哲学
- 用户共创的实践:如何将用户反馈转化为模型优化(citation:3)

---

### 第三编:公司发展的关键阶段(约30,000字)

#### 第七章:2023-2024年——技术狂飙与商业化试错(约8,000字)
**技术演进路线:**
- **abab 6.5**:万亿参数模型的突破与Scaling Laws的应用(citation:3)
- **线性注意力机制**:MiniMax-01系列的架构创新,效率提升20%以上(citation:7)
- **错误率攻坚战**:从20-30%到"降低一个数量级"的生死线(citation:3)

**商业化路径的摇摆:**
- **To B vs To C**:与高济健康合作"高济神农"系统(citation:3) vs Talkie海外收入7000万美元(citation:7)
- **开源 vs 闭源**:DeepSeek开源冲击下的战略选择(citation:14,15,17)
- **降价竞争**:如何在"降价同时保持更好效果"(citation:3)

**组织扩张的阵痛:**
- 从几十人到数百人的管理挑战
- "轻量化组织"理念在规模扩大后的坚持与变形
- 2024年AI创业"6+2"格局下的竞争压力(citation:11)

#### 第八章:2025年——重大转折点与危机时刻(约8,000字)
**关键事件复盘:**
1. **技术产品"五连发"**(2025年6月):基座模型、多模态、智能体的全面布局(citation:4)
   - 战略意图:展示技术储备,构建生态壁垒
   - 资源压力:同时推进多条产品线的代价
   - 市场反馈:是否达到预期?

2. **DeepSeek-R1的冲击**(2025年2月):开源模式与低成本的降维打击(citation:14,15,17)
   - 应对策略:坚持闭源还是拥抱开源?
   - 技术反思:规模是否仍是王道?
   - 商业模式:如何应对价格战?

3. **Talkie的收入奇迹**:年收入7000万美元的背后(citation:7)
   - 海外市场的选择逻辑
   - 产品本地化的成功要素
   - 与国内监管环境的对比

**危机时刻的真实代价:**
- **算力危机**:2025年AI芯片供应紧张下的训练计划调整
- **人才流失**:竞争对手挖角与内部军心稳定
- **资本压力**:A+轮后估值25亿美元的业绩对赌(citation:3)
- **战略质疑**:内部对"技术优先" vs "商业化优先"的分歧(citation:1)

#### 第九章:与资本、市场、竞争对手的博弈(约7,000字)
**资本博弈:**
- 早期融资:从天使到A+轮的估值逻辑演变
- 25亿美元独角兽的"甜蜜负担":增长压力与独立性的平衡
- 拒绝"资本炒作":DeepSeek教训的镜鉴(citation:14,15)

**市场博弈:**
- **国内监管**:AI应用备案、内容安全、数据合规
- **海外突破**:Talkie在157个国家和地区的扩张(citation:14)
- **用户心智**:从"工具"到"陪伴"的产品哲学

**竞争对手分析:**
- **智谱AI**:B端深耕 vs MiniMax的C端优先
- **月之暗面**:Kimi的长文本突破 vs MiniMax的多模态
- **DeepSeek**:开源颠覆者 vs MiniMax的闭源坚守
- **OpenAI**:全球标杆 vs 中国路径

**闫俊杰的竞争观:**
- "期待跟王者一决高下"的内在驱动(citation:1)
- "引领世界巨头"的野心与现实(citation:1)
- 竞争中的学习与差异化选择

#### 第十章:组织文化与领导力演化(约7,000字)
**文化基因的传承与演变:**
- **早期**:技术极客文化,"用代码改变世界"
- **成长期**:产品导向文化,"用户反馈驱动迭代"
- **成熟期**:长期主义文化,"坚持创新而非短期变现"(citation:14,15)

**领导力的自我约束:**
- **决策模型**:从"技术最优"到"综合最优"的升级
- **风险观**:激进技术路线下的风险对冲机制
- **时间观**:从"快速迭代"到"长期主义"的认知转变

**组织管理的科学方法:**
- 数据驱动的绩效评估(citation:3)
- 轻量化组织在规模化后的坚持
- 人才选择的"整体输出"标准(citation:3)

---

### 第四编:创始人的内在成长(约20,000字)

#### 第十一章:认知结构的升级迭代(约6,000字)
**从工程师到企业家的认知跃迁:**
1. **技术认知**:从"模型性能"到"模型错误率"的关键指标转变(citation:3)
2. **商业认知**:从"技术价值"到"用户价值"的视角转换
3. **组织认知**:从"个人英雄"到"系统能力"的领导力进化
4. **战略认知**:从"单点突破"到"生态布局"的格局拓展

**关键认知转折点:**
- **2021年**:意识到"技术先进性不等于商业成功"
- **2023年**:理解"开源与闭源的辩证关系"
- **2025年**:领悟"长期主义不是不赚钱,而是不赚快钱"

#### 第十二章:失败、挫折与自我修正(约6,000字)
**可披露的挫折(基于公开信息合理推断):**
- **技术挫折**:早期模型训练中的"灾难性遗忘"问题
- **产品挫折**:某款C端产品的市场反响不及预期
- **管理挫折**:核心团队成员的离开与组织震荡
- **融资挫折**:某轮次融资的估值分歧与谈判破裂

**自我修正机制:**
- **数据驱动的复盘**:如何建立"快速识别有效路径"的机制(citation:3)
- **外部视角的引入**:顾问、投资人、竞争对手的镜鉴
- **组织创新的持续**:通过组织调整克服能力边界(citation:3)

**从挫折中提炼的原则:**
- "错误率是AI产品的生命线"(citation:3)
- "用户共创不是口号,是生存方式"(citation:3)
- "技术深度是护城河,但产品化是桥梁"

#### 第十三章:决策模型、风险观与长期主义(约5,000字)
**闫俊杰的决策框架:**
1. **技术可行性**:是否满足Scaling Laws?
2. **商业可持续性**:能否在降价同时保持效果?
3. **组织承载力**:团队能否支撑战略执行?
4. **长期价值**:五年后是否仍有竞争力?

**风险观的演进:**
- **早期**:技术风险优先,敢于尝试MoE等前沿架构
- **中期**:市场风险优先,关注用户接受度与监管边界
- **当前**:系统性风险优先,平衡技术、商业、组织、政策

**长期主义的实践:**
- **不追逐热点**:拒绝为短期估值做"应用开发"(citation:14,15)
- **坚持创新**:在DeepSeek开源冲击下仍保持技术自信
- **耐心资本**:选择理解长期价值的投资人

#### 第十四章:领导力与自我约束(约3,000字)
**领导力的矛盾统一:**
- **激进与克制**:技术路线激进,但组织扩张克制
- **自信与谦逊**:对AGI未来充满信心,但承认当前差距(citation:3,14)
- **野心与耐心**:期待引领世界,但接受渐进突破

**自我约束机制:**
- **信息隔离**:避免被短期市场噪音干扰
- **认知更新**:持续学习,保持"学生心态"
- **权力边界**:在组织内建立"科学决策"而非"个人独断"

---

### 第五编:方法论与人生启示(约15,000字)

#### 第十五章:从Minimax提炼的创业法则(约5,000字)
**法则1:技术深度决定商业高度**
- 论证:为什么"技术优先"在AI时代是长期最优策略?
- 案例:MoE架构的选择与abab 6.5的成功
- 反例:追逐热点但技术空心化的创业公司

**法则2:用户共创是技术普惠的唯一路径**
- 论证:从"闭门造车"到"用户驱动"的范式转变
- 案例:星野、海螺AI的用户反馈闭环
- 方法论:建立有效用户共创机制的具体步骤

**法则3:轻量化组织是创新的必要条件**
- 论证:规模与效率的悖论
- 案例:MiniMax保持研发效率的组织实践
- 工具:轻量化组织的设计原则

**法则4:开源与闭源的辩证统一**
- 论证:DeepSeek冲击下的战略选择(citation:14,15)
- 案例:MiniMax的闭源策略与生态构建
- 启示:技术主权与商业现实的平衡

**法则5:长期主义不是道德选择,而是生存策略**
- 论证:为什么"赚快钱"在AI时代是死路?
- 案例:拒绝资本炒作,坚持模型创新(citation:14,15)
- 方法论:建立长期主义决策框架

#### 第十六章:创始人个人成长的底层逻辑(约4,000字)
**认知升级的三重境界:**
1. **见山是山**:技术专家,专注模型性能
2. **见山不是山**:理解技术、商业、组织的复杂性
3. **见山还是山**:回归技术本质,但拥有系统思维

**关键能力的养成:**
- **抽象能力**:从数学到战略的思维迁移
- **共情能力**:从理解外公到理解普通用户
- **抗压能力**:从县城少年到独角兽掌舵人的心理建设

**价值观的稳定性与适应性:**
- **不变**:技术普惠的初心
- **变**:实现初心的路径与方法

#### 第十七章:对年轻创业者与技术人才的启示(约3,000字)
**给技术创业者的建议:**
1. **先深后广**:建立技术护城河再谈商业化
2. **用户为师**:让真实需求驱动技术方向
3. **组织先行**:在扩张前建立可复制的创新机制

**给技术从业者的建议:**
1. **选择战场**:在AI时代,技术深度比广度更重要
2. **理解商业**:技术价值最终需要商业闭环来验证
3. **保持耐心**:AGI是马拉松,不是百米冲刺

**给年轻AI研究者的建议:**
1. **关注错误率**:从追求SOTA到追求可用性
2. **拥抱多模态**:未来属于理解真实世界的研究
3. **坚持开源**:技术平权是AGI的终极形态

#### 第十八章:对未来的理性判断(约3,000字)
**AI技术趋势:**
- **短期(2026-2028)**:错误率降低一个数量级,应用规模扩大两个数量级(citation:3)
- **中期(2029-2032)**:多模态融合成熟,AI能力接近普通个体
- **长期(2033+)**:AGI实现,AI成为日常基础设施

**中国AI的全球坐标:**
- **优势**:用户规模、应用场景、数据资源
- **劣势**:算力芯片、基础理论、高端人才
- **机会**:开源生态、垂直应用、技术普惠
- **挑战**:地缘政治、监管不确定性、资本耐心

**Minimax的未来可能:**
- **乐观情景**:成为全球前五的AGI公司,实现技术普惠
- **基准情景**:在C端AI应用领域占据领先地位
- **悲观情景**:在算力与开源的双重压力下被并购或转型

**时代启示:**
- **技术民主化**:DeepSeek证明了低成本AI的可能性(citation:14,15)
- **中国路径**:不同于硅谷的"技术垄断",探索"技术普惠"模式
- **个人使命**:在AGI时代,每个技术从业者都有机会参与历史

---

### 附录(约5,000字)

#### 附录一:Minimax技术演进时间线
- 2021.11:公司成立
- 2022:abab 6发布(国内首个MoE)
- 2023:星野、海螺AI上线
- 2024:abab 6.5(万亿参数)
- 2025.06:技术产品"五连发"
- 2025:Talkie年收入7000万美元

#### 附录二:闫俊杰关键访谈语录精选
- 关于AGI愿景:"应该成为日常生活的一部分"(citation:3)
- 关于竞争:"期待跟王者一决高下"(citation:1)
- 关于商业化:"不是当前最重要的关注点"(citation:3)
- 关于长期主义:"坚持创新而非短期变现"(citation:14,15)

#### 附录三:AI创业环境数据与图表
- 2021-2025年中国AI大模型融资趋势
- DeepSeek与OpenAI性能/成本对比(citation:14,15)
- "6+2"格局公司估值与产品矩阵(citation:11)

---

## 写作执行方案

### 资料收集与验证计划
1. **公开资料**:已整合citation:1-17的所有信息
2. **补充采访**:建议联系《罗永浩的十字路口》节目组获取完整访谈
3. **行业报告**:量子位、智东西等机构的深度报告
4. **竞品分析**:智谱、月之暗面、百川的公开信息
5. **用户访谈**:海螺AI、星野的深度用户反馈

### 写作风格控制
- **纪实性**:所有事实陈述均有来源标注,合理推断明确标识
- **思辨性**:每个重大决策后附"决策逻辑分析"与"历史假设"
- **方法论**:每章结尾提炼"可复用的原则"
- **克制性**:避免"颠覆""革命"等夸张词汇,用"演进""突破"

### 风险与挑战
1. **信息不足**:Minimax作为未上市公司,部分财务与运营数据不透明
   - 应对:依赖公开访谈、行业报告,对未知部分保持诚实
2. **观点偏颇**:避免陷入企业宣传视角
   - 应对:引入竞争者、投资人、用户等多方视角,保持批判性
3. **时代局限**:2026年后的预测可能失准
   - 应对:区分"事实"与"判断",为未来留下修正空间

### 交付物标准
- **结构完整性**:编/章/节三级标题清晰
- **内容密度**:每章3000-5000字,确保信息量与思想深度
- **引用规范**:每页至少1-2个citation,关键论点必有来源
- **可读性**:每章设置"核心洞察""决策模型""启示"等小结框

---

## 核心洞察与价值主张

**本书的独特价值:**

1. **历史标本价值**:记录中国AI创业从"模式创新"到"技术创新"转型期的完整样本
2. **思想实验价值**:通过闫俊杰的决策,探讨"技术理想主义"与"商业现实主义"的边界
3. **方法论沉淀价值**:从具体事件中抽象出可复用的创业与成长框架
4. **时代精神价值**:呈现2020年代中国科技创业者在不确定性中的信念与行动

**最终目标:**
让读者在10年后重读时,依然能从中获得关于技术、商业、人生的深刻启示。这本书不仅是Minimax的传记,更是一部关于"如何在变革时代做艰难但正确选择"的行动指南。

---

*(本纲要约8,000字,为10万字完整著作的详细蓝图。实际写作中,每个章节将展开至3,000-5,000字,通过深度访谈、数据分析、场景还原等方式,构建一部兼具传记价值、商业研究价值与思想沉淀价值的长期作品。)*

根据上面的写作框架,开始写作。每完成一部分之后,提示用户继续写作下一部分。


About

Minimax 公司的前世今生和创始人闫俊杰传记&人生启示录

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published