2022年4月,成立仅四个月的上海稀宇科技有限公司(MiniMax)正式推出其首款文本大语言模型 abab1,标志着这家年轻的AI公司完成了从0到1的技术突破,也为后续全模态大模型的布局奠定了坚实基础。
从计算机视觉到通用人工智能
MiniMax由前商汤科技高管闫俊杰等人于2021年12月创立,创始团队在计算机视觉领域拥有深厚积累。然而,公司成立之初便将目光投向了更宏大的目标——通用人工智能(AGI)。
创始人闫俊杰曾在公开访谈中提到,2019年看完OpenAI Five在《刀塔2》中战胜人类冠军战队的直播后,他"非常激动",意识到"行业要发生变化了"。这次经历成为他从计算机视觉转向大语言模型研究的重要契机,也为MiniMax的技术路线埋下了伏笔。
公司名称"MiniMax"本身就蕴含着深刻的哲学思考——在现实约束与宏大理想之间寻找平衡,在有限资源中追求最优解。这一理念贯穿了MiniMax的整个发展历程。
abab1:文本能力的奠基之作
作为MiniMax的首款大语言模型,abab1采用了经典的稠密Transformer架构,虽然参数规模在同期竞品中并不算最突出,但在中文理解和对话交互方面展现出了独特的优势。
核心技术特点
- 稠密Transformer架构:采用全参数激活的稠密结构,保证了推理的稳定性和可预测性
- 中文优化:针对中文语料进行专项训练,在语义理解、上下文连贯性方面表现出色
- 情绪交互能力:不同于当时主流的工具型对话模型,abab1特别强化了情绪感知和情感化回应能力
- 低延迟响应:在模型架构和推理引擎层面进行深度优化,确保对话交互的流畅体验
产品化验证
abab1发布后,MiniMax迅速基于该模型推出了实验性智能对话产品,用户可以与具备情绪互动能力的AI进行自然对话。这一产品形态在当时的国内市场尚属新颖,很快吸引了大量用户尝鲜。
截至2022年底,基于abab1的对话产品用户规模已突破10万,完成了技术从实验室走向市场的初步验证。这一成绩也坚定了MiniMax继续投入大模型研发的信心。
"产品与技术并进"的双线策略
从abab1开始,MiniMax就确立了"产品与技术并进"的双线发展策略——这也是后来公司能够快速突围的关键因素之一。
闫俊杰在后来的访谈中多次强调:"在当前阶段,产品价值的核心依然来自模型性能和算法能力,技术是绝对的基础。"但他同时也认为,技术最终要通过产品才能触达用户,而用户反馈又会反过来驱动技术进步。
这种"技术-产品-用户"的正向循环,在abab1时代就已经开始形成。通过与真实用户的互动,MiniMax团队深入理解了C端用户对AI对话的真实需求,这些洞察为后续模型的迭代方向提供了宝贵指引。
为全模态布局埋下伏笔
虽然abab1只是一个纯文本模型,但MiniMax从创立之初就押注了多模态路线。公司团队坚信,真正的AGI一定要支持多模态的输入和输出——只是在2022年那个时间点,技术路线还不清晰,所以选择先从文本模态切入,打好基础。
"我们觉得真正的AGI,一定要支持多模态的输入、多模态的输出,只是这件事实在太难了。三年多以前,我们刚开始做的时候,创业的时候,那个时候其实完全没有技术路线,我们的想法就是每个模态至少先走通,到了时机合适的时候就可以再起来整合。"闫俊杰后来在与罗永浩的对谈中这样回忆道。
事实证明,这一战略眼光是正确的。abab1不仅为MiniMax积累了大模型训练的工程经验,更重要的是培养了一支具备实战能力的团队,为后续在语音、视频等模态的快速突破储备了人才和技术。
结语
回望2022年春天,abab1的发布在当时的"百模大战"中或许并不起眼——既没有震撼的参数规模,也没有高调的发布会。但正是这款看似普通的初代模型,开启了MiniMax四年后从创业公司到千亿市值上市公司的传奇序幕。
从abab1到后来的abab6、M1、M2,从文本到语音、视频、音乐,MiniMax用四年时间走完了许多公司十年都未必能走完的路。而这一切的起点,都要追溯到2022年4月那个 quietly 发布的abab1。