对话 MiniMax 闫俊杰:M3、10X 计划、10T 模型、和智能的终局
对话 MiniMax 闫俊杰:M3、10X 计划、10T 模型、和智能的终局
概览
本期是 Koji 在 MiniMax Developer Meetup 上主持的一场圆桌讨论,嘉宾包括 MiniMax 创始人兼 CEO I.O. 闫俊杰、MultiCard 创始人张家园、Deerflow 核心负责人何涛,以及一位上市金融公司的技术负责人于阳。讨论主线围绕 AI Coding、模型迭代、Agent、开源项目治理、金融场景落地和未来智能展开。
闫俊杰多次强调,AI 的核心价值是生产力提升,模型进步和 Agent/Harness 进步是互相推动的关系。MiniMax 从 M1 到 M3 的经验显示,模型能力、Token 用量、训练规模、数据质量、推理成本和真实工程反馈都在共同决定产品能否进入主流使用。
圆桌后半段把焦点转向复杂软件工程和 AI 的社会影响:嘉宾们认为,AI Coding 让生产速度大幅提升,但验证、Review、长期维护和工程品味没有自动消失;AI 应被当成新工具和工程系统,而不是一次性解决所有问题的魔法棒。
分段落总结
[00:00] 活动背景与嘉宾介绍
[事实] 主持人介绍本期播客来自 MiniMax Developer Meetup 的圆桌讨论,嘉宾包括 MiniMax 创始人兼 CEO I.O. 闫俊杰、MultiCard 创始人张家园、Deerflow 核心负责人何涛和一位上市金融公司的技术负责人于阳。 [事实] 闫俊杰表示,这次活动是 MiniMax 第一次办类似开发者活动,并希望后续变成持续性的事情。 [事实] 他认为 AI 编程不会让从业者变少,而是会让更多人获得生产力。
[02:00] 从 M1 到 M3:能力、用量与预期
[事实] 闫俊杰回顾 M1 时表示,当时模型“自动的效果不太好”,但团队在第一次跑通相关能力时已经感到强烈冲击。 [事实] 到 M2 时,团队重点做 coding 和 editing,没有把精力放在所有通用对话场景上;M2.7 的 Token 用量达到约十万亿,超过原先一天一万亿 Token 的目标。 [事实] 闫俊杰称 M3 设定了更大的目标,但还没有完全实现;从用量角度看比较超预期,从能力角度看仍在接近更理想的状态。 [推测] MiniMax 的产品策略更偏向先在高频生产力场景中取得可见增长,而不是一开始追求所有通用能力均衡。
[04:20] MultiCard 对 M3 的使用:模型编排与成本平衡
[事实] 张家园表示,他们的工作流中有大量可以 Pipeline 化的场景,包括处理 GitHub issue 和 customer support。 [事实] 他认为并不是所有场景都需要最高级模型,团队每月在 Claude Code、Codex、Cursor 等工具上的 Token 成本很高。 [事实] 他们尝试把不同模型和 Agent 的能力组合起来,用其他模型做 Review 或 Mentor,让 M3 承担 Coding,从而弥补单一模型的不足。 [事实] 张家园提到 M3 有时比较啰嗦、Thinking 时间较长,结果里也不一定所有点都正确。 [推测] 这里的核心方法不是押注单个最强模型,而是把模型当作系统组件,通过分工降低成本并提升稳定性。
[06:17] Deerflow:从开源 Deep Research 到多模态桌面工作流
[事实] 何涛说 Deerflow 一开始是一个开源项目,初衷是把昂贵的 Deep Research 能力做成更可获得的形态,并且用中国模型打样。 [事实] Deerflow 的目标覆盖桌面工作者的多模态任务,包括报告、图表、播客、动画片,甚至音乐等需求。 [事实] Deerflow 接入 MiniMax 的 Token Plan,被何涛称为有魅力的事情。 [事实] 何涛表示 Deerflow 现在也是一个社区,拥有 1K 以上 contributor,覆盖范围很广。 [事实] 他也承认项目被抱怨代码已经“屎山”,如何治理成功开源项目成为团队持续研究的问题。
[09:29] 金融场景中的 AI 与 Agent
[事实] 于阳表示,金融用户往往并不清楚自己打开应用想做什么,但目标通常是赚钱。 [事实] 他们收到最多的问题是“帮我选几只个股”,而同类产品常见做法只是罗列某只个股的信息,然后没有下一步。 [事实] 于阳认为 AI 在金融场景里首先能筛选信息,其次能降低用户理解术语、指标和影响的门槛。 [推测] 金融 AI 的真正价值不只是回答问题,而是把模糊需求转成可理解、可追问、可行动的信息结构。
[11:03] AI 炒股、合规与实时决策
[事实] 于阳表示,出于合规原因,他们不能直接用 AI 帮用户炒股,输出内容也不带投资建议。 [事实] 他提到内部有回测机制,并且对自家系统有信心,因为有真实数据支撑胜率等判断。 [事实] 他强调炒股不是单纯的文字推理问题,涉及个人画像、实时变化的信息、事件发生后的应对。 [事实] 他认为当事情真正发生后怎么做,比单纯预测事情会怎么发展更重要。
[12:37] 模型与 Agent 的关系
[事实] 闫俊杰表示,去年这个时候很难想到现在模型和 AI Coding 会发展到什么样,AI 行业一年经历的变化可能相当于其他行业好几年。 [事实] 他认为模型进步和 Harness/Agent 的进步不是单向关系,而是互相促进。 [事实] 他提出可以把模型和 Harness 都看成实现更高智能的手段,同时仍应假定智能最终服务于人类。 [推测] 这意味着 MiniMax 并不把“模型会吞掉 Agent”当作唯一结论,而是更关注两者共同推动智能水平上升。
[15:03] 训练规模、10T 模型与国内模型差距
[事实] 闫俊杰认为当前没有一个特别的根本卡点,更多是需要时间和积累。 [事实] 他提到模型每提升一代,参数量可能大三倍或五倍,但 Scaling Law 的外推不能无限放大,超过一定倍数后会失效。 [事实] 他表示美国模型相比中文模型大约是十倍量级差距,十倍大致意味着两代差距。 [事实] 他提到国内模型公司需要先把 3T 模型训练做好,再基于经验做 10T;10T 模型按常见比例需要约 200T 数据,但全世界没有这么多数据。 [事实] 更大的模型对算力、训练效率、网络结构、数据数量和数据质量都有更高要求。
[18:06] MiniMax 所谓“进步速度最快”的衡量方式
[事实] 主持人追问“快”的 benchmark 是什么。 [事实] 闫俊杰回答,可以比较一个模型现在的智能水平和三个月前、六个月前的智能水平之比,他认为 MiniMax 的提升比例应该是最多的一类。 [推测] 这里的“最快”更像相对进步速度,而不是绝对能力排名。
[18:24] AI Coding 时代的软件工程
[事实] 张家园认为 AI Coding 已经商品化,几乎人人都可以写代码;vibe coding 并不新鲜,产品经理过去也是通过程序员完成某种 vibe coding。 [事实] 他认为当人人都能做很多事时,判断“不做什么”变得非常重要。 [事实] 他引用《Code Complete》,强调复杂项目里的架构、代码复杂度和避免屎山是软件工程几十年来一直研究的问题。 [事实] MultiCard 的做法是由核心维护者定义 roadmap、品味、要做和不做的事,并与外部 contributor 对齐上下文。
[21:20] 从 Coding 到 Engineering:长期维护与责任
[事实] 何涛提出“vibe coding 从来没人说是 vibe engineering”,强调写代码本质上是 engineering 工作。 [事实] 他认为工程不是一次性交付,而是长期交付持续有生命力的东西。 [事实] 他指出现有 SWE 或 SWE-pro 这类 benchmark 更偏一次性解决问题,缺少对长期维护 codebase 的衡量。 [事实] 他建议把 Clean Code、Google best practice、Amazon best practice 等沉淀成 skill 或上下文交给 Agent。 [事实] 他反对把代码问题归咎于“这是 Agent 做的”,认为用个人账号提交的东西仍表达了提交者的责任心和品味。
[24:43] MiniMax 内部如何看 AI Coding
[事实] 嘉宾提到,在大型企业代码库中,AI Coding 让一个人能处理更多仓库和更多改动,但验证没有跟上。 [事实] 观点是生产能力在极大提升,但验证、交付和 Review 方面的 Harness 与模型都还不够。 [事实] 他认为应在验证上投入接近研发生产的能力,否则项目到足够复杂后会出问题。 [事实] MiniMax 也在用类似方式开发训练和训练系统,通过 issue 分阶段推进,并用测试、benchmark、项目规则等方式验证。 [推测] AI Coding 的瓶颈正在从“能不能生成代码”转向“能不能可靠验证、维护和交付”。
[27:38] 从数据标注到专家共建
[事实] 闫俊杰表示,AI 的核心是生产力,模型像工具一样让思考和验证过程变得更快,但实质仍是行业里的真实问题。 [事实] 他认为光靠模型或 researcher 不够;在 Coding 场景里,开发工程师比算法同学更理解什么是好的 coding。 [事实] 他把 Coding 场景中的角色概括为 researcher 和 engineer,而更多领域需要 researcher、开发工程师和真正的领域专家三个角色。 [事实] 他提到 Anthropic 有经济学家、心理学家、核物理学家、哲学家等非 researcher/engineer 角色。 [事实] MiniMax 接下来会在安全、金融、法律等领域更深入引入类似专家。
[30:58] 2026 下半年:金融 AI 的陪伴与引导
[事实] 于阳没有推荐个股,而是说 AI 和大模型在应用场景中有一点是以前的东西替代不了的:陪伴。 [事实] 他把金融场景里的陪伴与用户赚钱、亏钱时的心理状态联系起来。 [事实] 他表示早期做 Agent 时主要是限制模型发挥,不让它做奇怪的事情;随着 Agent 进步,接下来要引导模型思考和做创造性的事情。 [推测] 金融 AI 的方向可能从“防止犯错”逐渐转向“在边界内提升主动性和创造力”。
[32:18] AI 走进家庭与个人化助手
[事实] 何涛提到自己写过名为 How AI Shapes Our Society 的专栏,关注 AI 如何改变社会。 [事实] 他认为国内模型在 2026 年后跨过某个基点,已经具备走进千家万户的机会。 [事实] 他分享了为妻子搭建个人化 AI 助手的例子,把体检报告、吃过的药、聊天记录等导入,让她能准备看医生时要问的问题,并改善与医生沟通。 [事实] 他认为普通人有机会用 AI 让家人、身边人和更多事情变得更好。 [推测] 这一段把 AI Coding 的价值从效率扩展到个人照护、家庭场景和情绪支持。
[34:47] AI 降临派、竞争与保留人的思考
[事实] 张家园说自己是“AI 降临派”,认定 AI 能力发展到后面一定会比人强。 [事实] 他认为未来已经不是人与人竞争,而是在与 Agent 或 AI 竞争。 [事实] 他也提醒,人容易把思考外包给 AI;他的做法是可以和 AI 探索,但把最重要的思考部分留给自己。 [推测] 他的立场不是拒绝 AI,而是在承认 AI 会更强的同时,保留人的判断与主体性。
[36:00] 智能终局:让 AI 帮人理解 AI
[事实] 闫俊杰表示,现在的 AI 本质上是黑盒,作为建设者也不知道一年后会怎么样,只知道它会进步。 [事实] 他认为现有数学工具不足以充分解释 AI,例如超过三层的神经网络用现有数学工具也难以分析。 [事实] 他特别关心什么时候 AI 能帮助人类理解 AI,因为这关系到安全问题、AI 能走多远等答案。 [事实] 他提到大脑和神经网络之间存在很强相关性,并认为 AI 本身的可解释性也需要靠 AI 一起推进。 [推测] 本期最后把讨论从产品和工程推进到认知层面:智能的终局之一可能是用更强的智能解释智能本身。
播客点评/总结
[推测] 这期的价值在于把模型公司、开源项目、AI Coding 实践者和金融垂直场景放在同一张桌上,讨论不是停留在“模型多强”,而是落到 Token 成本、工程治理、验证体系、专家参与和真实用户需求。
[推测] 最大亮点是嘉宾们对 AI Coding 的态度比较清醒:他们承认生产力提升巨大,但反复强调软件工程、长期维护、Review、测试、项目品味和责任归属没有消失。这对正在把 Agent 引入研发流程的团队很有参考价值。
[推测] 局限在于圆桌表达较口语化,转录中也有不少 ASR 错字;部分量化判断如“进步速度最快”“十倍差距”“3T 到 10T”没有展开完整数据来源,适合当作嘉宾观点和行业一线观察,而不宜直接当作严格研究结论。
[推测] 适合关注 AI Coding、Agent 工程化、模型公司策略、开源项目治理、金融 AI 落地和 AI 长期社会影响的开发者、产品经理、技术管理者与创业者收听。