对话 MiniMax 闫俊杰：M3、10X 计划、10T 模型、和智能的终局

2026-06-21 · Show: 十字路口Crossing · 2305s · Source

对话 MiniMax 闫俊杰：M3、10X 计划、10T 模型、和智能的终局

概览

本期是 Koji 在 MiniMax Developer Meetup 上主持的一场圆桌讨论，嘉宾包括 MiniMax 创始人兼 CEO I.O. 闫俊杰、MultiCard 创始人张家园、Deerflow 核心负责人何涛，以及一位上市金融公司的技术负责人于阳。讨论主线围绕 AI Coding、模型迭代、Agent、开源项目治理、金融场景落地和未来智能展开。

闫俊杰多次强调，AI 的核心价值是生产力提升，模型进步和 Agent/Harness 进步是互相推动的关系。MiniMax 从 M1 到 M3 的经验显示，模型能力、Token 用量、训练规模、数据质量、推理成本和真实工程反馈都在共同决定产品能否进入主流使用。

圆桌后半段把焦点转向复杂软件工程和 AI 的社会影响：嘉宾们认为，AI Coding 让生产速度大幅提升，但验证、Review、长期维护和工程品味没有自动消失；AI 应被当成新工具和工程系统，而不是一次性解决所有问题的魔法棒。

分段落总结

[00:00] 活动背景与嘉宾介绍

[事实] 主持人介绍本期播客来自 MiniMax Developer Meetup 的圆桌讨论，嘉宾包括 MiniMax 创始人兼 CEO I.O. 闫俊杰、MultiCard 创始人张家园、Deerflow 核心负责人何涛和一位上市金融公司的技术负责人于阳。 [事实] 闫俊杰表示，这次活动是 MiniMax 第一次办类似开发者活动，并希望后续变成持续性的事情。 [事实] 他认为 AI 编程不会让从业者变少，而是会让更多人获得生产力。

[02:00] 从 M1 到 M3：能力、用量与预期

[事实] 闫俊杰回顾 M1 时表示，当时模型“自动的效果不太好”，但团队在第一次跑通相关能力时已经感到强烈冲击。 [事实] 到 M2 时，团队重点做 coding 和 editing，没有把精力放在所有通用对话场景上；M2.7 的 Token 用量达到约十万亿，超过原先一天一万亿 Token 的目标。 [事实] 闫俊杰称 M3 设定了更大的目标，但还没有完全实现；从用量角度看比较超预期，从能力角度看仍在接近更理想的状态。 [推测] MiniMax 的产品策略更偏向先在高频生产力场景中取得可见增长，而不是一开始追求所有通用能力均衡。

[04:20] MultiCard 对 M3 的使用：模型编排与成本平衡

[事实] 张家园表示，他们的工作流中有大量可以 Pipeline 化的场景，包括处理 GitHub issue 和 customer support。 [事实] 他认为并不是所有场景都需要最高级模型，团队每月在 Claude Code、Codex、Cursor 等工具上的 Token 成本很高。 [事实] 他们尝试把不同模型和 Agent 的能力组合起来，用其他模型做 Review 或 Mentor，让 M3 承担 Coding，从而弥补单一模型的不足。 [事实] 张家园提到 M3 有时比较啰嗦、Thinking 时间较长，结果里也不一定所有点都正确。 [推测] 这里的核心方法不是押注单个最强模型，而是把模型当作系统组件，通过分工降低成本并提升稳定性。

[06:17] Deerflow：从开源 Deep Research 到多模态桌面工作流

[事实] 何涛说 Deerflow 一开始是一个开源项目，初衷是把昂贵的 Deep Research 能力做成更可获得的形态，并且用中国模型打样。 [事实] Deerflow 的目标覆盖桌面工作者的多模态任务，包括报告、图表、播客、动画片，甚至音乐等需求。 [事实] Deerflow 接入 MiniMax 的 Token Plan，被何涛称为有魅力的事情。 [事实] 何涛表示 Deerflow 现在也是一个社区，拥有 1K 以上 contributor，覆盖范围很广。 [事实] 他也承认项目被抱怨代码已经“屎山”，如何治理成功开源项目成为团队持续研究的问题。

[09:29] 金融场景中的 AI 与 Agent

[事实] 于阳表示，金融用户往往并不清楚自己打开应用想做什么，但目标通常是赚钱。 [事实] 他们收到最多的问题是“帮我选几只个股”，而同类产品常见做法只是罗列某只个股的信息，然后没有下一步。 [事实] 于阳认为 AI 在金融场景里首先能筛选信息，其次能降低用户理解术语、指标和影响的门槛。 [推测] 金融 AI 的真正价值不只是回答问题，而是把模糊需求转成可理解、可追问、可行动的信息结构。

[11:03] AI 炒股、合规与实时决策

[事实] 于阳表示，出于合规原因，他们不能直接用 AI 帮用户炒股，输出内容也不带投资建议。 [事实] 他提到内部有回测机制，并且对自家系统有信心，因为有真实数据支撑胜率等判断。 [事实] 他强调炒股不是单纯的文字推理问题，涉及个人画像、实时变化的信息、事件发生后的应对。 [事实] 他认为当事情真正发生后怎么做，比单纯预测事情会怎么发展更重要。

[12:37] 模型与 Agent 的关系

[事实] 闫俊杰表示，去年这个时候很难想到现在模型和 AI Coding 会发展到什么样，AI 行业一年经历的变化可能相当于其他行业好几年。 [事实] 他认为模型进步和 Harness/Agent 的进步不是单向关系，而是互相促进。 [事实] 他提出可以把模型和 Harness 都看成实现更高智能的手段，同时仍应假定智能最终服务于人类。 [推测] 这意味着 MiniMax 并不把“模型会吞掉 Agent”当作唯一结论，而是更关注两者共同推动智能水平上升。

[15:03] 训练规模、10T 模型与国内模型差距

[事实] 闫俊杰认为当前没有一个特别的根本卡点，更多是需要时间和积累。 [事实] 他提到模型每提升一代，参数量可能大三倍或五倍，但 Scaling Law 的外推不能无限放大，超过一定倍数后会失效。 [事实] 他表示美国模型相比中文模型大约是十倍量级差距，十倍大致意味着两代差距。 [事实] 他提到国内模型公司需要先把 3T 模型训练做好，再基于经验做 10T；10T 模型按常见比例需要约 200T 数据，但全世界没有这么多数据。 [事实] 更大的模型对算力、训练效率、网络结构、数据数量和数据质量都有更高要求。

[18:06] MiniMax 所谓“进步速度最快”的衡量方式

[事实] 主持人追问“快”的 benchmark 是什么。 [事实] 闫俊杰回答，可以比较一个模型现在的智能水平和三个月前、六个月前的智能水平之比，他认为 MiniMax 的提升比例应该是最多的一类。 [推测] 这里的“最快”更像相对进步速度，而不是绝对能力排名。

[18:24] AI Coding 时代的软件工程

[事实] 张家园认为 AI Coding 已经商品化，几乎人人都可以写代码；vibe coding 并不新鲜，产品经理过去也是通过程序员完成某种 vibe coding。 [事实] 他认为当人人都能做很多事时，判断“不做什么”变得非常重要。 [事实] 他引用《Code Complete》，强调复杂项目里的架构、代码复杂度和避免屎山是软件工程几十年来一直研究的问题。 [事实] MultiCard 的做法是由核心维护者定义 roadmap、品味、要做和不做的事，并与外部 contributor 对齐上下文。

[21:20] 从 Coding 到 Engineering：长期维护与责任

[事实] 何涛提出“vibe coding 从来没人说是 vibe engineering”，强调写代码本质上是 engineering 工作。 [事实] 他认为工程不是一次性交付，而是长期交付持续有生命力的东西。 [事实] 他指出现有 SWE 或 SWE-pro 这类 benchmark 更偏一次性解决问题，缺少对长期维护 codebase 的衡量。 [事实] 他建议把 Clean Code、Google best practice、Amazon best practice 等沉淀成 skill 或上下文交给 Agent。 [事实] 他反对把代码问题归咎于“这是 Agent 做的”，认为用个人账号提交的东西仍表达了提交者的责任心和品味。

[24:43] MiniMax 内部如何看 AI Coding

[事实] 嘉宾提到，在大型企业代码库中，AI Coding 让一个人能处理更多仓库和更多改动，但验证没有跟上。 [事实] 观点是生产能力在极大提升，但验证、交付和 Review 方面的 Harness 与模型都还不够。 [事实] 他认为应在验证上投入接近研发生产的能力，否则项目到足够复杂后会出问题。 [事实] MiniMax 也在用类似方式开发训练和训练系统，通过 issue 分阶段推进，并用测试、benchmark、项目规则等方式验证。 [推测] AI Coding 的瓶颈正在从“能不能生成代码”转向“能不能可靠验证、维护和交付”。

[27:38] 从数据标注到专家共建

[事实] 闫俊杰表示，AI 的核心是生产力，模型像工具一样让思考和验证过程变得更快，但实质仍是行业里的真实问题。 [事实] 他认为光靠模型或 researcher 不够；在 Coding 场景里，开发工程师比算法同学更理解什么是好的 coding。 [事实] 他把 Coding 场景中的角色概括为 researcher 和 engineer，而更多领域需要 researcher、开发工程师和真正的领域专家三个角色。 [事实] 他提到 Anthropic 有经济学家、心理学家、核物理学家、哲学家等非 researcher/engineer 角色。 [事实] MiniMax 接下来会在安全、金融、法律等领域更深入引入类似专家。

[30:58] 2026 下半年：金融 AI 的陪伴与引导

[事实] 于阳没有推荐个股，而是说 AI 和大模型在应用场景中有一点是以前的东西替代不了的：陪伴。 [事实] 他把金融场景里的陪伴与用户赚钱、亏钱时的心理状态联系起来。 [事实] 他表示早期做 Agent 时主要是限制模型发挥，不让它做奇怪的事情；随着 Agent 进步，接下来要引导模型思考和做创造性的事情。 [推测] 金融 AI 的方向可能从“防止犯错”逐渐转向“在边界内提升主动性和创造力”。

[32:18] AI 走进家庭与个人化助手

[事实] 何涛提到自己写过名为 How AI Shapes Our Society 的专栏，关注 AI 如何改变社会。 [事实] 他认为国内模型在 2026 年后跨过某个基点，已经具备走进千家万户的机会。 [事实] 他分享了为妻子搭建个人化 AI 助手的例子，把体检报告、吃过的药、聊天记录等导入，让她能准备看医生时要问的问题，并改善与医生沟通。 [事实] 他认为普通人有机会用 AI 让家人、身边人和更多事情变得更好。 [推测] 这一段把 AI Coding 的价值从效率扩展到个人照护、家庭场景和情绪支持。

[34:47] AI 降临派、竞争与保留人的思考

[事实] 张家园说自己是“AI 降临派”，认定 AI 能力发展到后面一定会比人强。 [事实] 他认为未来已经不是人与人竞争，而是在与 Agent 或 AI 竞争。 [事实] 他也提醒，人容易把思考外包给 AI；他的做法是可以和 AI 探索，但把最重要的思考部分留给自己。 [推测] 他的立场不是拒绝 AI，而是在承认 AI 会更强的同时，保留人的判断与主体性。

[36:00] 智能终局：让 AI 帮人理解 AI

[事实] 闫俊杰表示，现在的 AI 本质上是黑盒，作为建设者也不知道一年后会怎么样，只知道它会进步。 [事实] 他认为现有数学工具不足以充分解释 AI，例如超过三层的神经网络用现有数学工具也难以分析。 [事实] 他特别关心什么时候 AI 能帮助人类理解 AI，因为这关系到安全问题、AI 能走多远等答案。 [事实] 他提到大脑和神经网络之间存在很强相关性，并认为 AI 本身的可解释性也需要靠 AI 一起推进。 [推测] 本期最后把讨论从产品和工程推进到认知层面：智能的终局之一可能是用更强的智能解释智能本身。

播客点评/总结

[推测] 这期的价值在于把模型公司、开源项目、AI Coding 实践者和金融垂直场景放在同一张桌上，讨论不是停留在“模型多强”，而是落到 Token 成本、工程治理、验证体系、专家参与和真实用户需求。

[推测] 最大亮点是嘉宾们对 AI Coding 的态度比较清醒：他们承认生产力提升巨大，但反复强调软件工程、长期维护、Review、测试、项目品味和责任归属没有消失。这对正在把 Agent 引入研发流程的团队很有参考价值。

[推测] 局限在于圆桌表达较口语化，转录中也有不少 ASR 错字；部分量化判断如“进步速度最快”“十倍差距”“3T 到 10T”没有展开完整数据来源，适合当作嘉宾观点和行业一线观察，而不宜直接当作严格研究结论。

[推测] 适合关注 AI Coding、Agent 工程化、模型公司策略、开源项目治理、金融 AI 落地和 AI 长期社会影响的开发者、产品经理、技术管理者与创业者收听。