Vol. 160 一年多以后，再聊AI写代码Vibe Coding

2026-02-01 · Show: 枫言枫语 · 7631s · Source

一年多以后，再聊 AI 写代码 Vibe Coding

概览

本期从 Justin 做的 NewSpot 小工具说起，但重点不是介绍产品，而是借它回看一年多来 AI 写代码和 Vibe Coding 的变化：从 2024 年还需要强监督的 Cursor/Claude 工作流，发展到 2025 年 Coding Agent、YOLO 模式、长任务循环和多窗口并行。

节目以一篇 2025 年 LLM 年度回顾文章为线索，讨论推理模型、Agent、AI 搜索、图像编辑、MCP、AI 浏览器和手机编程等趋势。两位主播的核心判断是：AI 已经深刻改变写代码、搜索、内容生产和个人创作方式，但它仍然是工具，不是许愿池，也不是可以完全放手的“人”。

后半段围绕真实 Vibe Coding 经验展开：NewSpot 的开发、测试驱动、Code Review、提示词、模型选择、成本、团队组织和个人能力升级。节目最后提醒，AI 带来的效率和上瘾感很强，但人仍然需要慢下来，把注意力放在真正重要的产品判断和创造力上。

分段落总结

[00:00] 节目缘起：从 NewSpot 聊到 Vibe Coding

[事实] 主播原本想做年度回顾，但因为 Justin 最近做了 NewSpot，小工具引出了关于 Vibe Coding 的讨论。 [事实] Justin 表示不想把节目变成产品广告，所以更想聊背后的 AI 写代码经验。 [事实] 他们回忆 2024 年第 125 期曾聊过“AI 终于能帮我们写代码了吗”。

[01:47] 从强监督到 YOLO 模式

[事实] 主播认为 2024 年 AI 写代码还强调需要人监督，但 2025 年已经出现完全放手的 YOLO 模式。 [事实] YOLO 模式指开启危险权限后，Coding Agent 可以自动执行命令，不再逐次询问用户。 [事实] 主播提到这种模式理论上可能删除整台电脑的数据，因此效率和风险同时上升。

[02:52] 2025 年 LLM：推理、Agent 与快速过期

[事实] 节目引用一篇 2025 年 LLM 年度回顾文章，认为这一年很多概念从诞生、流行到过期只用几个月到半年。 [事实] 推理模型被列为重要主题，O1 让人们看到“花更长时间推理可以换来更高质量答案”。 [事实] 主播提到 Deep Research、O3、O3 mini、DeepSeek R1 等模型或功能推动了推理能力普及。

[07:32] Agent 的定义与早期局限

[事实] 节目采用“LLM 循环使用工具以达成目标”的 Agent 定义。 [事实] 主播认为早期很多所谓智能体输出质量不佳，尤其是多线程研究后生成文章时效果常常很差。 [推测] 节目倾向认为 Agent 真正可用的前提，是模型能力、工具调用和反馈循环都足够强。

[10:00] Coding Agent 与 AI 搜索的突破

[事实] 主播认为 2025 年两个突破领域是 Coding Agent 和搜索。 [事实] Claude Code 被认为推动了命令行 Coding Agent 的流行，写代码流程开始能形成闭环。 [事实] Google AI Mode、GPT Deep Research 等工具让 AI 搜索逐渐变成许多人的默认入口。

[14:38] AI 搜索的信任与污染风险

[事实] 主播指出传统搜索需要用户打开多个网页交叉验证，而 AI 搜索常常给出一个整合答案。 [事实] Justin 提醒，AI Mode 仍然会出现基本事实错误，严肃搜索不能轻信一次性结果。 [事实] 节目讨论了 SEO、平台内容投放和账号养号可能影响 AI 搜索结果的问题。

[17:33] 从平台漏洞到 AISO

[事实] 主播举例说明有人利用平台漏洞和推荐机制获得流量红利。 [事实] 节目提到面向 AI 的优化正在出现，有人通过测试平台收录和信任机制来影响 AI 答案。 [推测] 这部分讨论暗示，AI 搜索时代会出现新的内容投毒和流量操纵方式。

[24:04] Coding Agent 形态演变

[事实] 主播回顾了从网页对话生成代码、Cursor 接受修改，到命令行 Coding Agent 的演变。 [事实] 他们认为 Claude Code 让命令行里的 Coding Agent 真正流行起来。 [事实] Justin 一开始怀疑命令行写代码为何会比 Cursor 更好，但后来接受了这种工作方式。

[26:51] YOLO 模式的风险边界

[事实] 主播提到自己已经会在同一项目里开多个 Agent 窗口执行不同任务，但建议用不同 worktree 和分支降低冲突。 [事实] 节目借 NASA 挑战者号事故中的“异常正常化”类比 YOLO 模式风险：长期没出事会让人误以为永远安全。 [事实] 他们讨论了 AI 可能访问邮箱、云服务、服务器、股票账户等数字权限，风险不止是删除代码。

[37:10] 非程序员 Vibe Coding 的幻觉

[事实] 节目认为 Vibe Coding 让很多不会写代码的人也能做小工具，并获得很强成就感。 [事实] Justin 提醒，大语言模型不是在真正“聊天”或“许愿”，自然语言只是新的输入方式。 [事实] 主播认为把 AI 当成人或万能实体，是人类对大语言模型产生的另一种幻觉。

[43:47] AI 作为工具：放大能力而非替代判断

[事实] Justin 表示现阶段 AI 对他来说仍然是工具，会放大使用者已有能力。 [事实] 他认为一倍程序员可能被放大为十倍程序员，十倍程序员可能被放大为一百倍程序员。 [推测] 节目强调，AI 的输出质量仍依赖使用者的问题定义、判断力和领域经验。

[44:31] NewSpot：用 AI 筛选科技新闻

[事实] NewSpot 的需求来自科技新闻筛选：每天抓取大量新闻，让模型打 0 到 10 分，再筛出重要内容。 [事实] Justin 认为 2025 年 Gemini、GPT、Anthropic 和部分开源模型的能力已经足够支撑这类产品。 [事实] NewSpot 一开始是个人玩具，后来被打磨成面向大众的产品。

[47:40] “99.99% AI 写代码”背后的门槛

[事实] Justin 说 NewSpot 的编程部分几乎全部由 AI 完成。 [事实] 他不认为“100% AI 写的”本身应该成为产品卖点，因为用户最终购买的是产品而不是开发过程。 [事实] 主播认为真正门槛在于能否识别合理架构、持续迭代、Review 设计，并知道什么才是更好的实现。

[52:29] 测试驱动的 Vibe Coding

[事实] Justin 会先开 Plan Mode，让 AI 写计划文件，并对计划进行多轮 Review。 [事实] 节目强调测试用例非常重要，因为代码生成成本低，但没有测试很难确保上线质量。 [事实] 主播还提醒 AI 可能为了让测试通过而修改测试本身，所以人仍要看 test plan 和最终结果。

[59:01] 最终验收比过程正确更重要

[事实] Justin 发现只验证每个开发步骤不够，还需要最终产品流程测试。 [事实] NewSpot 有一个线上 final test，用来跑完正式生成新闻报告的核心流程。 [事实] 智利也提到 To Camera 项目中，AI 难以自动测试摄像头、画面和保存结果，需要人工按测试路径验证。

[61:15] Code 仍然重要：Debug 与专家价值

[事实] 主播认为现在 code 生成很 cheap，但从 cheap code 中得到高质量代码仍然困难。 [事实] AI 擅长生成代码，但在复杂 Debug 中容易陷入死循环。 [事实] Justin 认为程序员仍然重要，尤其是在定位问题、判断是否重写核心模块和控制风险时。

[65:01] 程序员岗位和团队形态会变化

[事实] 主播认为传统只会写代码的程序员会被替代，但跨产品、设计、运营、市场和技术的人会更重要。 [事实] 他们认为未来可能不再严格区分程序员、产品经理和设计师，而是出现更综合的个人创造者或小团队。 [事实] NewSpot 被用作例子：一个人借助 AI 做完了过去一个小团队要做的很多工作。

[68:03] AI 内容污染与真人感

[事实] Justin 认为 NewSpot 当前有太多 AI 生成部分，会显得冷冰冰。 [事实] 节目讨论了 AI 文章、短视频、杂志图片等内容污染，以及早期 AI 用户可能更快对 AI 内容反感。 [事实] NewSpot 里“每日一句”被设计为 Justin 本人写作，AI 只能提供灵感，不能代写。

[72:41] 个人知识库、品味与偏见

[事实] 智利提到个人知识库可能在未来变得很有价值，因为它保存个人想法、记录和审美来源。 [事实] Justin 认为新闻事实获取成本越来越低，真正重要的是溯源和评论。 [事实] 他认为 NewSpot 的 bias 应该来自他本人，而不是完全无差别的 AI 汇总。

[78:48] 面对 AI 焦虑：成为受益者

[事实] 主播讨论了 AI 发展太快带来的焦虑感。 [事实] Justin 给出的缓解方式是让自己保持在 AI 圈子里，并让每次模型进步都变成自己的收益。 [事实] 智利认为如果正在做的事情没有用到 AI，也不是 AI 产品，就更容易焦虑；参与进去会缓解焦虑。

[80:00] AI 内容与人类内容的边界

[事实] Justin 用晨间新闻播报、宇宙学视频和“世界未解之谜”类视频举例，说明 AI 更容易替代杀时间、低门槛、批量化内容。 [事实] 他认为风言风语这类真人播客仍有独特性，因为真人对话会跳跃、抢话、停顿和产生意外。 [推测] 节目认为有明确人格、审美和真实经验的内容，短期内比流水线 AI 内容更难被替代。

[87:23] Idea 不稀缺，落地能力更重要

[事实] 主播认为 idea 从来都不是最重要的，真正困难的是把它做出来、做好并推向市场。 [事实] 节目用 iPhone、iPad 等例子说明，许多人可能有类似想法，但最终能成功落地的人很少。 [事实] 他们认为 AI 降低了执行成本后，通才和落地能力会更加珍贵。

[100:22] 提示词、表达能力与英文工作流

[事实] 主播认为在 Coding Agent 场景下，自然语言通常已经够用，不一定需要邪门的提示词技巧。 [事实] Justin 认为表达能力会变得重要，因为给 AI 的输入类似新的鼠标键盘操作。 [事实] 他分享自己用英文和 Coding Agent、GPT 语音对话，发现长期使用会反过来提升英文表达。

[107:19] 订阅成本、开源模型与长任务

[事实] 节目提到 200 美元 AI 订阅成为 2025 年的重要现象，并认为它节省的时间通常物超所值。 [事实] 主播提到中国开源模型在海外受到关注，包括 Qwen、MiniMax、GLM、DeepSeek 等。 [事实] 长任务 Agent、循环执行、Manus、从零写浏览器等实验被认为对理解 AI 能力很有价值。

[111:56] 图像编辑、OpenAI 竞争与模型选择

[事实] 主播认为 2025 年也是提示词驱动图像编辑之年，从 GPT 风格图到 Nano Banana、Nano Banana Pro 都很重要。 [事实] 节目认为 OpenAI 在 2025 年不再像 2024 年那样明显领先，Claude Code 在编程领域表现很强。 [事实] 智利建议做产品和创作时优先选最好的模型；Justin 补充模型选择也和个人习惯、任务风格有关。

[116:44] MCP、AI 浏览器与手机编程

[事实] 主播认为 MCP 可能逐渐被 Skills 或更自然的 API 方式替代，因为 MCP 会占上下文。 [事实] 他们提到 AI 浏览器、Chrome 里的 Gemini、沉浸式翻译等场景。 [事实] Justin 还分享用手机连接家里的 Coding Agent，以及用 Tmux 保持远程终端会话的工作流。

[120:11] Agent 工作流小技巧与语音输入

[事实] 智利分享了给 Agent 加 hook，任务完成时播放微波炉提示音，方便自己及时处理。 [事实] Justin 提到用麦克风、Whisper 或 Wispr Flow 类工具进行语音输入，可以提升和 Agent 交流的效率。 [事实] 主播认为这些工具让 AI 写代码逐渐变成一种持续运行、随时接入的工作状态。

[122:34] 声音克隆与 AI 音频内容

[事实] Justin 测试了 Edge TTS、MiniMax 等声音方案，认为声音克隆效果超出预期。 [事实] 他认为声音已经不是最大问题，真正的关键变成文稿质量。 [事实] 主播也指出 AI 声音仍缺少真人的迟疑、说错、节奏变化和意外感，听久后会暴露模式感。

[125:01] 收尾：慢下来，别被 AI 牵着走

[事实] 主播提到春节前可能会休息，除非有突发事件。 [事实] Justin 反思自己有时为了用完订阅额度或持续推进任务而熬到很晚，后来发现脑子跟不上。 [事实] 他认为应该慢下来，把时间精力放在真正重要的事情上，而不是变成被 AI 指挥的员工。

播客点评/总结

本期的价值在于，它不是泛泛谈“AI 会不会取代程序员”，而是从真实项目、真实工具链和真实踩坑出发，讲清楚了 Vibe Coding 在 2025 年到底改变了什么：代码生成变便宜了，但产品判断、测试、Debug、架构 Review 和最终验收反而更重要。

亮点是讨论跨度很大，从 Claude Code、Codex、Gemini、AI Mode、MCP、Nano Banana，到 NewSpot、语音输入、Tmux、手机远程 Agent 和声音克隆，都落在具体使用经验上。它尤其适合已经在用 AI 写代码、准备把个人工具产品化，或者正在思考 AI Native 团队形态的人。

局限是节目较长，话题跳跃明显，很多概念依赖听众已有背景；如果完全不了解 Coding Agent、Git、测试、命令行或模型订阅，理解成本会比较高。[推测] 对非技术听众来说，本期最有价值的部分可能不是工具细节，而是“AI 是能力放大器，不是许愿池”和“真人品味会更重要”这两条主线。