Vol. 160 一年多以后,再聊AI写代码Vibe Coding
一年多以后,再聊 AI 写代码 Vibe Coding
概览
本期从 Justin 做的 NewSpot 小工具说起,但重点不是介绍产品,而是借它回看一年多来 AI 写代码和 Vibe Coding 的变化:从 2024 年还需要强监督的 Cursor/Claude 工作流,发展到 2025 年 Coding Agent、YOLO 模式、长任务循环和多窗口并行。
节目以一篇 2025 年 LLM 年度回顾文章为线索,讨论推理模型、Agent、AI 搜索、图像编辑、MCP、AI 浏览器和手机编程等趋势。两位主播的核心判断是:AI 已经深刻改变写代码、搜索、内容生产和个人创作方式,但它仍然是工具,不是许愿池,也不是可以完全放手的“人”。
后半段围绕真实 Vibe Coding 经验展开:NewSpot 的开发、测试驱动、Code Review、提示词、模型选择、成本、团队组织和个人能力升级。节目最后提醒,AI 带来的效率和上瘾感很强,但人仍然需要慢下来,把注意力放在真正重要的产品判断和创造力上。
分段落总结
[00:00] 节目缘起:从 NewSpot 聊到 Vibe Coding
[事实] 主播原本想做年度回顾,但因为 Justin 最近做了 NewSpot,小工具引出了关于 Vibe Coding 的讨论。 [事实] Justin 表示不想把节目变成产品广告,所以更想聊背后的 AI 写代码经验。 [事实] 他们回忆 2024 年第 125 期曾聊过“AI 终于能帮我们写代码了吗”。
[01:47] 从强监督到 YOLO 模式
[事实] 主播认为 2024 年 AI 写代码还强调需要人监督,但 2025 年已经出现完全放手的 YOLO 模式。 [事实] YOLO 模式指开启危险权限后,Coding Agent 可以自动执行命令,不再逐次询问用户。 [事实] 主播提到这种模式理论上可能删除整台电脑的数据,因此效率和风险同时上升。
[02:52] 2025 年 LLM:推理、Agent 与快速过期
[事实] 节目引用一篇 2025 年 LLM 年度回顾文章,认为这一年很多概念从诞生、流行到过期只用几个月到半年。 [事实] 推理模型被列为重要主题,O1 让人们看到“花更长时间推理可以换来更高质量答案”。 [事实] 主播提到 Deep Research、O3、O3 mini、DeepSeek R1 等模型或功能推动了推理能力普及。
[07:32] Agent 的定义与早期局限
[事实] 节目采用“LLM 循环使用工具以达成目标”的 Agent 定义。 [事实] 主播认为早期很多所谓智能体输出质量不佳,尤其是多线程研究后生成文章时效果常常很差。 [推测] 节目倾向认为 Agent 真正可用的前提,是模型能力、工具调用和反馈循环都足够强。
[10:00] Coding Agent 与 AI 搜索的突破
[事实] 主播认为 2025 年两个突破领域是 Coding Agent 和搜索。 [事实] Claude Code 被认为推动了命令行 Coding Agent 的流行,写代码流程开始能形成闭环。 [事实] Google AI Mode、GPT Deep Research 等工具让 AI 搜索逐渐变成许多人的默认入口。
[14:38] AI 搜索的信任与污染风险
[事实] 主播指出传统搜索需要用户打开多个网页交叉验证,而 AI 搜索常常给出一个整合答案。 [事实] Justin 提醒,AI Mode 仍然会出现基本事实错误,严肃搜索不能轻信一次性结果。 [事实] 节目讨论了 SEO、平台内容投放和账号养号可能影响 AI 搜索结果的问题。
[17:33] 从平台漏洞到 AISO
[事实] 主播举例说明有人利用平台漏洞和推荐机制获得流量红利。 [事实] 节目提到面向 AI 的优化正在出现,有人通过测试平台收录和信任机制来影响 AI 答案。 [推测] 这部分讨论暗示,AI 搜索时代会出现新的内容投毒和流量操纵方式。
[24:04] Coding Agent 形态演变
[事实] 主播回顾了从网页对话生成代码、Cursor 接受修改,到命令行 Coding Agent 的演变。 [事实] 他们认为 Claude Code 让命令行里的 Coding Agent 真正流行起来。 [事实] Justin 一开始怀疑命令行写代码为何会比 Cursor 更好,但后来接受了这种工作方式。
[26:51] YOLO 模式的风险边界
[事实] 主播提到自己已经会在同一项目里开多个 Agent 窗口执行不同任务,但建议用不同 worktree 和分支降低冲突。 [事实] 节目借 NASA 挑战者号事故中的“异常正常化”类比 YOLO 模式风险:长期没出事会让人误以为永远安全。 [事实] 他们讨论了 AI 可能访问邮箱、云服务、服务器、股票账户等数字权限,风险不止是删除代码。
[37:10] 非程序员 Vibe Coding 的幻觉
[事实] 节目认为 Vibe Coding 让很多不会写代码的人也能做小工具,并获得很强成就感。 [事实] Justin 提醒,大语言模型不是在真正“聊天”或“许愿”,自然语言只是新的输入方式。 [事实] 主播认为把 AI 当成人或万能实体,是人类对大语言模型产生的另一种幻觉。
[43:47] AI 作为工具:放大能力而非替代判断
[事实] Justin 表示现阶段 AI 对他来说仍然是工具,会放大使用者已有能力。 [事实] 他认为一倍程序员可能被放大为十倍程序员,十倍程序员可能被放大为一百倍程序员。 [推测] 节目强调,AI 的输出质量仍依赖使用者的问题定义、判断力和领域经验。
[44:31] NewSpot:用 AI 筛选科技新闻
[事实] NewSpot 的需求来自科技新闻筛选:每天抓取大量新闻,让模型打 0 到 10 分,再筛出重要内容。 [事实] Justin 认为 2025 年 Gemini、GPT、Anthropic 和部分开源模型的能力已经足够支撑这类产品。 [事实] NewSpot 一开始是个人玩具,后来被打磨成面向大众的产品。
[47:40] “99.99% AI 写代码”背后的门槛
[事实] Justin 说 NewSpot 的编程部分几乎全部由 AI 完成。 [事实] 他不认为“100% AI 写的”本身应该成为产品卖点,因为用户最终购买的是产品而不是开发过程。 [事实] 主播认为真正门槛在于能否识别合理架构、持续迭代、Review 设计,并知道什么才是更好的实现。
[52:29] 测试驱动的 Vibe Coding
[事实] Justin 会先开 Plan Mode,让 AI 写计划文件,并对计划进行多轮 Review。 [事实] 节目强调测试用例非常重要,因为代码生成成本低,但没有测试很难确保上线质量。 [事实] 主播还提醒 AI 可能为了让测试通过而修改测试本身,所以人仍要看 test plan 和最终结果。
[59:01] 最终验收比过程正确更重要
[事实] Justin 发现只验证每个开发步骤不够,还需要最终产品流程测试。 [事实] NewSpot 有一个线上 final test,用来跑完正式生成新闻报告的核心流程。 [事实] 智利也提到 To Camera 项目中,AI 难以自动测试摄像头、画面和保存结果,需要人工按测试路径验证。
[61:15] Code 仍然重要:Debug 与专家价值
[事实] 主播认为现在 code 生成很 cheap,但从 cheap code 中得到高质量代码仍然困难。 [事实] AI 擅长生成代码,但在复杂 Debug 中容易陷入死循环。 [事实] Justin 认为程序员仍然重要,尤其是在定位问题、判断是否重写核心模块和控制风险时。
[65:01] 程序员岗位和团队形态会变化
[事实] 主播认为传统只会写代码的程序员会被替代,但跨产品、设计、运营、市场和技术的人会更重要。 [事实] 他们认为未来可能不再严格区分程序员、产品经理和设计师,而是出现更综合的个人创造者或小团队。 [事实] NewSpot 被用作例子:一个人借助 AI 做完了过去一个小团队要做的很多工作。
[68:03] AI 内容污染与真人感
[事实] Justin 认为 NewSpot 当前有太多 AI 生成部分,会显得冷冰冰。 [事实] 节目讨论了 AI 文章、短视频、杂志图片等内容污染,以及早期 AI 用户可能更快对 AI 内容反感。 [事实] NewSpot 里“每日一句”被设计为 Justin 本人写作,AI 只能提供灵感,不能代写。
[72:41] 个人知识库、品味与偏见
[事实] 智利提到个人知识库可能在未来变得很有价值,因为它保存个人想法、记录和审美来源。 [事实] Justin 认为新闻事实获取成本越来越低,真正重要的是溯源和评论。 [事实] 他认为 NewSpot 的 bias 应该来自他本人,而不是完全无差别的 AI 汇总。
[78:48] 面对 AI 焦虑:成为受益者
[事实] 主播讨论了 AI 发展太快带来的焦虑感。 [事实] Justin 给出的缓解方式是让自己保持在 AI 圈子里,并让每次模型进步都变成自己的收益。 [事实] 智利认为如果正在做的事情没有用到 AI,也不是 AI 产品,就更容易焦虑;参与进去会缓解焦虑。
[80:00] AI 内容与人类内容的边界
[事实] Justin 用晨间新闻播报、宇宙学视频和“世界未解之谜”类视频举例,说明 AI 更容易替代杀时间、低门槛、批量化内容。 [事实] 他认为风言风语这类真人播客仍有独特性,因为真人对话会跳跃、抢话、停顿和产生意外。 [推测] 节目认为有明确人格、审美和真实经验的内容,短期内比流水线 AI 内容更难被替代。
[87:23] Idea 不稀缺,落地能力更重要
[事实] 主播认为 idea 从来都不是最重要的,真正困难的是把它做出来、做好并推向市场。 [事实] 节目用 iPhone、iPad 等例子说明,许多人可能有类似想法,但最终能成功落地的人很少。 [事实] 他们认为 AI 降低了执行成本后,通才和落地能力会更加珍贵。
[100:22] 提示词、表达能力与英文工作流
[事实] 主播认为在 Coding Agent 场景下,自然语言通常已经够用,不一定需要邪门的提示词技巧。 [事实] Justin 认为表达能力会变得重要,因为给 AI 的输入类似新的鼠标键盘操作。 [事实] 他分享自己用英文和 Coding Agent、GPT 语音对话,发现长期使用会反过来提升英文表达。
[107:19] 订阅成本、开源模型与长任务
[事实] 节目提到 200 美元 AI 订阅成为 2025 年的重要现象,并认为它节省的时间通常物超所值。 [事实] 主播提到中国开源模型在海外受到关注,包括 Qwen、MiniMax、GLM、DeepSeek 等。 [事实] 长任务 Agent、循环执行、Manus、从零写浏览器等实验被认为对理解 AI 能力很有价值。
[111:56] 图像编辑、OpenAI 竞争与模型选择
[事实] 主播认为 2025 年也是提示词驱动图像编辑之年,从 GPT 风格图到 Nano Banana、Nano Banana Pro 都很重要。 [事实] 节目认为 OpenAI 在 2025 年不再像 2024 年那样明显领先,Claude Code 在编程领域表现很强。 [事实] 智利建议做产品和创作时优先选最好的模型;Justin 补充模型选择也和个人习惯、任务风格有关。
[116:44] MCP、AI 浏览器与手机编程
[事实] 主播认为 MCP 可能逐渐被 Skills 或更自然的 API 方式替代,因为 MCP 会占上下文。 [事实] 他们提到 AI 浏览器、Chrome 里的 Gemini、沉浸式翻译等场景。 [事实] Justin 还分享用手机连接家里的 Coding Agent,以及用 Tmux 保持远程终端会话的工作流。
[120:11] Agent 工作流小技巧与语音输入
[事实] 智利分享了给 Agent 加 hook,任务完成时播放微波炉提示音,方便自己及时处理。 [事实] Justin 提到用麦克风、Whisper 或 Wispr Flow 类工具进行语音输入,可以提升和 Agent 交流的效率。 [事实] 主播认为这些工具让 AI 写代码逐渐变成一种持续运行、随时接入的工作状态。
[122:34] 声音克隆与 AI 音频内容
[事实] Justin 测试了 Edge TTS、MiniMax 等声音方案,认为声音克隆效果超出预期。 [事实] 他认为声音已经不是最大问题,真正的关键变成文稿质量。 [事实] 主播也指出 AI 声音仍缺少真人的迟疑、说错、节奏变化和意外感,听久后会暴露模式感。
[125:01] 收尾:慢下来,别被 AI 牵着走
[事实] 主播提到春节前可能会休息,除非有突发事件。 [事实] Justin 反思自己有时为了用完订阅额度或持续推进任务而熬到很晚,后来发现脑子跟不上。 [事实] 他认为应该慢下来,把时间精力放在真正重要的事情上,而不是变成被 AI 指挥的员工。
播客点评/总结
本期的价值在于,它不是泛泛谈“AI 会不会取代程序员”,而是从真实项目、真实工具链和真实踩坑出发,讲清楚了 Vibe Coding 在 2025 年到底改变了什么:代码生成变便宜了,但产品判断、测试、Debug、架构 Review 和最终验收反而更重要。
亮点是讨论跨度很大,从 Claude Code、Codex、Gemini、AI Mode、MCP、Nano Banana,到 NewSpot、语音输入、Tmux、手机远程 Agent 和声音克隆,都落在具体使用经验上。它尤其适合已经在用 AI 写代码、准备把个人工具产品化,或者正在思考 AI Native 团队形态的人。
局限是节目较长,话题跳跃明显,很多概念依赖听众已有背景;如果完全不了解 Coding Agent、Git、测试、命令行或模型订阅,理解成本会比较高。[推测] 对非技术听众来说,本期最有价值的部分可能不是工具细节,而是“AI 是能力放大器,不是许愿池”和“真人品味会更重要”这两条主线。