EP127 从 Skills 到自动化工作流,论 Agent 如何接管真实生产力 ⚙️

2026-06-09 · Show: 硬地骇客 · 3069s · Source

EP127 从 Skills 到自动化工作流,论 Agent 如何接管真实生产力

概览

本期围绕 Skills 如何真正进入日常工作流展开,核心问题是:哪些 Skills 值得安装、哪些适合自己写,以及它们如何从“提示词补丁”变成 Agent 自动化生产力的一部分。

讨论者反复强调,判断 Skill 价值的关键不在于它是否热门,而在于它是否解决重复性工作,或补足自己不熟悉领域的能力。Coding 场景中,大家更看重能帮助 Agent 完成真实验证、测试闭环、需求澄清和发布流程的 Skills。

节目后半段把话题扩展到非 Coding 场景,包括播客知识管理、微信读书笔记、邮件处理、流量分析、服务器成本监控、投资信息整理等。大家也讨论了 Skills 变多后带来的失控感、权限与责任问题,以及为什么真正有价值的 Skills 往往来自日常琐事的自动化。

分段落总结

[00:00] 开场与本期问题设定

[事实] 本期节目由 Podwise 赞助,开场介绍了 Podwise 可以对播客进行转录、提取、总结和分析,并与 Notion、Readwise 等工具打通知识管理流程。 [事实] 主持人提出本期核心问题:自从 Skills 概念推出后,哪些 Skills 真正改变了大家日常工作流,如果从零搭建 Agent 工作流,应该保留哪些 Skills。 [事实] 讨论从“如何判断一个 Skill 是否值得用”开始,强调不能把所有 Skill 都试一遍,需要有筛选标准。

[00:01] 用 Agent 找 Skills,并只安装必要项

[事实] 讨论者提到自己会在初始化工程时,让 Agent 使用 find skills 之类的能力去寻找适合当前工程的 Skills。 [事实] 他会要求 Agent “只选必要的”,避免把相关但不必要的 Skills 全部安装进来。 [事实] 技术栈相关的 Skills,例如 React best practices、shadcn 相关能力,通常会放在工程目录下,而不是全局目录,因为它们和具体项目绑定。 [事实] 这类 Skills 的价值在于给 Agent 提供最佳实践,减少奇怪代码、安全问题和边界问题。

[02:42] 在实际卡点中发现 Skill 需求

[事实] 讨论者以 Podwise iOS app 测试验收为例,说明直接让 Codex 操作时也能尝试执行,但会在模拟点击、CLI 操作等环节遇到阻碍。 [事实] 他发现 build iOS app 相关 Skills 和 Codex 内置 computer use 中的能力,可以帮助 Agent 操作模拟器和完成测试流程。 [事实] 他认为应在使用过程中观察 Agent 缺失什么能力,或哪些流程需要反复写提示词,再去找 Skill 或自己做 Skill。 [推测] 这里隐含的判断是:Skill 更像是对稳定流程和常见卡点的固化,而不是一次性任务的临时提示词。

[04:03] 判断 Skill 是否值得用的两个标准

[事实] 主持人总结,值得使用的 Skill 首先要解决每天、每周或每月都会重复出现的工作。 [事实] 第二类值得关注的 Skill 是能帮助用户进入不熟悉、不擅长的领域,例如营销推广、SEO、销售相关 Skills。 [事实] 讨论中提到有专门收集 marketing skills 的网站,适合在营销、销售等非技术强项领域提供辅助。 [事实] 对自己擅长的重复性工作,讨论者更倾向于自己写 Skill,并且这些项目内 Skills 生命周期可能很短,会经常删除或修改。

[06:37] Coding 场景中的前端、设计与自动化 Skills

[事实] 在 Coding 场景里,有人最关注前端和设计方向的 Skills,因为这是自己不擅长的领域。 [事实] 被提到的工具或资源包括 Frontend Design、相关设计 Skill,以及 Design.md 这类本质上类似 Skill 的设计指南仓库。 [事实] 另一类高价值 Skills 是 CICD、构建、部署、跑测试和自动修复 bug 等重复性开发流程。 [事实] 讨论者认为测试尤其适合写成 Skill,因为它可以让产品跑起来并由 Agent 自己验证。

[10:21] 真实验证比技术栈知识更关键

[事实] 讨论者提到 skills.sh 上安装量靠前的大多是 Coding 相关 Skills,且很多是特定技术栈知识。 [事实] 他认为最有用的不一定是技术栈知识,而是能让 Agent 对迭代结果进行真实验证的 Skills,例如 Playwright 和 Codex 内置 computer use。 [事实] 只有 Agent 能自己做真实验证,开发任务才更可能形成完整闭环。 [事实] 讨论中提到“现在不写提示词,而是写 loops”,强调用循环流程驱动 AI 编码。

[12:00] 用 Grill Me 澄清需求

[事实] 主持人提到 Matt Pocock 的 skills for real engineers,其中的 grill me 用于在开发前不断追问需求细节。 [事实] grill me 会围绕模糊需求提出问题,直到需求被澄清,并可生成 context.md 供后续开发使用。 [事实] 讨论者认为需求描述不清会导致 AI 长时间执行后偏差很大,尤其是在 Codex go 或 loop 类长任务中。 [推测] 这一段把 Skill 的价值从“执行更快”扩展到了“前期对齐更清楚”,减少后续返工。

[14:43] Codex 编码工作流:讨论、计划、执行、Review、发布

[事实] 一位讨论者目前主要使用 Codex,工作流大致包括先与 Agent 讨论需求,复杂需求用 plan mode 做计划,再执行计划。 [事实] 计划中会包含如何验证需求已经完成。 [事实] 执行后会让 Codex 自己从安全、性能、边界条件等角度 review,并修掉发现的问题。 [事实] 最后根据任务复杂度进行人工复核或只看最终结果,再让 Codex 提交、发版,并验证线上环境是否正常。 [事实] 从 Codex 视角看,agents.md 和 Skills 会约束它执行格式化、diff 检查、编译、静态类型检查、单测和端到端测试等多个小步骤。

[17:20] 从零做产品时,先让 AI 生成技术栈与架构地图

[事实] 另一位讨论者分享了从零构建工具或产品的流程:先拿 idea 和 AI 讨论,确定技术栈方向。 [事实] 他认为今天技术栈不一定像过去团队项目那样固定,AI 可能会给出超出原有经验范围的技术选择。 [事实] 确定技术栈后,会让 Agent 初始化 repo 架构,划分 DB 层、API 层、插件层等模块。 [事实] 他把初始架构文档称为“架构地图”,用于让后续功能开发遵守模块边界,但这个地图后续也会调整。

[20:18] AI Coding 让人从代码细节转向架构和结果

[事实] 讨论者说自己越来越敢把更大粒度的功能交给 Agent 一次性完成,包括前端、后台和 DB 全链路。 [事实] 他现在不再细看代码细节,而是看 Git diff 涉及哪些文件,以及这些修改是否落在架构地图的正确模块中。 [事实] 过去会在意命名、API 定义等细节,现在这些细节在 AI Coding 中被弱化。 [事实] 他通常在功能做出七八成后,再集成测试和设计系统,并让 AI 统一调整前端视觉、主题和页面。 [推测] 这反映出 AI Coding 可能改变程序员的关注点:从局部代码洁癖转向系统边界、功能验收和整体体验。

[24:13] Landing Page 的图片先行设计流程

[事实] 主持人分享 Podwise 官网新版前端的制作方法:先从 Dribbble、推特等地方找参考图,再让 ChatGPT 结合参考风格和现有网站内容生成 landing page 图片。 [事实] 在选出效果较好的图片后,会让 ChatGPT 对图片进行分层,提取其中的素材。 [事实] 随后把设计图和素材交给 Claude Code 或 Codex 实现前端。 [事实] 他还会让 ChatGPT 同时生成 Web 版和 Mobile 版响应式效果图,再交给 Codex 实现。 [推测] 这种流程把设计探索交给图像生成,把工程实现交给编码 Agent,适合对视觉要求较高但结构相对简单的页面。

[27:54] 非 Coding 场景:播客、笔记和数字资产管理

[事实] 跳出 Coding 后,一位讨论者说自己最常调用的是 Podwise Skill,甚至不太再打开 Podwise 网站浏览播客。 [事实] 他还围绕自己的笔记系统积累了知识管理相关 Skills,希望把超过 100 期播客节目作为数字资产保存和盘活。 [事实] 他提到过去使用笔记软件时,很多长期不看的笔记最终会随软件更换一起被放弃。 [事实] 微信读书 Skill 也被提到,用于查看书架、笔记情况,并把读书笔记同步到自己的笔记系统中。

[30:34] Automation 让日常事务定时运行

[事实] 另一位讨论者在非 Coding 场景中主要使用日常事务类 Skills,并搭配 Codex Automation 定时运行。 [事实] 例子包括每天检查邮件、分析自家流量、监控服务器成本、监控美股持仓变化和相关股票新闻、监控行业趋势。 [事实] 主持人补充,Codex Automation、Poe 或 OpenCloud 里的定时任务,本质上都能让 Skills 定期运行。 [事实] 他自己写过 Podwise 相关 Skill,用 Podwise popular 找热门播客,再用“解密”的方式整理内容并发布到 X Article。

[32:47] 热门但不一定有用的 Skills

[事实] 讨论中提到一些曾经很火的 Skills,例如通四点 skill、女娲点 skill、POA/PVS 类 Skills。 [事实] 一位讨论者安装后发现自己没有对应需求,尤其没有“和 AI 聊天”的需求,只需要讨论具体工作或产品,因此最后删除了。 [事实] 他认为这些 Skills 中仍有值得学习的地方,例如提炼表达习惯、写作风格或个人数字资产,用来构建自己的风格化 Skill。 [事实] 另一位讨论者装 Skills 比较保守,担心装多后 Agent 行为更乱、消耗更多 token,因此通常只在发现 Agent 知识缺失时才安装。

[36:30] 失控感、权限和责任的变化

[事实] 讨论者围绕“失控感”展开,提到一年前大家会担心把个人内容交给 AI 像是在给自己装监控。 [事实] 他认为经过一年后,人们对权限、隐私和 AI 读取电脑内容的心理接受度正在变高。 [事实] 主持人补充,知道 OpenCloud 由一个人用 AI 写、且作者不看代码后,自己也更少 review AI 生成代码。 [事实] 他们也提到交叉 review:例如让 Codex 写完后交给 Claude Code review,再把 review 结果交回 Codex 判断和修复。 [事实] 讨论者提醒,信任 Agent 的隐含代价是人仍然要为 Agent 的错误承担现实责任。

[41:40] Superpowers、Grill Me 与 TDD 的取舍

[事实] 主持人提到 Codex 官方推荐过 superpowers 这类火热 Skill 合集,但自己装了之后觉得太复杂、不太会用。 [事实] 相比之下,他更适应 skills for real engineers 里的 grill me,以及其中 TDD 相关能力。 [事实] 他认为自己主要把控两点:先把需求讲清楚,再要求用 TDD、单测和端到端集成测试来保证结果。 [事实] 他会让 Agent 梳理用户故事和用户旅程,以便后续做完整测试。

[43:32] 自己写 Skills:内容解密、CI/CD 和知识编译

[事实] 主持人写过一个 X“解密”Skill,用来把 Podwise transcript 整理成解读文章。 [事实] 另一位讨论者自己写的 Skills 主要分两类:一类是 Coding 里的个人环境和 CI/CD 流程集成,另一类是个人笔记和数字资产管理。 [事实] 他会让 Skill 定时同步播客文字稿,再把每期文字稿编译成结构化知识,例如人物、产品和主题,方便未来检索。 [事实] 他还提到 Podwise 运维场景中,Skill 可以帮助定位 AI 任务失败,减少手动到多个网站查询数据的麻烦。

[46:00] Skill 最适合处理无趣但重复的日常事务

[事实] 讨论者认为 Skill 真正发挥价值的地方,往往是看似不起眼、重复发生、每天不得不做但又无趣的日常事务。 [事实] 他认为宏大、有创意的事情未必适合 Skill,反而是无趣琐碎的事情更应该被自动化。 [事实] 写 Skill 本身也可以交给 AI Agent,只需要告诉它工作流、数据获取方式和可使用程序,让它编排 Skill。 [推测] 这里的观点接近“Agent 自我进化”:通过把反复出现的流程沉淀成 Skills,Agent 的可用能力会逐步积累。

[47:13] 邮件、代码同步和投资类 Skills

[事实] 一位讨论者自己写的 Skills 分为三类:日常工作、Coding 和投资。 [事实] 日常工作中,邮件 Skill 会检查 Gmail,把待回复 support 邮件翻译成中文,再根据原文语言、问题分类和用户情绪润色回复。 [事实] Coding 中,Podwise 网站版本和 App 共用部分代码但不是同一工程,因此他把同步代码、检查差异和判断 override 文件的流程做成了 Skill。 [事实] 投资类 Skill 会读取持仓、历史价格、期权链数据和新闻事件,给出当天操作建议,但他认为这一类不如前两类好用,因为自己相关知识不足。 [事实] 最后总结到 DRY 原则:过去重复三次以上可能写 shell 脚本,现在可以写 Skill。

播客点评/总结

本期的价值在于,它没有把 Skills 当成单纯的“插件推荐清单”,而是放回真实工作流里讨论:什么时候该装、什么时候该写、什么时候该删除,以及如何和 Codex、Claude Code、Automation、TDD、Playwright、computer use 组合成闭环。

[推测] 对程序员、独立开发者、产品型创业者来说,这期尤其有参考价值,因为它展示了 AI Coding 从“帮我写一段代码”走向“帮我澄清需求、规划、实现、测试、发布和监控”的完整过程。

[推测] 本期的局限是讨论高度依赖几位嘉宾自己的工具栈和工作方式,例如 Codex、Podwise、微信读书、X Article 等场景;如果听众没有类似的数字资产或自动化需求,部分案例需要自行迁移。

[推测] 最值得带走的结论是:不要因为某个 Skill 热门就安装它,而要从自己的重复工作和薄弱领域出发。真正能提升生产力的 Skill,通常不是最炫的,而是那个每天帮你少做一遍无聊流程的。