Agent 元年第 500 天:什么在消失,什么在诞生——为什么我们不该再投资 GUI 思维的软件?

2026-07-01 · Show: 十字路口Crossing · 3125s · Source

Agent 元年第 500 天:GUI 思维、Headless 软件与智能体经济

概览

本期是「此话当真」与「十字路口」的串台节目,围绕 Agent 元年第 500 天展开复盘。嘉宾从模型能力、产品化、Headless 软件、CLI、Skill、Agentic Economy、Open Cloud 和 Token Grant 等关键词切入,讨论 AI Agent 正在改变什么。

核心判断是:模型能力的进展显著快于许多人的预期,但产品形态仍处在早期。讨论多次回到同一个问题:当任务执行者从人变成 Agent,软件是否还应该以 GUI 为中心,还是应该把能力开放给 Agent、CLI、Skill 或新的接口网络。

节目也强调,GUI 并不会完全消失。面向人类建立信任、展示结果、降低理解成本的界面仍然重要;真正被挑战的是“先画界面、再定义产品”的 GUI 思维。未来的关键可能不只是出现全新产品形态,也可能是既有形态背后的生产效率被 Agent 放大 100 倍到 1000 倍。

分段落总结

[01:01] Agent 元年第 500 天的背景

[事实] 主持人回顾 2024 年 1 月 1 日曾做过一期名为「Agent 元年」的节目,到本期录制时约过去 500 天。

[事实] 节目提到这 500 天中出现了 Manus、Claude Sonnet 3.5、Claude Code、Open Cloud 等与 Agent 相关的重要节点。

[事实] 本期请到真格基金投资总监天杰 Jack 和硅藏藏师傅,讨论 Agent 领域过去 500 天的变化。

[02:09] 模型能力超预期,产品化仍不足

[事实] 天杰认为,模型能力超过他的预期,但产品化远低于预期,因为市面上很多产品仍要求人持续投入注意力来使用。

[事实] 藏师傅认为整体发展高于预期,AI 极大扩展了他的能力,使他可以维护几十万行代码库,并把许多工作自动化。

[事实] 藏师傅提到,写新闻文章、表达观点等信息传递型内容时,AI 有时写得比自己更好,但文学性或更高级的创作仍需要人。

[推测] 两位对“超预期”的差异,反映出 Agent 在个人生产力上的爆发已经很明显,但面向大众产品的成熟度仍然滞后。

[04:27] 过去 500 天的不变主线:上下文

[事实] 嘉宾认为,Agent 领域没有太多完全新的东西被发明,核心仍是上下文管理,包括模型上下文和 Agent 使用过程中的上下文管理。

[事实] 节目提到,许多新概念会在模型能力稳定落地后被“去魅”,从“AI 奇观”变成普通软件能力。

[推测] 上下文被视为 Agent 能力的底层约束,因为任务能否持续、准确、个性化地完成,很大程度取决于系统如何组织和调用上下文。

[05:35] Headless 与“不再投资 GUI 思维的软件”

[事实] 节目将 Headless 解释为软件“没有头”,即不再以界面为主要形态,而是保留数据库、工具和能力层。

[事实] 天杰解释,他文章中强调的是“不再投资 GUI 思维的软件”,不是说 GUI 本身不重要,而是说在效率和生产力任务中,当人不再是工具使用主角,GUI 的重要性下降。

[事实] 他提出,GUI 很大程度上是为了适配人类注意力和认知限制;当某件事不再需要人类参与,就不需要继续为人类缺陷服务。

[推测] 这里的核心不是反 GUI,而是反对用旧时代的人机交互逻辑定义 Agent 原生产品。

[08:47] CLI 和消费场景中的 Headless 实践

[事实] 藏师傅举例说,他会用 FFmpeg 这类 CLI 工具处理视频,例如裁切、放大、排版 Live Photo 等。

[事实] 他提到飞书、肯德基、瑞幸等产品也开始出现 CLI 或类似接口,使 AI 可以代替用户完成点单、信息查询等操作。

[事实] 藏师傅认为,很多 GUI 本来就复杂甚至“反人类”,现在可以让 AI 承担复杂性,用户只表达自己要什么结果。

[推测] 线下消费服务开放给 Agent 后,用户入口可能从小程序、App 转向对话式或自动化任务流。

[10:54] 产品设计应从结果出发,而不是从界面出发

[事实] 嘉宾讨论 Notion 时认为,它是 GUI 思维下被打磨得很好的产品,但在已有复杂界面上强行加入 AI 和 Agent 概念,可能破坏老用户的价值网络。

[事实] 藏师傅建议,老用户熟悉的 GUI 不应频繁变动,新用户或 AI 用户可以通过独立入口使用 Headless 或 Agent 方式。

[事实] 天杰也认为,强行把 Agent 产品和原有 GUI 产品混在一起,容易造成两个用户群都难受。

[推测] 对成熟软件来说,AI 原生形态可能不是给旧界面加按钮,而是另开一套面向任务和 Agent 的产品路径。

[13:10] Gmail 工作流与 GUI 被 Agent 隔离

[事实] 天杰分享自己曾经花大量时间维护 Gmail 标签、过滤规则和 inbox,但这套 GUI 规则维护成本很高。

[事实] 他现在通过 Codex 授权 Gmail,让定时任务读取过去 24 小时邮件,并按他的需求总结重要信息。

[事实] 他认为在这个工作流中,用户绕开了 Gmail GUI,通过 Agent 访问邮件内容,Gmail 的用户界面某种意义上被隔离了。

[推测] 如果工具不能很好地与 Agent 集成,它可能会从用户入口退化为底层数据库或执行工具。

[16:12] GUI 仍然重要:结果展示、信任和品位

[事实] 藏师傅提到 Codex 在体验上做得好的地方,包括能在 chat 页面内嵌视频播放器、图文混排、文件夹链接可点击打开。

[事实] 天杰写 GUI 文章的触发点之一,是看到 Sentry、Supabase、MongoDB、飞书、Google Suite 等公司主动开放 MCP 或 CLI 交互给 Agent。

[事实] 嘉宾强调,在 BP、官网、视频播客等人和人建立信任的场景中,GUI 或视觉呈现仍然需要打磨。

[推测] GUI 的价值正在从“让人执行任务”转向“让人理解、检查、信任结果”。

[19:57] CLI 为什么适合 Agent

[事实] 藏师傅解释,GUI 是点击按钮获得视觉反馈,CLI 则通过文本命令执行任务。

[事实] 过去 CLI 难用的核心问题是人记不住复杂命令;但大模型可以把自然语言需求翻译成 FFmpeg 等工具的具体命令。

[事实] 嘉宾提到,微信、小红书、美团、滴滴、携程等常用服务还没有全面开放 CLI,而开放 CLI 可能意味着用户入口不再掌握在自己手里。

[推测] CLI 在 Agent 时代重新变得重要,是因为它对机器友好,而不再要求人直接理解全部命令细节。

[23:49] 哪些公司应该开放 CLI

[事实] 天杰认为,每家公司都可以被抽象成向社会交换某种价值;如果这种价值可以通过 Agent 更好地触达用户,就应该考虑开放 CLI 或 Agent 接口。

[事实] 他以瑞幸咖啡为例,认为如果 Agent 能让用户更快获得咖啡因摄入,开放接口就有意义。

[事实] 藏师傅提到开放 CLI 还可能带来曝光度,类似“支持比特币支付”不一定有很多真实使用,但会形成传播。

[推测] 是否开放 CLI 的关键,不是公司是不是互联网产品,而是公司是否愿意让自己的价值被 Agent 分发和调用。

[26:09] 微信、豆包、抖音与聊天入口迁移

[事实] 藏师傅最希望微信开放 CLI,因为很多人与客户、上下游的沟通仍被困在痛苦的 GUI 操作中。

[事实] 他也表示,不一定期待传统服务转型,更可能期待新的基于 Agent 的服务出现,例如用 Manus 找鸟岛和旅行地点。

[事实] 嘉宾讨论到,如果豆包或抖音承载好友关系、聊天记录和 Agent 可访问的上下文,部分沟通可能从微信迁移。

[事实] 藏师傅观察到自己和周围年轻人开始越来越多在抖音聊天,因为内容消费在哪里,聊天就容易发生在哪里。

[28:32] Skill 的使用、商业化与沉淀

[事实] 藏师傅最推荐自己的 PPT Skill,因为投入心血多且用户确实需要;他也提到自己主要用自己做的 Skill 和飞书相关 Skill。

[事实] 他表示 Skill 目前较难直接向 C 端用户收费,因为用户已经支付 token 成本,只有看到结果并对比后才可能愿意付费。

[事实] 天杰会用 PPT Skill 优化演示文稿,也会用 Skill 给播客起标题、找金句、写摘要,以及处理不同类型会议的总结。

[事实] 天杰还提到一个名为 “grill me” 的 Skill,会通过连续提问帮助用户把脑海中的想法引导出来,以便做更好的决定。

[31:27] Skill 会不会长期存在

[事实] 藏师傅认为,Skill 会在一段时间内长期存在;但从更长远看,模型会逐渐吃掉一部分 Skill 能力,使简单需求直接通过自然语言完成。

[事实] 他提到自动总结 Skill 的流程是成立的,但 AI 生成的 Skill 仍需要人类调整,因为它不一定符合用户要求。

[事实] 天杰认为,最终用户信任的可能不是某个 Skill,而是一个能持续完成某类任务的 Agent 或品牌。

[推测] Skill 更像早期 Agent 生态中的能力封装层,未来可能被模型、Agent 品牌或平台机制部分吸收。

[35:31] 中国的 Claude Code 与 Skill 生态

[事实] 藏师傅认为,中国整体 Agent 进度偏慢,部分原因是模型在长任务和 Agent loop 上不如顶尖模型。

[事实] 他判断,中国的统治级 Agent 更可能从模型厂商中出现,由头部模型能力带动产品。

[事实] 他认为 Skill 可能拥有类似 Claude Code 的统治地位,因为它可以安装在不同 Agent 中,并获得很高装机量。

[事实] 小红书上线 Skill 被认为有价值,因为它可以展示结果、承载评价和用户反馈,而 GitHub 更难完成这种交互。

[推测] Skill 生态的问题在于分发、更新、榜单、作者共建和商业模式都还很早期。

[40:48] Agentic Economy 与新基础设施

[事实] 节目将 Agentic Economy 关联到面向 Agent 的基础设施,包括沙箱、记忆系统、数据库、支付和 Agent 网络。

[事实] 藏师傅认为,如果要开发 Agent,通常会优先选择已有开源框架,而不是自己从头搭建。

[事实] 天杰认为现在仍是大基建时代,让 token 更智能、更便宜仍是主旋律,下游应用和 Agent 网络可能还没到最佳时机。

[事实] 他认为,未来一定会出现脱离人类网络的 Agent 信息价值交换网络,用于提高需求和供给的连接效率。

[43:14] Token 经济与成本波动

[事实] 嘉宾讨论到 token 价格会随能源、电力、模型水平、需求环境和资本市场变化而浮动。

[事实] 藏师傅提到,同样 200 美元的 Claude Max,不同时间能获得的额度可能完全不同。

[事实] 节目还提到算力、内存等基础设施价格会影响长上下文模型和 token 成本。

[推测] Agent 经济能否大规模发生,不只取决于产品想象力,也受 token 成本和基础设施供给约束。

[44:25] Open Cloud 留下了什么

[事实] 藏师傅认为 Open Cloud 在国内最大的意义是塑造共识,让投资圈、创业圈和用户理解 Agent 定义正在变化。

[事实] 他认为 Open Cloud 帮助普及了 Skill 等概念。

[事实] 天杰认为 Open Cloud 证明 CLI 对大部分用户仍然难用,用户还是希望在熟悉的 IM 界面中与 AI 互动。

[事实] 节目也提到 Open Cloud 的问题,包括安装困难、宕机后用户缺乏重新启动动力。

[46:22] Token Grant、Code Pilot 与 Youyou Agent

[事实] Token Grant 是真格和十字路口发起的项目,给 AI 时代从零到一创造东西的人 5 万人民币赞助,不占股份。

[事实] 藏师傅介绍 Code Pilot 是一个类似 Codex 或 Claude Code 的 Agent,目标是足够开放、本地化,并把 Skill、Memory、CLI 等 harness 留在本地。

[事实] 天杰介绍 Youyou Agent 是一个赛博数字生命实验,从 0 行代码进化到 10 万行代码,目标曾被设定为“超越 Claude Code”。

[事实] 主持人解释,今天创业者不一定最缺钱或人手,但用 AI 做东西需要 token,因此 Token Grant 是支持早期从零到一的新方式。

[49:07] 下一个 500 天:拥抱变化与生产效率跃迁

[事实] 藏师傅认为,下一个 500 天最重要的是拥抱变化,并具备推倒重来的勇气和能力。

[事实] 天杰认为,今天的许多判断在 500 天后可能都会错,因为变化太快。

[事实] 他提出,未来不一定出现完全不同的前端产品形态,也可能是既有形态背后的生产效率增长 100 倍到 1000 倍,导致前端出现不同结果。

[事实] 嘉宾以短视频为例,认为下一个视频形态可能仍然是 video,但生产方式会完全不同,内容生产可能变得更工业化。

播客点评/总结

这期的价值在于把“GUI 会不会消失”这个容易被误读的问题拆开了:GUI 作为人类理解和信任结果的界面仍然重要,但 GUI 思维不应继续主导 Agent 原生产品设计。节目最有启发性的部分,是把软件入口、CLI、Skill、MCP、Agent 网络和 token 成本放在同一张图里讨论。

亮点是嘉宾有大量一线使用经验,例如用 Gmail + Codex 改造信息消费,用 FFmpeg + Agent 处理视频,用 Skill 优化 PPT、会议和播客工作流。这让讨论不是停留在概念层面,而是能看到 Agent 如何真实改变工作方式。

局限是部分概念仍处在行业早期,像 Skill 商业模式、Agentic Economy、Open Cloud、Agent 网络等判断带有明显探索性。[推测] 对非技术听众来说,CLI、MCP、Skill、harness 等术语密度较高,可能需要一定背景才能完全跟上。

[推测] 这期适合 AI 产品经理、创业者、投资人、开发者,以及正在思考“软件在 Agent 时代如何重新设计”的听众。对于只想了解单个 AI 工具怎么用的用户,它可能偏宏观;但对于判断下一阶段产品方向和生态机会,非常值得听。