关于 AI、开源、商业化与全球化的经验、教训和方法论 | 对谈 PingCAP CTO 东旭

2025-05-17 · Show: 42章经 · 3237s · Source

关于 AI、开源、商业化与全球化的经验、教训和方法论:对谈 PingCAP CTO 东旭

概览

本期围绕 PingCAP 十年创业展开,核心讨论 TiDB 作为分布式数据库为什么有机会、开源基础软件如何建立信任、以及基础设施公司如何从社区采用走向商业化。

东旭把 PingCAP 的几个关键选择概括为开源、选择关系型交易数据库、从第一天面向全球化,以及近年转向云服务。他强调,基础软件早期不能只看收入,用户采用、社区贡献和长期技术方向同样是价值信号。

后半段重点讨论全球化和 AI。东旭认为全球化不是“出海试试看”,而是创始人、组织、语言、文档、招聘和商业化方式的系统重构;AI 时代则会让企业数据、上下文和 agent 访问数据的方式成为新的基础设施机会。

分段落总结

[00:19] 嘉宾与 TiDB 的定位

[事实] 东旭介绍自己是 PingCAP 联合创始人兼 CTO,长期写代码,也喜欢开源文化、音乐和艺术创作。

[事实] PingCAP 的核心产品 TiDB 被介绍为一个分布式数据库,东旭用“数据的容器”和会自动变大的“魔法杯子”解释它解决的数据规模增长问题。

[事实] 他提到美团外卖、微信支付、银行卡交易等数字生活场景背后可能间接使用 TiDB 支撑。

[推测] 这一开场把数据库这种底层基础设施转译成普通用户可理解的“日常数字生活底座”。

[03:33] 开源不是只把代码放出来

[事实] PingCAP 2015 年正式成立,东旭说公司从 day one 就是开源,但顶级开源项目不只是发布代码,而是文档、路线、制作过程和项目运营方式都开放。

[事实] 他用“透明后厨”比喻开源基础设施软件建立客户信任的方式,认为只给成品或菜谱是不够的。

[事实] 东旭认为源代码本身价值有限,真正有价值的是做题思路、项目方向、迭代速度和长期积累的 history know-how。

[推测] 在他的理解里,开源的护城河不是秘密,而是持续组织能力和方向控制力。

[07:02] PingCAP 十年的关键选择

[事实] 东旭总结 PingCAP 早期几个重要决定:选择开源、选择关系型交易数据库、选择全球化,以及近年转向 cloud。

[事实] 他认为关系型交易数据库最复杂、最难,但市场天花板更大,类似 Oracle 所代表的大市场。

[事实] 他表示 PingCAP 现在已不是单纯软件公司,而是数据库软件的云服务公司,并称超过 70% 的 ARR 收入来自云服务。

[推测] 这些选择共同指向一个判断:基础设施创业要选择足够大的市场,并承受更长周期的技术投入。

[09:54] 为什么是 2015 年做分布式数据库

[事实] 三位创始人此前都在豌豆荚做底层数据库和数据基础设施,分布式关系数据库对程序员有很强工程挑战和成就感。

[事实] 东旭回顾称,当时数据中心硬件条件成熟,包括网络带宽提升、SSD 普及和成本下降,使大规模分布式系统更可行。

[事实] 他认为互联网技术成熟后,开始影响银行、政府和大型企业等传统企业的技术栈替换需求。

[推测] PingCAP 的时间窗口来自个人技术兴趣、硬件基础成熟和企业替换需求三者叠加。

[13:01] 基础软件融资里的非共识

[事实] 主持人提到 PingCAP 上一轮公开估值是 30 亿美元,并追问收入起来前为什么能获得高估值。

[事实] 东旭认为基础软件像 moonshot,数据库、操作系统、浏览器这类通用基础设施杠杆很高,VC 若想赌大机会,数据库是好标的。

[事实] 他回忆 A 轮融资困难,因为当时没有客户、没有收入,软件还不能运行;但懂技术的投资人会直接看源码和系统设计价值。

[推测] 这类项目的分歧来自“看代码和长期基础设施价值”与“只看短期商业数字”之间的评估方式差异。

[16:17] 无收入阶段的用户价值

[事实] 东旭说 PingCAP 当时并不是没有客户,而是很多客户不给钱;大量互联网公司用开源软件解决重要问题。

[事实] 他举例称,有大客户 CTO 没有预算,但愿意派四五名工程师全职参与项目贡献,作为对项目的支持和自身使用的保险。

[事实] 投资人看重的是 TiDB 企业用户真的非常喜欢这个东西,以及 adoption 持续增长。

[推测] 在开源基础设施里,用户贡献工程师、深度使用和关键业务依赖,可以成为收入之外的价值证明。

[18:48] 开源商业化的取舍

[事实] 东旭说前五年 PingCAP 铁了心不做强商业化,因为数据库早期重点是打好软件基础。

[事实] 他认为早期销售去大用户那里“收保费”会制造信息不对称,损害开源信任,类似杀鸡取卵。

[事实] 他认为传统商业模式与开源存在冲突,直到云服务出现,才有了与开源不冲突的商业化路径。

[推测] PingCAP 的商业化不是单纯延后收费,而是在等待一个不破坏社区信任的收费结构。

[21:01] 云服务与软件市场差异

[事实] 东旭提到 MongoDB 从软件公司转向软件服务公司后增长迅速,给 PingCAP 提供了参考。

[事实] 他认为国内云化速度慢一些,传统企业对软件价值的认知、会计入账方式和硬件捆绑习惯都造成阻力。

[事实] 他反对把软件价值捆绑到硬件上,因为软件最大的优势在于灵活性。

[事实] 他认为海外云服务生态更成熟,像 AWS 这类吃得比较饱的合作伙伴更可能给合作伙伴留空间。

[23:40] 哪些公司适合借鉴 PingCAP

[事实] 东旭认为 PingCAP 模式适合通用软件、基础软件公司参考。

[事实] 他认为垂直软件、ERP 或 Adobe 这类产品的商业价值来自行业 know-how,不一定适合开源。

[推测] 开源更适合通用技术标准和基础设施,不适合把垂直知识本身作为核心资产的产品。

[24:23] 全球化不是被迫出海

[事实] 东旭说很多公司的国际化是被迫选择,容易带着“试试看牌”的心态,但海外业务头几年可能是在交学费、甚至前三年不赚钱。

[事实] PingCAP 在 2015 年 6 月天使轮后、公司刚起步时,东旭就背着行李箱去了旧金山。

[事实] 他不喜欢“出海”这个词,因为这个词暗含总部在中国、去海外出差的心态;他更强调本地化团队、本地关系和本地业务。

[事实] 他认为全球化早期必须创始人亲自 all in,单靠海外职业经理人很难。

[26:54] 全球化组织的路标

[事实] 东旭说 PingCAP 现在有中国、日本、APAC、欧洲、北美等 region,每个 region 有自己的 CEO、CTO 和技术团队。

[事实] 他提到自己现在是集团 CTO,平时住在美国,负责全球客户关系和研发团队管理。

[事实] 他总结全球化路标包括英文文档优先、代码没有中文注释、内部 IM 和会议用英文,以及海外新员工感受不到这是一家起源于中国的公司。

[事实] PingCAP 大约在 2022 年做到内部 IM 和公司会议用英文。

[32:35] 全球化踩坑与美国市场选择

[事实] 东旭说早期踩过的坑包括用“出海试试”的心态、用中国团队做 global team、海外商业化仍以中国人为主。

[事实] 他反思中国产品容易做得大而全、复杂,如果更早按硅谷方式做产品和商业化,可能少走弯路。

[事实] 他认为自己没有早点搬到美国是最大坑之一。

[事实] PingCAP 选择美国而不是日本或新加坡作为重点,是因为软件世界的高峰在中国和美国,做好美国市场后更容易辐射其他地区。

[35:18] 创始人肉身到场与本地 GTM

[事实] 东旭认为创始人肉身在国内、一心做海外市场很难,因为身体所在地点会自然牵扯 70% 的精力、时间和思维方式。

[事实] 他从 2017 年开始走弯路,到 2022 年举家搬到美国。

[事实] 他建议进入当地圈子的办法之一,是先招本地销售,然后跟着销售一起跑客户和关系。

[事实] 他提到 PingCAP 公司华人比例仍较高,但商业化和客户关系中,本地人关系已占很大比例。

[38:02] 给 AI 创业者的出海建议

[事实] 东旭建议想做美国市场的 AI 创始人,不管什么签证,先去当地生活至少半年。

[事实] 他建议尽早做商业化 go to market,产品 ready 后找本地销售一起卖,创始人自己也要卖东西。

[事实] 他认为美国创业者讲故事、GTM message framework 和营销能力很强,中国 founder 需要虚心学习。

[事实] 他认为很多 founder 高估了语言障碍和海外商业化难度,真正的问题常常是不敢卖高价、没有发现产品 value。

[40:34] 海外收入没有秘籍

[事实] 东旭说 PingCAP 仍然 have a long way to go,没有所谓 secret sauce,很多事情只是常识。

[事实] 他认为云上商业模式已被 Databricks、Snowflake、MongoDB 验证过,踩坑往往是因为不尊重常识。

[事实] 他强调做海外市场也要请客吃饭、喝咖啡、帮客户解决问题,商业和销售的本质在各地相通。

[事实] 他举 Pinterest 为例,说北美客户如果用了很多,就会直接付钱,不需要很多绕法。

[43:27] 国际化组织必须交的税

[事实] 东旭承认华人创业公司在美国相对本土竞争对手是负分起步,包括语言 gap 和组织复杂性。

[事实] 他回忆刚去美国时,最夸张一天从早到晚开了 19 个小时会议,跨中国和美国时区。

[事实] 他认为组织有韧性,只要持续朝全球化目标走,组织会逐渐长成适合这种模式的样子。

[推测] 他把这些痛苦视为未来能力的一部分,而不是可以绕开的成本。

[45:26] AI 创业的强项与短板

[事实] 东旭认为中国 AI 产品的工程化能力非常强,并以 DeepSeek 为例称其工程扎实,让美国同行觉得 magic。

[事实] 他认为中国 AI 创业项目的短板在 go to market、品牌营销、酷 demo 和 message 上。

[事实] 他提到自己是 Cursor 重度用户,也看过国内 AI IDE 项目,产品不差,但在美国市场几乎没听过。

[推测] AI 时代产品传播速度很重要,“酒香不怕巷子深”的思路会削弱中国团队在全球市场的先机。

[46:39] AI、记忆与数据层机会

[事实] 东旭认为当前 AI 一个重要问题是记忆,即如何让 LLM 更了解企业或个人,并 set the right context。

[事实] 作为数据库公司,PingCAP 天然会思考如何提供 context 工具;未来数据库的用户可能从程序员、DBA 变成 agent。

[事实] 他提到 MCP 定义了 agent 和 tool 的交互,A2A 也是交互,但通用 sharing memory layer 还没有行业标准。

[事实] 他认为小公司也可能定义开放标准,关键是足够开放、有人用,并触发网络效应。

[49:26] 企业软件会被 AI 重构

[事实] 东旭更看好企业服务端机会,例如 Chat BI 和 data agent。

[事实] 他认为 DeepSeek 出现后,LLM 基础能力已经到达可以做有用东西的阶段,第一波会改造企业软件。

[事实] 他认为企业核心竞争力在行业 know-how,而 LLM 提供常识;企业最宝贵的是数据。

[事实] 他预测企业软件会从大而全的静态系统,被拆成小能力,再由 LLM agent 串联起来。

[52:00] 十年创业后的个人方法论

[事实] 东旭说自己以前想到什么就干什么,动手太快;十年创业让他更有耐心。

[事实] 他认为如果想清楚方向是 OK 的,就应该更有耐心,把剩下的交给时间。

[事实] 他总结自己的重要特长是精力管理,并认为音乐、艺术创作等爱好是重要出口。

[事实] 他最后强调尊重常识、没有花活,以及“先做再说”。

播客点评/总结

本期的价值在于,它不是泛泛谈“开源、出海、AI”,而是把 PingCAP 十年中真实遇到的商业化、融资、组织和全球化问题串起来讲。尤其是“开源商业化不能损害信任”“全球化要创始人肉身到场”“云服务才是与开源兼容的商业模式”等观点,具有较强方法论密度。

亮点是东旭把很多抽象概念讲得很具体:用透明后厨解释开源信任,用英文文档、内部会议语言和海外新员工感受来衡量全球化,用本地销售和客户关系解释 GTM。这些细节比单纯的战略口号更可执行。

局限是讨论主要来自 PingCAP 的路径和东旭个人经验,适用范围更偏通用基础软件、开发者工具、数据库、AI infra 和企业服务;对消费级 AI、内容产品或强垂直行业软件的参考价值需要谨慎迁移。

[推测] 这期适合基础软件创业者、AI infra 创业者、准备做全球化的中国技术团队,以及想理解开源公司如何从社区采用走向云服务商业化的投资人和从业者。