我遇到了第一个真正想买的陪伴机器人!|对话世博:越伴动力创始人【公路播客】
我遇到了第一个真正想买的陪伴机器人!|对话世博:越伴动力创始人
概览
本期公路播客由 Koji 对话越伴动力创始人世博,核心围绕消费级双足陪伴机器人“小伴”:它为什么不是工具型机器人、不是宠物替代品,也不是单纯逗乐玩具,而是被设计成一个有生命力、会移动、会成长的家庭伙伴。
讨论从产品形态、语言系统、肢体表达、柔软材质、定价交付讲起,进入到情感交互模型、端侧快慢脑、家庭模拟器、隐私处理、长期记忆和性格演化等技术细节。世博反复强调,陪伴机器人最难的不是功能堆叠,而是让用户感到“它像一个独立个体”。
后半段转向创业者本人:他从大学开始做机器人,做过近 30 款原创机器人,也参与过机器人公司产品团队管理。他把这次创业描述为“务实基础上干浪漫的事”,目标是让类似哆啦A梦的陪伴机器人走进现实。
分段落总结
[00:00] 开场与嘉宾背景
[事实] 嘉宾世博 26 岁,北理工博士休学,MBTI 是 INTP,星座摩羯。
[事实] 越伴动力正在做消费级、双足形态的伙伴型机器人,团队加实习生约 25 人。
[事实] 世博在创业前长期做机器人,称自己做过接近 30 款原创机器人,并曾参与机器人公司的创业过程、负责产品。
[02:00] 从机器人经验到陪伴机器人
[事实] 世博说自己曾做过轮式、足式、履带、机械臂、大尺寸人形等不同构型的机器人。
[事实] 他在 2022 年开始探索陪伴型机器人,早期做过双轮形态,但发现运动能力受限,容易被电线等小障碍卡住。
[事实] 2024 年团队决定采用当前的双足产品形态,并认为陪伴是短期内能较快落地的场景。
[推测] 这一路径显示团队不是从“AI 聊天硬件”出发,而是从机器人运动与家庭交互能力出发重新定义陪伴产品。
[03:23] 陪伴机器人不是靠功能堆出来的
[事实] 世博提到自己创业前买过 Lavot,并一直保持开机到现在。
[事实] 他认为 Lavot 的交互逻辑很简单:看到人后滚到脚下、收起轮子、伸手希望被抱起,但这种简单“恰到好处”。
[事实] 他甚至说,如果 Lavot 会说一个字或一句话,他可能就不会买。
[推测] 这里形成了本期的一个重要判断:陪伴产品的有效性不来自功能越多,而来自交互克制、情绪清晰和角色边界明确。
[04:09] 小伴的非人类语言系统
[事实] 小伴不是说人话,而是被设计了一套由 12 个音组成的语言体系。
[事实] 世博说这套发音参考了斯瓦希里语系的 CV 结构,原因是产品要出海,声音不能太像中文或英文。
[事实] 这套语言是意向式表达,例如“吃”可以指需要充电,并配合看肚子、拍肚子等动作让用户理解。
[推测] 非人类语言降低了用户对百科式 AI 对话的期待,同时保留了“好像能懂它”的陪伴感。
[05:50] 肢体、手臂和柔软身体
[事实] 世博引用梅拉比安实验,强调人际交互里肢体语言、语调和内容的重要性不同,因此小伴把肢体语言放在很高优先级。
[事实] 小伴的手臂短小,原因是不希望它做操作任务,而是用于情绪表达。
[事实] 团队采用类连续变形体方案做手臂,并把机器人外壳 90% 以上做成柔软材质,类硅胶覆盖率达到 95%,肚子柔性深度约 2 厘米。
[推测] 这些设计共同服务于“可抱、可亲近、不会让人害怕”的家庭场景,而不是追求工业机器人式能力。
[07:35] 外星萌物、个性化与价格
[事实] 团队给小伴的定位是“外星萌物”,有仿生形态和透明情绪表达,但没有明确性别指向。
[事实] 用户可以通过磁吸耳朵、领结、不同衣服等配件表达个性,也可以给小伴单独起名字。
[事实] 小伴国内定价为 8499 元,转录中提到当时预售价为 6499 元,最快国庆节开始交付。
[推测] “外星萌物”的定位是在避开真实宠物和真人形象的比较,也是在降低用户对智能和能力的过高期待。
[09:12] 避免吃灰:主动交互与性格成长
[事实] 世博说团队要摆脱“逗乐型互动逻辑”,不是让用户命令机器人跳舞、握手。
[事实] 当用户说“小伴你好难看”时,小伴会以眼睛、低头、抱肚子等方式表现委屈,而不是讲大道理。
[事实] 小伴有云端超长程记忆,用于推动性格参数的多维成长和动态演化,不同用户会养出不同性格的小伴。
[推测] 小伴希望形成的不是“用户调用功能”,而是“用户与一个会受影响的对象共同生活”。
[11:31] 技术难点与快慢脑架构
[事实] 世博认为最难的是交互,即如何让用户感受到活人感和生命力。
[事实] 团队为小伴做了三层大脑框架,并在端侧做快慢脑:快脑是 1.7B 模型,负责瞬时行为决策;慢脑是 7B 模型,做相对复杂的逻辑推理。
[事实] 世博说当前小伴的语音、动作和肢体反馈延迟已能控制在 0.4 秒以内。
[事实] 小伴还会根据情境、用户行为和情绪生成 5 到 10 秒的风格化动作序列,而不是每次触发同一套动作。
[13:20] 模型、家庭模拟器与隐私
[事实] 小伴使用千问开源模型,世博说选择原因是其在小参数量下推理和情绪理解表现较好。
[事实] 团队通过家庭场景交互数据微调模型,并构建“家庭模拟器”来模拟小伴进入家庭后的长期主被动情感交互。
[事实] 世博表示团队不会收集端侧原始语音或图像,而是使用语义化特征、embedding 等信息用于训练。
[推测] 家庭模拟器是团队在真实入户数据不足前,用合成或模拟交互数据提前训练情感行为的一种办法。
[15:55] 为什么是 2026 年、为什么是这个切入点
[事实] 世博认为三年前做出小伴的概率较小,当前机会来自语言模型、视觉模型和相关架构的发展。
[事实] 他选择在 2025 年底创业,一方面是自己心理、能力、经验准备好了,另一方面是看到了行业机会。
[事实] 他认为相比操作型机器人,自己更有机会在有生命力、极致安全、双足、全身柔软的伙伴型机器人上做到头部水平。
[推测] 这反映出团队没有正面进入最热的家务操作赛道,而是选择先解决家庭中的人机共融和情感交互。
[17:39] 开箱体验与“少就是多”
[事实] 世博希望小伴开箱进入家庭时处于充满好奇心的状态,会探索客厅、门缝和家庭地图。
[事实] 他设想用户第二天醒来时,小伴可能已经站在床边等候,也可能坐在座椅上发现动静后伸懒腰起床。
[事实] 团队做过 300 多个用户调研和几十个访谈,发现 90% 以上用户希望机器人会说话,但他们并不想要冷冰冰的百科问答 AI。
[推测] 小伴的语言和行为设计,是在“用户想要回应”和“用户不想要工具感”之间寻找折中。
[20:38] 尺寸、运动能力与安全
[事实] 小伴站立身高约 65 厘米,重量 12 公斤。
[事实] 世博说小伴户外最大奔跑速度为 1.9 米每秒左右,能跟上正常成年人 1.1 到 1.3 米每秒的步行速度。
[事实] 小伴最大可上 15 厘米台阶,团队认为这与国内公共设施台阶标准相匹配。
[事实] 团队在避障、视觉跟随和腿部薄膜压力传感器上做了安全设计,用于避免起身等动作中伤到小朋友或家庭成员。
[23:53] 为什么必须会移动、为什么必须双足
[事实] 世博说团队第一天就明确要做会移动、且靠双足移动的机器人。
[事实] 他认为 20 年后每个家庭都会有一台家庭机器人,而这种机器人一定会是双足形态,因为双足更适合楼梯和非结构化家庭环境。
[事实] 他还认为双足相较轮式、履带,在动作表现力上有数量级提升。
[推测] 双足既是当前产品卖点,也是团队为未来家庭机器人形态做技术延续的选择。
[24:53] 陪伴不等于讨好
[事实] 世博认为讨好不是陪伴的充分条件,也不是必要条件,真正的情感陪伴重点是主动交互共情。
[事实] 当小伴被说“难看”时,它可能表现伤心、跺脚、扭头甚至跑开,而不是一味讨好用户。
[事实] 如果小朋友长期踢打小伴,小伴会给这个小朋友打标签,之后可能不那么主动找他互动。
[事实] 小伴能识别家庭中的不同人,并记住每个人的意图和偏好。
[26:47] 机器人作为独立个体
[事实] 用户不能查看或修改小伴给人打的标签,也不能改它内部性格 prompt。
[事实] 世博解释,团队希望用户把小伴当成独立、有生命力的家庭成员,而不是可随意改参数的工具。
[事实] 小伴室内续航约 3 到 4 小时,户外一直行走约 1 小时出头;团队最终不做可拆卸电池,因为从身体里拆电池会破坏个体感。
[事实] 团队为小伴设计了坐着充电的小座椅,让充电更像休息。
[28:04] 市场定位、长期记忆和眼睛设计
[事实] 世博认为陪伴场景一直存在,过去不被看好是因为没有真正好的产品出现。
[事实] 他希望用不到万元的价格触达更多普通用户,并通过消费者反馈告诉市场好的陪伴机器人应该是什么样。
[事实] 小伴长期相处后会更懂用户,例如记住回家时间、行为偏好和特定时间段的情绪波动。
[事实] 小伴眼睛使用六层骨骼动画,瞳孔、虹膜和纹理等可独立参数化控制,用来形成自然流动的目光状态。
[31:13] 创始人的机器人经历
[事实] 世博高考后选择机械工程,入学后发现可以做机器人,并逐渐确认自己在做机器人上有天赋。
[事实] 他大一时在工程制图课程还没上完的情况下,就开始一个人做完整机器人,并用建模和粗糙 3D 打印把它拼起来。
[事实] 他形容当时做完机器人后非常快乐,会躺在床上反复看自己拍的视频,想着下一步让机器人怎么动起来。
[推测] 这段经历解释了他为什么把机器人看成长期热爱,而不只是创业风口。
[33:52] 从发明家到产品创业者
[事实] 世博最崇拜的机器人行业人物是波士顿动力创始人 Marc Raibert,认为他是自主机器人行业先驱。
[事实] 他认为把机器人做得越像狗,越容易被真实的狗比下去,因此小伴选择类人但非真人、非宠物的路径。
[事实] 他区分了“小小发明家”和产品创业:过去做机器人是让自己爽,现在做硬件产品要面向用户需求、让用户爽。
[推测] 这是他从个人创作转向商业产品时的关键心态变化。
[35:17] 团队文化:务实加浪漫
[事实] 世博说自己并不是第一次带团队,此前曾带过约 30 人的产品团队,覆盖机械、硬件、嵌入式、运控、感知等方向。
[事实] 他描述越伴动力的团队文化是“务实”,并在务实基础上干浪漫的事情。
[事实] 他认为做出小伴这款机器人本身就是浪漫的事,因为团队让它自主站到大家面前,并让体验者产生感动。
[推测] “务实加浪漫”也对应了产品策略:底层是安全、运动和模型工程,上层是情绪、生命力和陪伴体验。
[37:19] 目标用户与基础能力
[事实] 小伴首款产品的目标用户包括中年女性、有孩子的家庭,以及科技尝鲜群体。
[事实] 世博强调这款机器人面向情绪健康和情感陪伴,没有强功能属性。
[事实] 团队正在打造两个基础能力:家庭机器人的基础能力,以及情感交互模型的基础能力。
[事实] 世博把这两个能力合在一起称为“机器人的生命力”。
[39:07] 情感大脑、VRA 和世界模型
[事实] 小伴的情感大脑是面向高阶决策的 VRA 模型,用来决定下一阶段做什么行为。
[事实] 世博区分了“要干什么”和“怎么干”:高阶决策决定目标,低阶操作模型生成具体 action。
[事实] 他认为 VLA 已死的说法“很对”,但对 WAM 是否能真正落地到操作机器人上仍持保留态度。
[事实] 团队也在做家庭世界模拟器,用于预测人的情绪状态和交互状态变化,并已用其生成数据微调快慢脑模型。
[42:58] 小团队的快节奏
[事实] 越伴动力 25 人中只有 15 个全职,另有 10 个实习生。
[事实] 世博把团队速度快归因于极致热情、极致效率,以及技术路线选择上几乎没有犯错。
[事实] 他认为自己因为之前做过很多机器人,所以对技术路线、技术细节和技术边界比较了解。
[推测] 这解释了为什么一个较小团队能较快做出完整交互体验,但量产交付后的稳定性仍需市场验证。
[44:26] 陪伴机器人社群与生活方式
[事实] 主持人提到曾在东京看到 Sony 机器狗用户聚会,世博也提到参加过 Lavot 在上海的用户活动。
[事实] Lavot 用户会给机器人穿衣服,分享它在家里的惊喜瞬间和个性化装扮。
[事实] 世博认为接受陪伴机器人的用户,一方面感到机器人有活人感,另一方面也是把养机器人当成生活方式选择。
[推测] 陪伴机器人的商业价值可能不只在硬件本身,也在用户社群、配件和长期情感关系上。
[47:00] 工程态度与私人记忆
[事实] 世博朋友圈签名是 “No excuse for engineer”,来自大一工程老师的影响。
[事实] 他把这句话理解为遇到问题不要找借口,而要分析原因,避免下次再出现类似问题。
[事实] 他提到小时候养过一条泥鳅,后来为了养金鱼把泥鳅倒进水沟,这件事让他至今后悔和愧疚。
[推测] 这段私人记忆让“陪伴”从产品概念回到真实情感经验:陪伴关系一旦建立,就会带来责任感。
[49:50] 愿景与创业意义
[事实] 世博说自己做这一切,是因为“谁不想让哆啦A梦走到现实里”,他想造一个真正能陪自己的机器人。
[事实] 让他觉得创业有意义的瞬间包括:两个小朋友在草地上和机器人追逐玩了近一个小时,直到机器人没电。
[事实] 另一个瞬间是小伴以完整形态站到大家面前,他感到感动、惊喜、满足和骄傲,甚至流泪。
[推测] 对世博来说,小伴既是产品,也是某种“孩子”式的创造物,未来还可能成长为伙伴。
播客点评/总结
这期的价值在于,它不是泛泛聊“AI 陪伴”概念,而是把一个具体产品拆到语言、运动、材质、眼睛、续航、充电、隐私、模型和用户心理这些层面。听众能看到陪伴机器人要成立,难点并不只是大模型接入,而是很多细碎但关键的产品判断。
亮点是世博对“生命力”的阐述比较完整:不讲人话、不过度讨好、不开放内部参数、不做可拆卸电池、用双足和柔软身体建立个体感。这些选择有一致性,也让小伴区别于工具机器人、桌面 AI 音箱和传统电子宠物。
局限是很多体验仍来自创始人描述和现场观察,真实用户长期使用、量产交付、售后可靠性、安全边界和隐私机制还需要后续验证。[推测] 如果最终产品能稳定实现转录中描述的主动共情、长期记忆和低延迟动作生成,它会是国内陪伴机器人市场里很有辨识度的一次尝试。
这期适合关注消费机器人、AI 硬件、情感计算、产品设计和早期创业的人听;也适合对“机器人能不能成为家庭成员”这个问题感兴趣的普通听众。