“稚晖君”停更这一年:想赢下人形机器人,要像大公司那样去创业
时间:2024-11-11 00:08:26 出处:知识阅读(143)
许多基础问题还没搞清楚的稚晖君人形机器人行业,就要面临激烈竞争。停更
文丨贺乾明
编辑丨程曼祺
我们下午 3 点见到彭志辉时,年想厦门市某某洗涤用品培训中心他还没吃当天的赢下样去第一顿饭。一日一餐是人形人像彭志辉的常年状态,他觉得自己 “习惯了,机器不影响活着,司那吃饭比较浪费时间”。创业
2023 年 2 月,稚晖君彭志辉参与创办智元机器人,停更任 CTO,年想致力于做出商业化的赢下样去人形机器人。在这之前,人形人像他更为人熟知的机器身份是 “天才少年” 和 B 站 “百大 UP 主”。
彭志辉 2017 年开始以 “稚晖君” 为网名发布各种硬核 DIY 视频,司那现在他的 B 站账号有 250 多万粉丝,同体量的 UP 主通常是团队运作,而他是一个人兼职做。不少人觉得 “全栈工程师” 难以概括他的能力,称他为 “溢栈工程师”。
智元机器人成立后,彭志辉把一切重心放到了公司,他基本没休过周末。B 站最后一次发布自制视频是 2023 年 4 月。
极致地投入,是因为他想成就更大的事业。“我们的愿景是用智能机器创造无限的生产力。” 彭志辉说。
也因为人形机器人行业许多基础问题尚未解决,就要面临激烈竞争。去年至今,中国已出现不下 20 家人形机器人公司。想把机器人送进工厂的智元机器人,还要与 2016 年前后成立的上一波 “AI+ 机器人” 公司竞争,它们服务客户更久、经验更多;再往后,更大的威胁是对具身智能蠢蠢欲动的车企,它们能调动的资源远超一般创业公司,而且有自己的工厂,这是现成的场景。
智元机器人认为,获胜概率最高的方法是 “高举高打”,用一种运营大公司、操大盘的方式创业。
多数同行专心研究一款产品时,智元机器人用一年半做出两代人形机器人,并在今年 8 月一次发布了 5 款人形机器人,还给同行提供数据采集方案。今年初,智元机器人还发布过一款商用清洁机器人。
智元机器人 8 月 18 日发布的 5 款产品。
大部分人形机器人公司会先侧重某个技术方向,有的主攻硬件,有的主攻软件智能系统。形态上,有的重点放在上半身的操作能力,有的优先做下半身的运动能力。
智元机器人则 “全都要”:他们做完整的人形机器人,也根据不同场景开发分支形态;他们自研关节电机等核心零部件,也研发 “灵巧手”,还自己开发多模态大模型,同时研究强化学习、模仿学习、视觉模型等当前具身智能的主流技术。
今年 2 月,多数新公司仍在代工组装机器人时,成立刚一年的智元机器人就开始建设上海临港首期工厂,计划年底投产。厦门市某某洗涤用品培训中心
“看不太懂”“不是常规的创业公司”,数位科技投资人如此评价,他们很少看到初创企业同时做这么多产品,下注这么多技术方向,如果管理和后续资金跟不上,很容易出问题。
彭志辉说,他们不是有意要如此,而是行业特点使他们必须这么做:“人形机器人的研发涉及硬件、软件、算法、供应制造等一大堆问题,系统工程极其重要。在技术实现上,有的是工程问题,有的还是科学问题。这个行业空间大、门槛高、变化快,人才、资金和商业成果最后都会向头部集中,如果只是小打小闹,很难保持领先。”
最多资本投票向智元机器人。成立一年半,这家公司已至少融资 15 亿元人民币,估值达 70 亿元人民币,投资方有高瓴、红杉、高榕、蓝驰、比亚迪、上汽、三花智控、临港新片区等 20 多家机构。智元还在今年初的股东会上给部分投资机构颁了奖。
纪录片导演竹内亮曾在拍摄彭志辉时,惊讶他精通如此多的跨领域技能,问:“有没有你不会的东西?” 彭志辉说:“不会生孩子”。这次我们又问了这个问题,他说:“不会停止学习”。
彭志辉摆在工位上的书,大都是《托马斯微积分》《编译原理》等教材,唯一的例外是《埃隆·马斯克传》。马斯克是他的学习对象之一。
“在学校里学习更多是自底向上,先打好基础然后做上层应用,出了校园之后更多是自顶向下,以项目导向,缺啥学啥。” 彭志辉说。聊到时间管理方法,他说是 “操作系统中的抢占式调度”,动态调整任务优先级,允许打断,但是任何时间都专注于当前的任务。
他不喜欢 “天才少年” 的称呼,他觉得教科书中那些能改变人类发展进程的科学家才是天才。
相比过去用几个月就能独自完成的小型项目,参与创办一家公司开发成功的产品要难得多。他要从单兵作战走向带团队协作,做出来的东西不能只是酷,还要能赚钱。这是一场新的、更复杂的学习。
以下是《晚点》与彭志辉的对话:
耐心地冲刺,留在牌桌上
《晚点》:回到起点,为什么 2023 年决定创业?
彭志辉:人形机器人本身不是新事物。我做人形(机器人)比较早,16 年还在学校时就创业做了原型机,那时 “具身智能” 还没出现,主要做本体(机器人硬件部分),还拿过 500 万投资。
这两年具身智能跟人形机器人这么火,并不是本体有了什么黑科技,最主要的还是 AI、大模型的出现让机器人可能在本体之外有更多应用价值。我在华为昇腾就做 AI 计算,这个趋势看得比较清楚。这是我出来创业的一个原因。
《晚点》:如果你想在华为做,应该也会得到支持。为什么选择创业?
彭志辉:风格问题。华为在技术方面主要是搞基建,比如操作系统、芯片、数据库等非常底层的根技术。
而机器人是一个非常新的赛道,特别是 AI 机器人,更适合一些迭代比较快的团队。创业不仅要有一个好点子或好技术,更重要的是在正确的时间点做正确的事。
《晚点》:现在创业做人形机器人是正确的时间吗?它需要的硬件、材料、能源等技术还不成熟,有些还在科学探索阶段。一位资深科技投资人就说,他对 5-10 年后才会发生的事没兴趣。
彭志辉:我们也没想过短期就做成这件事。我们要求大家 “耐心地冲刺”,一方面迭代和创新速度要非常快,一方面要有耐心。
短期市场上会有各种正、负反馈,但对一家初创公司,最重要的是留在牌桌上。
《晚点》:留在牌桌很重要的一点是钱够多。智元的融资速度和规模都领先同行。怎么做到的?
彭志辉:我觉得可以换位从投资人的角度看,他们为什么会选我们?
首先我们有非常硬核的创始团队背景;又有全栈技术布局:不只做本体,也不只做具身 AI,我们是本体、具身、数据都有布局,能力相对友商可能更全面;其次我们对整个赛道的理解也非常务实,一直在积累量产的系统能力,团队的执行力超强。
去年发布会(2023 年 8 月)时,我们整个人形研发团队才不到 50 人,一年后的现在已经超过 300 人了。规模敢增长这么快,前提是我们想清楚了要做什么事情、各个阶段的技术实现路径,以及商业化的逻辑,这点也是投资人比较看重的。
《晚点》:智元长期想成为一家什么样的公司?有什么对标对象?
彭志辉:比如贝尔,贝尔发明电话,改变了大家信息沟通的方式。人形机器人未来可能也会改变社会生产力。我们的公司愿景就是 “用智能机器去创造无限的生产力”。
智能最终决定机器人能做什么
《晚点》:创业一年多,人形机器人哪些方面比你预想的更难?
彭志辉:从 0 做到 40、50 分,甚至 60 分都不算太难,但再往上就非常难。
本体成熟度还不够。比如大部分人都在卷两条腿走路,而双臂的灵活度,灵巧手这些都还处于初级状态。然后是智能。现在大家都往模仿学习方向尝试,但它真的能在复杂开放环境中达到很好的效果吗?还有触觉,声音跟视觉结合起来的多模态融合感知、操作等,做得也不是非常好。这里面有一部分是工程问题,还有一部分还处在科学问题阶段,业内还没有看到非常成熟的解决方案。
我们一边落地一边做预研,整个节奏要把握得比较稳,才能体现我们的竞争优势。全栈也是我们的一个优势,所以未来可能会走得更远一些。
智元机器人研发的灵巧手,与人手还有差距。人手有 27 个自由度、行动灵活,遍布高敏感的触觉神经,力控能力强大。要做好灵巧手,灵活、耐用、稳定且成本可控的硬件部件和材料只是基础,人手还具备手、脑协同能力,比如人能接住移动的物体,是因为人脑对重力、加速度等物理规律有认知,因而能预判轨迹,身体又有运动能力,才能完成这个看似简单的动作。
《晚点》:我们了解到,智元在机器人的智能上投入的人手更多。你们认为智能比本体更重要?
彭志辉:本体肯定是基础,但我们一直觉得,(人形机器人)最核心的其实不是本体,而是它基于本体,能完成什么实际任务,产生什么有价值的应用。
所以本体的价值一定是通过具身来体现,你可以看到我们起名智元的初心:“智” 就是具身智能,“元” 就是人形机器人本体的两条腿(象形)。
《晚点》:一个人形机器人能站起来到能走,再到能上台阶,是智能问题吗?
彭志辉:它其实更多的是智能问题,而不只是硬件问题。高阶的运动能力主要靠大脑体现,在很多运动项目中,正常人跟运动员的身体没有本质区别,运动员更多是长期训练中让大小脑协同,对环境的感知、反馈达到了更好的状态。
《晚点》:在获取训练数据的方法上,行业里也有分歧。比如有公司认为,遥控操作机器人采集数据算不过来账,应该用大量仿真数据。智元为什么造上百台机器人专门采集数据?
彭志辉:数据来源就那几类:互联网数据、仿真数据、真实采集的数据。如果只靠仿真和生成数据,会有可能出现用 ChatGPT 训练大模型的情况,出现幻觉、Sim2Real Gap 等问题。所以真机数据必不可少,价值也最大,但它的量不会有仿真数据那么大,可能占 10%。
还要考虑采集成本,有些公司硬件能力没么强。我们本体做得足够好,所以才有条件在今年下半年有几百台机器人能采集数据。我们会找到一些场景,让人遥控操作不能自主执行任务的机器人。让客户为这一部分的功能买单,降低硬件成本。
《晚点》:在你的设想里,通用人形机器人最终会是什么样的?
彭志辉:就科幻电影里的那种。比如 I,Robot。科幻电影拉高了大家的预期,但我们希望最终能做出来。
《晚点》:那是一种超人的状态,而不是像人。
彭志辉:可能很难有中间态。一旦人形机器人达到正常人类的水平,那它很快就会远远超过人类。
《晚点》:那个未来距离现在还有多远?
彭志辉:我比较乐观,未来 10 年是有希望的。
人形机器人最早落地的场景是 “PPT”
《晚点》:你们说今年是智元商业化元年。其实不少人觉得,人形机器人还处于早期阶段,刚学会走路,没必要这么快去上班。
彭志辉:我们是一家商业公司,商业化是检验成果最有效的方式,把产品卖出去,客户给了积极反馈,才能吸引到更多人才。一个落地遥遥无期、不太有希望的团队,大家也不会加入。
《晚点》:你们说人形机器人商业化路径是先工厂、后家庭,现在处于工厂阶段,他们能做什么场景?
彭志辉:目前最快落地的就是 “PPT”,Pick(抓取)、Place(放置)和 Transfer(转运)。
灵巧手更成熟后,还可以做各种装配工作,因为灵巧手有触觉、力觉等各种复杂感知能力。这个场景的量会更大,我们评估了一下,PPT 可能就只占整个制造行业场景的 20% 不到。
《晚点》:你们说今年就会卖出 300 台机器人。200 台有腿,100 台靠轮子移动。更具体来说,他们会做什么工作?
彭志辉:卖的主要是远征系列,灵犀系列不卖,都开源。
远征系列里,双足(人形机器人)的可靠性和自由度还要进一步迭代,现在更适合做一些体现人机交互能力的场景,主要是服务业。比如我们发布会上展示的汽车门店里的迎宾导览。轮式的就是 A2-W,在工厂里做 “PPT” 那些工作。
智元的人形机器人远征 A2 在汽车门店当导购。
《晚点》:行业里也有一些机器人公司,比如梅卡曼德、思灵等,给机械臂增加视觉、力控能力,用上大模型,在工厂里也能做 PPT,而且他们已在稳定性和成本上打磨了更久。你们新方案的优势是什么?
彭志辉:它们的确是机械臂厂商中最贴近具身智能的公司。我们从单臂演化到了双臂,然后还带一个移动底盘,一些高层的双臂规划上,我们会有一些技术差异化。
比如典型的转运场景中,用单臂搬一个托盘很难实现,双臂做这个任务就更合理。从单臂到双臂,听起来很简单,其实会涉及复杂的力控和双臂配合、环境感知、动态避障、轨迹规划等。更关键的是,以上这些能力我们要做成可以泛化的标准技能,降低机器人的部署成本。
智元机器人 A2-W 在工厂中搬托盘。
《晚点》:智元卖出去的 A2-W,已经能解决这些问题了?
彭志辉:能解决一部分,重点是找到客户需求和我们已有技术的匹配点。我们的投资人也比较给力,确实提供了一些很有价值、能在短期落地的场景。
《晚点》:刚才你也提到,你们非常在意成本。去年你说人形机器人要降到 20 万以内。这个数字是怎么算出来的?
彭志辉:要看客户的期待是什么。一个工人的成本一年大概是 10 万,机器人可以两班倒。20 万客户差不多一年或一年半就能回本。我们也拆解了零部件成本,只要量足够大,的确可以达到这个水平。
《晚点》:智元的产品距离 20 万还有多远?
彭志辉:不远了。我们批量发货的目标成本就是这个,要不然可能就是亏本了。
《晚点》:你们的竞争对手会是谁?
彭志辉:这个赛道足够大,大家都还在做大蛋糕的阶段,现在还没有什么直接竞争对手。
有一些潜在的竞争对手还没下场。比如新能源车厂,它们有动力做这件事,如果人形机器人在产线上体现出价值,它们肯定会投资源做。它们也有能力做这件事,你看机器人本体上用到的各种核心零部件,电机、电控、电池等技术,就是新能源汽车擅长的那一套。
《晚点》:你预想的人形机器人很硬核,但现在商业化的产品看上去似乎很无聊。你会感到矛盾吗?
彭志辉:不冲突。我们是并行研发,都在做。我们有几条线,一个是产品化、量产的线,一个是探索预研的线。我们经常在内部说,要吃着碗里的,看着锅里的,还得想着田里的。
像运营大公司那样去创业
《晚点》:你们 8 月一次发了 5 个人形机器人产品,还卖关节电机、夹具、提供数据采集方案。今年还发布了商业清洁机器人。你们的产品线是不是铺得太开了?
彭志辉:这其实是一个主线落地加很多支线探索,我们觉得还是有必要做这些布局的。我们叫饱和式投入。一方面我们有这个条件,同时整个赛道也还不太明确。
当然我们也会控制支线的资源投入。比如我们这次发布了 X-Lab 实验室做的两款产品,全职参与的人其实不到 5 个,从全新的关节到结构软硬件算法都是这几个人做的,在 X-Lab 我比较追求人效。
商业清洁机器人则是一个相对成熟的产品,能为我们人形的量产提供前置帮助,比如渠道、制造、售后等。它又能复用人形的一些能力,比如给清洁机器人加机械臂,让它做更多事。
《晚点》:技术布局上,不少人形机器人公司都不做全栈,比如硬件本体上,一些公司不研究灵巧手,就用夹具;还有一些公司认为腿没必要,只做上半身。具身智能系统上,很多公司也会在强化学习、模仿学习中有侧重。
彭志辉:你得看各家公司擅长什么或想做什么。我们想用智能机器去创造无限的生产力,就不得不关注全栈。这是从最终产品的竞争力出发的布局。
《晚点》:你们的计划的开发节奏也很快:半年一代样机,一年销售一代产品。
彭志辉:所有的创新都要可持续,要考虑长期竞争力,并提前布局。创新的速度和创新一样重要。
《晚点》:但人形机器人能做成什么样都不明确。智元怎么确定每一代产品的迭代方向?
彭志辉:就是刚才讲的,把事情想清楚,具体要做哪些场景,怎么做?需要什么核心零部件和核心技术?
我们调研了很多客户的需求,制造业的、服务业的。我们的股东也提供了很多输入。从不同场景出发,我们提炼出技术路径,发现有的更偏传统自动化,有的更偏未来 AGI ,还存在一些中间状态。这就是我们在发布会上的 G1-G5 智能演进路线。
智元目前商业化的产品处于 G2 阶段,正在研发 G3 阶段的系统。
《晚点》:同时做这么多东西,又想做得快,这真的可能吗?
彭志辉:其实我们成立半年就做出了第一代人形机器人。首先是靠人才,大家的战斗力都很强。然后也有一些我的个人经验积累,还有整个行业的发展,AI 技术大规模应用。
与前几年相比,现在做这个事情的难度会降低一些。机器人的技术栈和新能源汽车很像,新能源汽车行业带动了上游制造业。在国内做通用机器人会有一些额外优势。
智元第一代人形机器人远征 A1。彭志辉说,考虑到站在操作台前工作的场景,下半身采用关节往后弯的 “鸵鸟腿”。
《晚点》:团队战斗力很强,怎么衡量?
彭志辉:就是工作效率,创新能力,还有投入程度。
《晚点》:很多公司的投入程度也高,也卷。这一点上你们怎么能比对手更强?
彭志辉:首先我们招人时,会尽量筛选志同道合的人。比如价值观要跟公司匹配。我会问他的兴趣点是么?比如 “如果你财务自由了,会不会继续做现在岗位上做的事情?” 实际上我们公司的 Up 主浓度挺高的,他们都是因为热爱主动投入的年轻人。
然后给足够的信任,配足该配的资源;过程中鼓励充分发挥主观能动性,但是在验收结果时,标准要提高;结果好的时候,给足够多的激励。
我们激励方式比较多,年终奖之外也会给股权。我们未来的目标是跟华为一样,优秀的同事都配股。
《晚点》:最近的发布会上你也提到,机器人是一个非常复杂的软硬件协同系统。你们需要同时做好很多事,怎么让各团队高效协同?
彭志辉:系统架构设计,是我们非常看重的能力。我们认为,人员的规模增长一定要有对应的组织能力,否则可能就是灾难。我们的组织架构非常扁平,层级很少,一线研发上面是各个技术模块的研发经理,再上面就直接是我负责了。大家可以充分沟通交流,我们非常鼓励及时反馈,暴露问题。
除了常规项目开发流程外,我们还会以项目攻关组的形式推进一些关键技术的突破。像核心零部件,我们会成立虚拟组织,成员承担的职责更多,要求更高,但是做成之后的激励也会更大。
《晚点》:智元除了自己招人开发,还跟北大合作建实验室,甚至你们还收购了一个电机公司,早期公司很少这么做。
彭志辉:我们其实都是尝试。比如说收购的电机团队,其实只有两个人,又比较出色,也给一些大品牌做过代工,反馈也不错,我们就把他们吸纳进来了。
《晚点》:多产品线、全栈技术布局、整合产业链,包括你们矩阵型的组织架构,感觉你们在用大公司的运作方式创业?
彭志辉:可以这么理解。但我们并不是为了表现得像大公司,而是因为当前的市场环境下,这种方式是最有效的。这是一个相对新兴但迅速发展的领域,我们需要快速占领市场,展示我们的技术实力和产品愿景。
大行业、大赛道最终都会收敛到头部企业,如果只是小打小闹,很难在快速变化的市场中保持领先地位。
“我不是天才”
《晚点》:有人说你是 “全栈溢出工程师”,可以焊电路板,造机器人,还能写代码,训练 AI 模型等。另外你也会弹吉他、剪视频等。你有什么特别的学习方法吗?
彭志辉:可能跟 AI 学习的方式有点像,早期靠一些过拟合,再用更多锻炼,增加泛化性。多参考别人已有的经验,先不要问为什么,哪怕死记硬背,先记下来,慢慢就会理解背后的原理,然后再积极创新。跨领域掌握多个技能后,就会发现它们之间有相关性,一个领域的事情可能会帮你解释另一个领域。
还有时间管理要做得非常好。大家都说我是时间管理大师什么的。我喜欢用靠类似操作系统里面的概念,叫抢占式调度,对要做的事情做动态优先级分配,不是做完一件事再做另外一件事,如果有更重要的事出现了,就去做它,做完再切回到之前做的那个事。每次只做一件事,分时保持专注,可能时间利用效率会比较高。
《晚点》:你的方法比较系统。之前我问宇树科技王兴兴类似的问题,他说 “24 小时不睡觉,我不信解决不了”。
彭志辉:我很多灵感也是睡觉前想起来的。日有所思,夜有所想。我也在梦里想到过一些问题的解决方案,挺神奇的。不过有些事情可能很难,像数学,不会就是不会。
《晚点》:你刚才提到时间管理,哪怕是天才,一天也就 24 个小时。你现在投入这么多精力创业,在其他方面牺牲会很多?
彭志辉:对,现在基本上很少有周末。从去年创业到现在还没有请过假。我个人还有些小习惯,我不太睡午觉,一天只吃一顿晚饭。
《晚点》:为什么一天只吃一顿饭?能维持状态吗?
彭志辉:有的时候确实忙,不太有时间,我觉得吃饭比较费时间。饿了也可以吃点零食嘛,身体也没有什么负面反馈,我觉得只要达到平衡就不算太坏的习惯。
《晚点》:创业一年多,给你印象最深的事是什么?
彭志辉:太多了。比如去年 8 月开第一次发布会时,各种意义上都非常极限。发布会前两个多礼拜,我们研发的同学们基本就在会场打地铺睡觉。
发布会我们选了最有挑战的直播形式,当我已经上台讲了 20 分钟后,才看到台下小伙伴比的 OK 手势,我们终于解决完了最后一些 bug。
《晚点》:为什么不能往后拖?
彭志辉:已经拖过了,这是延过两次之后的时间。还是得逼自己一把。
《晚点》:你之前都是一个人做项目,现在你要带一个团队。你怎么学习管理?
彭志辉:一方面跟有经验的前辈学习。另外就是在实战中学,同时也有一些配合我做管理工作的伙伴帮忙。
《晚点》:那你还看书吗?都看些什么书?
彭志辉:都在我办公桌上,各种论文和书。长篇小说好像只看过《三体》,我喜欢硬科幻,是 big 刘的忠实粉丝,《三体》看了 10 多遍。
《晚点》:见到刘慈欣,你会跟他说什么?
彭志辉:给我签个名。
《晚点》:现在应该有很多找你要签名。遇到这种情况时,你在想啥?
彭志辉:早知道就好好练练字了。
《晚点》:你身上有很多标签,比如 B 站知名 UP 主、天才少年、明星公司联合创始人、野生钢铁侠、全栈溢出工程师。你更喜欢哪个标签?
彭志辉:个人来说可能是工程师吧。我觉得搞技术还是很有意思的。假如我未来财务自由了,我不一定会去做视频,但肯定会继续做技术方面的事情。
《晚点》:你怎么看 “天才少年” 这个称号?
彭志辉:我觉得我不是天才啊。大家也没有必要这么称呼。我只是兴趣使然,愿意动手尝试做一些东西出来,恰好遇上一个比较好的时代,和各种平台、机遇,做出了一点成果,更多的是努力和幸运吧。
《晚点》:你觉得什么样的人才能称得上天才?
彭志辉:他们的存在对整个世界的发展轨迹能有很大影响,比如大家在课本上看到的科学家们。
《晚点》:造出了真正的人形机器人,才算天才?
彭志辉:我会把这个称号让给我们造出的机器人。
题图来源:彭志辉。