-
观察者网WAIC直播实录:AI大潮下的具身和人形,中国在跟跑还是并跑?
最后更新: 2025-08-05 23:55:24赵仲夏: 了解。冯院长,刚刚勉诺提到了给智能一些时间,给研究者一些时间。我之前的感受是通用智能的每一次迭代都会摧毁在专有领域的所有努力,无论早期的 CV 到后面的自动驾驶都一样。您这边应该算是从 AI 1.0 走出来的公司,然后您对人形机器人和具身智能的落地是怎么看待的?有没有一些经验可以跟大家分享一下?
冯子勇:落地还早,说明就是还有的做嘛。从我的角度来看,落地还是数据先行,现在我已经看到不管企业、政府还是学校,还有一些其他组织都在牵头做各种各样的数据采集工厂或者各种机构什么的都有。
所以广泛的数据采集是必不可少的,但是在采什么数据上可能大家有一些分歧,像仿真的数据,动补的数据,各家都在说自己好的,没有定论。从预训练的角度,我的想法是回顾像GPT 跟 CLIP 这样的模型,大家用的主要是互联网数据,GPT 用的就是 common crawl,基本上是整个互联网的语料, CLIP 也是在 common crawl 里面把图文的 pair 给取出来了。所以我有一个幻想,可能答案还在互联网里面,可能数据一直在那,只是大家还没有找到一些非常有智慧的方法把它给找出来,去做具身的预训练,这是我的想法。
从 action 模型的角度,我更倾向最好是有一个设备能跟着人一起走,就像眼镜。
赵仲夏: 今天的会场好多眼镜。
冯子勇:对,有一个对比,像特斯拉的FSD,大家在开车的时候把自己的操作给记录下来了,就将采数据和产品融合到一起,这样的话,特斯拉有多少,就得有多少数据采集员,那这个量是非常可观的。眼镜是这里面最像的一个,我个人觉得一个是它可以适合所有人戴。在任何地方、任何场景采任何数据,然后人肯定戴了之后会有操作,只要把操作也记录下来,像Meta,他们有一个新的演进形态是Arial好像。
赵仲夏: 对,面向研究者的眼镜,还得申请。
冯子勇:它有一个机电的手环,相当于我在操作的时候,把手的操作也记录下来,是不是这样的数据在量大了之后,就能从量变直接达到质变?有那一刻像 FSD 最开始,也是从小模型到一个主干多个分支的模型,到 OCC 网络,到直接到现在它可能也是数据采集到了,它就可以直接上端到端了。
另外一个,刚才说具身真的离落地可能还有点时间,我也规划了一个项目,关于多模态的,这里其实在 VLM 到具身中间还加了一个叫 GUI agent,因为 GUI agent 也是操作物理的世界更加简单,而且不停地能重复。如果我们能在上面做得好,那可以谈具身,但如果在这上面都还磕磕巴巴的,就证明离具身的确有点距离。
赵仲夏: 对,您刚刚提到眼镜的时候,我的一个观察是现在大部分的摇操也要逐渐变成 VR 摇操了,而 VR 摇操很像一个人的手眼关系。这应该和眼镜也是可以互通的。
奚老师,这个就是您这边的重头戏了。您刚才有提到家电智能化、智能家电或者具身家电这个概念,您跟我们先解释解释什么叫做具身家电吧?
奚伟: 具身家电我们还没提这个词,我们现在是家电机器人化的概念。现在智能家电会比较注重的是IoT,就是家电互联这一块,但是家电可能也具有一定的机器人属性,能够让家电进行主动服务,这是下一步家电需要走的方向,要把机器人属性加入到一部分家电的能力中。
比如烤箱,大部分人做饭其实不太熟悉怎么去使用烤箱,怎么能做出更像大厨的牛排等食品。比如烤牛排,假如把一部分机器人的属性,可能把烤箱内部也做一些升降机构,能够自动升降,自动推出,调料也可以自动添加,或者根据它的温度场景进行调配。我们就把烤箱也变成一个智能体,而不是现在只会拉开门,东西放进去再定个时就完了。此外,我们希望烤箱能够更精准地、定制化地给客户服务。把视觉加进去之后,比如把食材放进去,它可以自动识别,自动给你定制菜谱,自动根据你的需求进行调味,这些都可以从我们的产品上实现。
赵仲夏: 客户导向这个感同身受,我感觉做牛排严重打击了我的积极性。我最后问了一个餐厅大厨,他跟我讲要不你先把油温升上去,先把锅弄热了,然后你再放,有没有可能锅不热永远做不出来?我觉得这个太酷了。另外,我们看到美的既有自己的工厂,还有一个整体的制造业,包含未来的面向家用的全领域。您觉得人形机器人未来是一个怎样的落地格局?我们什么时候才能真的每个家庭都拥有一个或者几个人形机器人?
奚伟: 刚才冯院长,还有勉诺也说了,这个还需要一点时间,但从一个从业者的角度来讲,还是要应用来牵引,否则一直在说我们要打磨技术,我们要去要给一定时间、一定空间才能发展。我觉得需要不断地在应用上去探索,反哺我们技术上的一些缺陷,所以从我们角度来讲,工业场景的应用比较具体,也比较聚焦,它在产业的赋能角度来讲,可能短期会产生比较大的价值,所以我们也像特斯拉、很多创业者,都是从工业场景入手。
这样做最大的好处是,我们不一定完全需要这种通用的具身智能,才能够达到进入工厂的阶段。我们可能把它分阶段变成小模型,比如一些小的通过视觉模型,通过一些传统的规划,也可以做到一定的泛化能力。这个过程中,把这些数据采集回来,去训练更具有通用性的具身智能大模型,不断地进行迭代。就像特斯拉,先做一个 FSD ready 的这样一个车,然后放到工厂里,可以先去做一定的自主化或者自动化。但是它不一定是要完全的自主化,过程中我们通过人机混合的方式进行数据采集,但不断地迭代模型,最终实现端到端的这种具身智能模型。这是一个必由的路径,它一定不会是一蹴而就。今天是0,明天接到完全的具身智能。
相对来讲,工业场景比较好结构化,从工业场景我觉得下一步是商用场景,需要有一些人机交互,相对的,它的任务有一定的复杂度,但也会比较结构的,比较具体的,比如在餐饮行业、奶茶店、咖啡店,都是比较简单的一个任务,当他在商业行业能够用起来之后,我觉得最终是引进家庭的。
进入家庭有几个问题,一个是安全问题,再比如说真正的语言的人机交互问题、个性化的定制问题,还有一些隐私问题,都会要去解决,这时候才能真正每一个家庭或者甚至每一个人都能用上机器人的个人助手。
人民网研究院数据统计,从具身智能人形机器人专利累计受理量数据看,截至 2022 年末,中国已占据40%的份额。
赵仲夏: 这个很棒啊。我们是在观察者网的直播间,(时间关系)也是我们的最后一个问题。我个人的感觉,人形机器人如果真的落地,本质上是生产力的解放。当生产力解放之后,经济基础决定上层建筑,整个社会结构都会完成一次解放,然后也许就有可能实现大家社会学上的一些比较好的愿景。所以我觉得它应该是一个世界人民的视野。在本次的人形机器人和具身智能的竞争与合作过程中,大家觉得中美之间有什么优势或者各自的劣势?对这块的话想问一下大家对这件事的看法,要不奚老师您先回答。
奚伟: 我觉得中国的优势还是很明显的,机电优势、产业的优势无庸置疑。人形机器人在中国发展两年,整个产业链发展非常迅速。尤其是今年,关键模组也是飞速降价,让很多的从业者能够参与到行业来,而且进入成本可以开始做一些规模化的应用。这个是中国的巨大优势。
但在包括具身智能、 AI 技术等的发展上,我觉得中美两国还在并肩竞争阶段,我认为从某些角度来讲,美国有一定的领先优势,中国更多的还是在 follow 、了解、快速地发展。
赵仲夏: 冯老师,您怎么看待这件事情?
冯子勇:中国的人工智能的人才还是非常的强的,大家可以看到,不管是中国本身的,从 paper 层面,从创新层面,哪怕是在美国,一半的人才也都是华人,所以人才储备是很强的,中国也有非常广泛的落地场景,像咱们美的,今天在现场也看到很多。
另外,中国的政策优势也很明显,政府非常大力地支持。需要改进的,刚才也都说了,我们的创新性就更多的还是以 follow 为主。
赵仲夏: 了解。勉诺,你可能对中美之间都会接触得更多一点,你是如何看待这件事情的?
陈勉诺: 从我的视角下,我自己看到中美确实两边形成了更加鲜明的优势。在中国,大家可以看到更高的人才密度的这个涌现,我们今天说 AI 和具身智能的整个行业的竞争,变成了中国的中国人和美国的中国人的竞争。
从我的视角下,我自己看到中美确实两边形成了更加鲜明的优势。在中国,大家可以看到更高的人才密度的涌现,我们今天说 AI 和具身智能的整个行业的竞争变成了中国的中国人和美国的中国人的竞争。
另外一个层面上,中国的硬件优势还是很鲜明的。在美国可能我们只知道有特斯拉这样一家电动汽车公司,在中国有蔚小理,有小米等等这样一些硬件公司,中国本身的供应链的优势能够让硬件这个事情变得更容易去实现,这也是为什么在美国可能软件比较盛行,而在中国硬件可能做的更好,这是中国本土环境下的长足优势。
另外,我们也看到每一次革命的发生都会带来一次大国之间格局的变化,比如说从农业时代到电气时代,再到互联网时代,到今天的智能化时代。我觉得今天可能中国在更迭上是有巨大机会的。
但我们也得正视,中国在改革开放之后,整个的经济发展速度变快,科技的发展速度变快,但还是有一些领域我们仍然有一些不足,比如在算力方面。其实今天可能中国的人工智能瓶颈不在于人才,而在于缺乏比较好的算力,这也是有我们投的公司在去做这个事情。
此外我也看到在机器人和AI场景下还有一些现象,由于在美国可能人力成本比较贵,所以在真正的落地场景里边,无论AI 还是机器人可能在美国落地会更加容易,美国的市场会更加的高效。
所以中国有大量的,无论是硬件公司还是软件公司去做出海,这个也是我们需要去正视的问题,因为在中美的格局下,中国本土的市场在这个人力的成本没有到达很高的情况下,确实在本土市场这一块有一定的挑战。
所以我们也一直倡导今天的创业者要具备全球化视野,要去做全球化市场,利用中国本土的优势服务全球的市场。
赵仲夏: 太棒了,我感觉勉诺可以做我的创业导师。好的,我们也进行了一个半小时了。我们这场具身和人形机器人的讨论,今天也就到此为止,非常感谢奚老师、冯老师还有勉诺给我们带来的非常精彩的观点分享。也感谢大家,感谢各位观众。
本文系观察者网独家稿件,文章内容纯属作者个人观点,不代表平台观点,未经授权,不得转载,否则将追究法律责任。关注观察者网微信guanchacn,每日阅读趣味文章。
-
本文仅代表作者个人观点。
- 责任编辑: 张志峰 
-
鸿蒙世界,正上演“寒武纪大爆发”
2025-08-05 14:45 观网财经-科创 -
大疆、影石相互“偷家”!天空与全景的边界瓦解
2025-08-05 13:43 观网财经-消费 -
华夏人寿被吊销业务许可证,原董事长、董秘被终身禁业
2025-08-05 19:42 -
李宁还能回到过去吗?
2025-08-05 10:27 观网财经-消费 -
AI+中国,能否带来东方文艺的复兴?
2025-08-05 10:06 2025世界人工智能大会 -
苹果在华营收两年来首次恢复增长,库克:感谢“国补”
2025-08-05 07:25 观网财经-科创 -
普惠AI照进现实:云知声如何让技术“越山海”
2025-08-05 23:31 观网财经-科创 -
东鹏半年报:净利增加37.22%,半年营收首次破百亿
2025-08-05 23:19 观网财经-消费 -
特朗普对巴西关税新政引发连锁反应:美国农产品期货市场受冲击
2025-08-05 23:18 观网财经-消费 -
香港法院要求宗馥莉保全18亿美元信托,三子女证据曝光
2025-08-05 20:58 -
2025 WAIC丨加速规模化应用,与施耐德电气共赢“AI+产业”时代机遇
2025-08-05 19:40 2025世界人工智能大会 -
独家对话:用平扫CT筛查早期癌症,阿里医疗AI正让国人夺回“主动权”
2025-08-05 19:38 2025世界人工智能大会 -
尊湃窃取华为芯片技术案宣判:14人被判刑,总罚金超千万
2025-08-05 19:27 观网财经-科创 -
香港高等法院:宗馥莉暂不得提取汇丰账户资产
2025-08-05 19:25 -
谷歌回应恢复中国大陆服务传闻:截图不是来自Google
2025-08-05 19:10 -
计划以29.32亿港元进行私有化,大悦城地产或将退市
2025-08-05 16:43 -
66折,李嘉诚家族一项目大降价
2025-08-05 15:01 观网财经-房产 -
“立秋奶茶大战”在即,美团、饿了么、京东集体声明
2025-08-05 12:39 观网财经-互联网 -
梦百合、左右家居跨界开酒店,醉翁之意还是“卖货”?
2025-08-05 12:05 -
英伟达回应被约谈;我国大模型个人用户超31亿;微软市值破4万亿美元
2025-08-05 08:53 观网财经-互联网
相关推荐 -
“紧盯中国登月节点”,NASA又急了 评论 133印度向特朗普叫屈:土耳其也买啊,怎么不罚 评论 161窃取华为秘密被重判,中国芯没有捷径 评论 312“美国无法强迫中国,还送了份‘大而美’的礼物” 评论 100特朗普欲当面施压,韩方想出条“妙计” 评论 43最新闻 Hot