2024年7月4日,上海,观众在2024世界人工智能大会上参观特斯拉推出的第二代擎天柱(Optimus)人形机器人。视觉中国 图
AI(人工智能)的快速进步正让人形机器人产业进入发展快车道。
7月5日,在2024世界人工智能大会的“人形机器人前沿论坛”上,来自世界各地的多位机器人研究者和产业专家分享了对于机器人技术发展的全景分析与展望。与会者普遍认为,AI(人工智能)的出现为机器人带来了前所未有的发展机会,人形机器人技术有望在未来有更大的突破。
人形机器人要大规模应用需降至2万美元以下
对于机器人的定义和定位,以色列智能机器人中心主席Yosi Lahad表示,智能机器人处于机器人学、数据、认知能力学、传播学等多重领域的融合地带,能够实现自主操作、感知环境、互动、推理、自我学习、适应行动等多重功能。
根据Macquarie Research在2023年发布的报告,人形机器人的硬件总成本目前约为5万美元。其中,端到端AI软件大脑、传感器及芯片、伺服电机及电机驱动器都各需要1万美元,惯性测量单元和扭矩传感器需要5000美元,精密减速器需要8000美元,电池和电池控制系统需要2000美元,其他部件(包括机身材料)约5000美元。
对此,Lahad认为,为了让人形机器人能够得到大规模采用,其成本需要降到两万美元以下,是现在成本的一半以下。为实现这一目标,或许需要对机器人的外型进行一些改变,例如重新考虑模仿人类腿部的底座设计。
而日本大阪大学智能机器人实验室主任石黑浩坚定地认为,我们不仅需要智能机器人,还需要人形机器人:人类大脑在构造上最擅长识别人类,所以对人类来说,最理想的互动接口理应是人形的;另外,能够通过研究人形机器人来研究人类自己的认知能力,从而对人类自身进行理解和定义。
被称为“纳米机器人之父”的日本科学家、中科院外籍院士福田敏男也谈到,机器人和人类能够通过“信息交流”和“物理交流”这两种互动方式相互作用,带来全新的刺激并激发灵感。
AI对于机器人技术发展的推动作用已经成为业界的共识。IEEE产业标准和技术组织MASA(元宇宙加速与可持续发展联合会)主席袁昱表示,AI正在改变机器人开发的范式,“从符号主义到连接主义、从规则到参数、从编码到学习”,让机器人变得更聪明,也开拓了更广泛的应用场景。
石黑浩解释了机器人技术和人类科学是如何被大语言模型结合到一起:前者是机器人的基础功能,包括语音识别、图像理解、传感器和控制器等;后者属于元认知(meta-level cognitive)功能,包括社会关系、意识、智能和具身化等。例如,一个装有先进大语言模型的机器人将能够与人类进行自然对话,识别并理解人类的情绪,从而提供更具个性化的互动。
人形机器人产业化的三大挑战
从产业观察和投资角度,盛景嘉成基金管理合伙人王湘云指出,人形机器人是机器人向通用智能发展的重要路径,是具身智能的重要载体:“人形机器人不是具身智能的唯一形态,但确实是有最多人类真实训练数据的形态。”
从这个角度来看,人形机器人产业也可以对标自动驾驶产业,本质上都属于具身智能,“自动驾驶向端到端模式进化对人形机器人有重要的借鉴意义”。例如,特斯拉FSD V12使用了端到端模型,从上一代的30万行代码降到2000行代码,在海量数据的支持下实现了更好的效果。
不过,AI也为人形机器人技术的发展带来了新的挑战。
Lahad指出,虽然GPT等AI在处理事实性或描述性任务时表现得很好,但在分析性任务上表现不一致或缺乏智能,而机器人需要处理非常复杂的现实环境,在该问题上业界依然争论不休。
王湘云谈到,在现有大模型的技术路线下,训练数据是不可回避的核心要素,是机器人和大模型“具备工程可行性和经济性的重要前提”。目前看来,人形机器人产业化面临的三大核心技术挑战在于算法、硬件和数据。其中,算法中的操作能力、硬件的成本问题和数据的收集效率都是很大的挑战。
尽管存在诸多挑战,但人形机器人的前景无疑巨大。Lahad引用了高盛今年最新的预测,即人形机器人到2035年将呈爆发式增长,出货量将达到140万台,全球市场总规模(TAM)达380亿美元。全球从事物流和制造业的人形机器人将在2030年左右达到100万台,人形机器人有望在十年内走入服务、家庭护理、健康和教育产业。
王湘云也指出,工业和商业服务(如物流、零售)场景是人形机器人获得验证的关键路径,家庭机器人优先级靠后,因为前两者已经具备了一定的商业化机会。