@      元动力 —— 人形机器人概述及投资分析

你的位置:5星体育广播 > 新闻动态 >

元动力 —— 人形机器人概述及投资分析

行业研究是投资的源动力。元禾控股推出“元动力”系列行研分享,编辑部据此推出《元动力》行业研究专栏,旨在交流行业研究成果,分析行业发展趋势,探讨未来投资方向。

本期《元动力》行业研究专栏聚焦人形机器人,分享者是元禾控股研究中心(博后站)分析师闫亚东,将从人形机器人概述、核心技术拆解、发展趋势及投资分析等维度进行展开。

人形机器人概述

人形机器人是机器人行业从专用到通用场景的升级,它是具备人类外形特征和行动能力的智能机器人,以双腿行走的方式,通过手臂和身体的协调完成功能,基于通用型算法和生成式AI,具备语义理解、人机交互、自主决策等能力,并利用人机交互实现任务理解与反馈,有强大的感知计算与运动控制能力。

智能化、通用性,这是人形机器人区别其他机器人产品的两个特点。

人形机器人发展历史久远。自20世纪60年代开始,人形机器人历经早期、高度集成、高动态、商业化落地等不同发展阶段,也诞生了非常令人惊艳的人形机器人Demo和产品,比如本田ASIMO和波士顿动力Atlas。

但本田ASIMO和波士顿动力Atlas都没有商业化量产,原因首先在于成本居高不下,达到百万美元以上,其次也是还有软硬件上的技术难点未被完全攻克。

在投融资方面:从数据来看,近两年来,随着大模型出现、核心零部件国产替代,全尺寸人形机器人技术壁垒与研发成本下降,一批新型初创公司开始出现,人形机器人赛道投融资比较火热。2024年前三季度,人形机器人赛道亿元级别的融资案例屡见不鲜。

2024年1-9月中国人形机器人亿元及以上投融资事件,来源:元禾控股

在政策支持力度方面:2023年11月,工业和信息化部印发《人形机器人创新发展指导意见》,提出人形机器人有望成为继计算机、智能手机、新能源汽车后的颠覆性产品,并明确2025年实现批量生产、2027年相关产品深度融入实体经济成为重要的经济增长新引擎,这是国家层面首个仅针对人形机器人的政策方案。

在专利数量布局方面:目前已经积累的技术主要集中在本体结构部分,驱动控制以及智能感知领域;其次,核心零部件以及支撑环境分支目前相对较少;中国、日本、韩国、美国、法国是目前持有专利数量排名靠前的国家;本田、优必选以及三星是全球持有人形机器人有效发明专利数量靠前的企业。

近年来主要人形机器人产品,来源:中航证券研究所

在产业链方面:上游是电机、减速器等核心零部件和摄像头、轴承等其他零部件;中游是人形机器人本体制造,包括主要模块、内置的算法模型与系统、主要组成部分;下游是系统集成、产品销售与维修保养。人形机器人的应用场景是家庭、工厂和商业等。

人形机器人产业链,来源:创业邦

核心技术拆解

人形机器人技术

人形机器人技术的技术分支很多,简单讲可以从两个层面去理解::第一个层面可以分为软件和硬件,软件是代码和数据,硬件是所有看得见、摸得着的东西;第二个层面是按机器人身体部分去分,最主要的可大致分为脑、手和腿。

人形机器人关键技术分析,来源:元禾控股

双足

人形机器人外观看起来像人,很大一部分原因是因为它和人一样有两条腿。当前无论在科研领域还是业界都有大量的工作是在研究人形机器人双足的运动能力:怎么走得稳?怎么跑得快?怎么能上楼?怎么能跑酷?

要做人形机器人的双足控制基本来说有两种方法:第一种是基于动力学、运动学的传统建模方法,这种方法的建模计算比较复杂,很多参数在现实环境中无法准确获取。现在随着深度学习的快速发展和广泛应用,越来越多被双足机器人领域采用的是第二种方法,即深度强化学习算法,这种方法无需建模,可在仿真环境中大量部署进行训练,随数据扩增性能增强。此外,也有一些使用两者结合的方法去做的。

双足存在的必要性也是目前很有争议的点,已经有不少人意识到,双足不是必要的。2024年上半年推出的新型人形机器人中,虽然双足机器人仍占据主流,但是选择轮式底盘的机器人数量在逐渐增加。

实际上对比来看,轮式在控制难度、成本、速度、故障率、安全性方面都要优于足式,在工厂和家庭等多数环境中看不到双足移动存在的必要性。

脑(决策)

大模型为机器人装上“大脑”,提升其理解能力,可提供决策。目前,国内大模型市场竞争激烈,但“大模型+具身智能”还处于技术探索的初期阶段,技术路线尚未收敛。语言大模型可以提供交互和决策,但是无法直接参与操作,就是在于灵巧手操作的问题没有解决。

灵巧手

灵巧手操作很大程度上决定了机器人的应用场景和使用范围。人手共有22个自由度,复杂而灵活。人形机器人的灵巧手是一种基于人手运动学设计的特殊末端执行器,目前绝大多数机械手无法完美复刻人手的功能。

灵巧手领域一个悬而未决的问题是不确定用哪种结构。灵巧手在实际应用中需要多少个自由度,是采用三指形态或者五指形态,是使用欠驱动或者全驱动的方案目前都尚无定论。目前人形机器人领域比较典型的灵巧手结构有以下三种:

一是夹爪形态,图片所示是腾讯Robotics X研究院推出的产品,是一款三指夹手,其设计理念就是模仿了拇指、食指和中指,因为实际上人手的无名指和小指作用没有那么大。好处是省出来的空间可以装更多的电机,让它更灵活,它有8个自由度。

第二种是目前用的最多的6自由度仿人手机械手,如图所示是因时机器人的产品。这种手的优点是电机内置,既保留了人手的形态又比较轻便,缺点是灵活度不高,除拇指外四指都采用欠驱动方案,两个关节只有一个驱动器。

最后一种是最灵活的一种,就是全驱动灵巧手。典型代表就是Shadow hand,它有超过20个自由度,设计复杂,跟人手一样,目前在一些灵巧操作的研究工作中使用率很高。但这种手的问题是驱动器数量多且外置,重量和体积都比较大,成本也比较高。

灵巧手操作控制

灵巧手的硬件结构决定了操作的上限,而控制决定了其实际操作能力。灵巧手操作也被称为人形机器人的最后一厘米。目前在业界,甚至在科研领域,灵巧手操作能实现的功能还比较有限,并且多数仅在特定环境或仿真环境中有效,泛化性较差。

OpenAI在2019年利用强化学习在仿真环境中的训练实现了机械手单手复原魔方,是灵巧手灵活操作方面非常杰出的工作。但OpenAI2021 年解散了机器人团队,解散的理由是“数据不够丰富”。

在需要数据支撑的学习类算法取得充分成功的今天,数据问题阻碍了人们在机器人技术方面的发展。当下的情况是,机器人数据规模远远无法与图像和文字数据规模相比,而且机器人形态各异,数据往往需要针对特定的机器人类型。数据缺乏、成本高、成功率低,是目前人形机器人训练的三大痛点。

传感器

传感器负责机器人的感知输入,类似人类的视觉、听觉、嗅觉、触觉等感觉。人形机器人需借助多种传感器识别自身运动状态和环境状况,收集多模态数据以供交互。因为灵巧手操作的重要性,我们重点看一下跟操作直接相关的传感器。

六维力矩传感器:力矩传感器是一种用于测量物体所受到的力矩或扭矩的传感器。六维力矩传感器能感受六个维度的力,通常用在人形机器人手腕处,是性能最优、技术壁垒最高的力矩传感器,但是成本较高,生产厂商主要分为欧美、日韩、国产三大阵营。

触觉传感器:触觉传感器最常用的有一维压力传感器,其成本较低,使用方便,但实际使用中获取信息单一,如无法获取温度、滑移等信息,对灵巧手的覆盖范围也有限,无法有效生成力分布数据。对很多灵巧操作来说,一维压力传感器的性能是不够的。

视触觉传感器:视触觉传感器是一类比较新的触觉传感器,它的原理是使用内部摄像头采集传感器接触面的视觉信息来判断接触状态。在科研界已经有很多相关研究,在一些最新的人形机器人样机上也看到了视触觉传感器的应用。人类在操作物体的时候,手部的触觉信息包含物体本身的状态和接触的状态两个维度,大多数触觉传感器比如压阻式、压电式、电容式和电磁式大都只能感受法向力,而对其他信息无法采集或灵敏度很低,视触觉传感器感知信息维度丰富,包括力分布、物体纹理、粗糙度、硬度等,且成本可控,对比传统传感器有优势。

电机

电机的主要作用是产生驱动转矩,是动力源。在灵巧手使用的空心杯电机一般指的是空心杯电机+多级行星减速箱组成的模组。空心杯电机份额仍然集中在海外厂商,国内外空心杯电机制造商在软实力和硬实力均有一定差距,代表企业有瑞士MAXON、德国FAULHABER和瑞士PORTESCAP以及鸣志电器、鼎智科技、兆威机电、伟创电气。

发展趋势及投资分析

结合人形机器人行业目前发展的情况和核心技术的成熟度,我们首先从人形机器人的落地场景进行分析。

商业化落地场景

人形机器人的商业化落地场景,典型的有三个:工业、商业、家庭。

在工业上,早已经有了机器人的参与,工业机器人在物料搬运、焊接、装配、扫地、分拣、加工等多种场景都已经成功应用。2022年我国工业机器人市场规模为87亿美元,占到了我国机器人市场规模的一半,销量为30.3万台,占全球工业机器人安装量的一半。

需要注意的是,人形机器人的特点之一是通用性,但在工业环境下应用时,不可避免要走向专业化,两者存在本质矛盾。在初期试探的时候可以使用人形机器人去做一些简单的、专业化分工细致的工作,但当人形机器人在工厂落地大规模应用时,无可避免地要追求成本、效率,这时候注重通用性的人形机器人大概率无法与工业机器人或复合机器人相比。

另一个场景是商业,目前也有一些在商业上应用成功的机器人,常见的商用场景中,商用服务机器人主要分为终端配送类机器人、商用清洁类机器人、引导讲解类机器人等,已经被广泛应用在餐厅、酒店、娱乐商超等场所。然而,目前的商用服务机器人均不涉及需要操作的复杂场景,也不需要通过灵巧手与人进行互动。未来如果考虑人形机器人进入商业场景,那现有技术的稳定性和安全性还需要进行升级。

最后一个场景是家庭,家庭也是普通人最期待的人形机器人的应用环境,人们对人形机器人在家庭中的角色期待是可以做各种家务,照顾老人孩子等。但通过对最新的技术进行研究发现,目前针对家庭环境,即使在科研领域,人形机器人能实现的功能都非常有限。因为家庭环境不同于工厂环境,家庭环境的非结构化及复杂程度要更高,家庭中需要接触的不规则物体和柔软物体更多,且家庭中机器人难以避免直接与人接触,这对机器人的安全性也提出严苛要求。

因此在未来的家庭环境中,我们觉得一个有潜力的方向是软体机器人。与刚性机器人相比,软体机器人在与人类的交互中更加安全、能够更好地适应复杂和非结构化的环境、更容易处理软和易碎的物体。实际上目前软体夹爪在工业上已经成功应用,其他在康复领域也有应用,比如气动的康复手套,软体的康复外骨骼等。总之在需要和人体发生直接接触的环境中,软体机器人会是一个有优势的方案。

人形机器人VS自动驾驶

现在一个常见的观点是,人形机器人的发展,可以类比自动驾驶。一方面来说这个观点是有道理的,汽车可以看作特殊场景的机器人,其可执行的自由度有三个:方向盘旋转、两个踏板的平移,是使用场景特别确定的简化的机器人。我们看到自动驾驶产业经过近十余年的高速发展已经进入逐步泛化阶段,高等自动驾驶正逐步落地,这会给人形机器人的发展带来一定的信心。然而,对于目前流行的端到端自动驾驶来说,长尾数据问题依然没有解决,这已经成为了制约自动驾驶发展的最大难题之一。

另一方面,人形机器人和自动驾驶又有明显的区别,主要有以下几点:

自动驾驶应用场景明确而单一,人形机器人应用场景未定且复杂。

自动驾驶需要控制的参数少,人形机器人需要控制的参数多得多。

自动驾驶需要的传感器基本满足使用,人形机器人的触觉尚未解决。

自动驾驶未成熟时不影响其硬件(汽车)销售,人形机器人大模型未成熟时硬件很难起量。

自动驾驶发展的中间阶段使用可由人为介入规避风险,人形机器人则难以介入,增加了危险性。

自动驾驶硬件基本结构早已确定,人形机器人很多结构(灵巧手等)尚未确定。

自动驾驶过程为多次短期操作,机器人操作涉及长操作,误差更容易积累。

所以,可以看到,自动驾驶可以看成场景确定、功能简化的机器人控制,但是人形机器人的难度还是要明显高于自动驾驶。

路径分析

关于人形机器人应用的难点基本都会落在灵巧操作上,在现有技术环境下,要解决机器人操作的难题,大的路径有两种,一个是基于模型的算法,一个是基于学习类的算法。

人形机器人发展路径分析,来源:元禾控股

模型算法的问题是复杂、上限低,学习类算法的问题是数据依赖和黑盒。人工智能专家Rich Sutton在他的文章中说过,AI研究的历史表明,能够随着数据规模扩大而提升的算法总是胜过那些复杂却无法随数据规模扩大而提升的算法。结合近年来学习类算法取得的成功,相信机器人操作问题的解决主要还是会依赖学习类算法,即建立机器人操作大模型这条路。

但要建立机器人操作大模型,目前的数据量和质量都是不够的。这里包括两种数据,真实数据和仿真数据,真实数据的数据量非常有限,要解决这个问题可以采集新数据或者去利用现存的其他数据。采集新数据无疑是最直接的方法,但是效率低下,且在目前机器人硬件未完全定型的情况下存在一定风险。利用其他现存的其他数据如可以使用视频数据,但是目前也还在研究阶段。仿真数据的难点是在使用时面临Sim2real gap的问题,这是由仿真环境和真实环境的差距带来的。面对一些较简单的场景这个问题可以被解决,但是在泛化的环境中,尤其涉及软物体操作时,目前还无法被有效仿真和迁移。可以看到机器人大模型的数据问题目前还没有有效解决,将来成熟的方法也可能是多种数据类型和算法的组合。

中航证券研究所预测,2030年人形机器人累计需求有望达200万台,对应市场空间约5700亿元。我们认为,这是偏乐观的预测,结合人形机器人的技术成熟度、应用场景要求和发展逻辑来说,人形机器人未来很长一段时间真正有效的市场仅限于科研、展览、表演等环境。

机器人市场规模预测,来源:中航证券研究所

总结

从行业来说:

在工厂环境下,人形机器人的通用性出发点和应用场景追求专业性(效率及成本)上存在根本矛盾,专业化要求下大概率机器人形态偏离人形。

在家庭环境中,人形机器人对软物体的操作以及安全性将成为大问题,目前看很难有效解决。

双足形态看不到存在的必要,轮式在速度、成本、安全性方面更具优势。

灵巧手及传感器决定了操作能力的天花板,是人形机器人能否真正实用的关键之一。

当下时代,数据成为人形机器人能否商业化的最重要因素。

人形机器人的核心要义是智能,而不是像人。

免责声明:本文不构成任何投资建议,投资者不应以该等信息取代其独立判断或仅根据该等信息做出决策。我们尽可能保证本文信息准确可靠,但对其准确性或完整性不作保证,亦不对因使用该等信息而引发的损失承担任何责任。