人形机器人系列——硬件介绍
人形机器人是多领域交叉技术的产物,主要由三大系统组成:感知系统、决策系统和执行系统。感知系统感知系统是人形机器人获取外界信息的途径,主要由各种传感器组成。其中,视觉传感器用于获取图像信息,如摄像头、激光雷达等;触觉传感器用于感知触碰和压力,如力/力矩传感器、声学传感器等。这些传感器收集到的信息为机器人的决策和执行提供基础。决策系统决策系统是人形机器人的大脑,负责处理和决策各种信息。它由芯片和算法组
背景
二十大报告明确指出,新时代要构建新的发展格局,着力推动高质量发展,建设现代化产业体系。在这一战略背景下,数字强国作为现代化产业体系中的关键板块,被赋予了前所未有的重要性,成为未来现代化建设的重点方向。
回顾2022年,我国数字经济规模达到了50.2万亿元,稳居世界第二位。更为重要的是,数字经济占GDP的比重提升至41.5%,成为稳定经济增长、促进产业转型升级的重要引擎。这一系列数据充分展示了数字经济在我国经济发展中的重要地位和巨大潜力。
在建设现代化产业体系的过程中,机器人技术扮演着至关重要的角色。作为通用人工智能的最终载体,智能机器人是一个综合了多个学科的领域,其研发、制造和应用水平直接反映了一个国家的科技创新能力、人工智能技术水平以及高端制造业的发展水平。
随着人工智能技术的不断进步,机器人的能力也在持续进化。机器学习、认知科学、自然语言理解、计算机视觉等人工智能技术正在不断融入机器人领域,推动机器人向更高级的通用人工智能迈进。未来,机器人将不再仅仅是面向工程师的可编程专用设备,而是能够根据任务自主编程运行的智能设备,普通用户也能够轻松使用。这种使用门槛的降低将极大地促进智能产业的发展,成为智能产业爆发的临界点。
综上所述,建设现代化产业体系是新时代的重要任务,而数字经济和机器人技术则是这一任务中的关键要素。通过发展数字经济和机器人技术,我们能够进一步提升国家的科技创新能力,推动产业转型升级,实现高质量发展的目标。
人形机器人作为人工智能与机器人技术融合的前沿领域,正日益成为科技创新和产业发展的焦点。
人形机器人作为智能机器人的一种重要形式,其研发、制造和应用水平直接反映了一个国家的科技创新实力和高端制造业水平。人形机器人不仅需要具备出色的运动能力和环境适应能力,还需要拥有强大的感知、认知和决策能力,使其能够更好地适应复杂的人类生活环境。
人工智能技术的不断进步为人形机器人的发展提供了强劲动力。机器学习、认知科学、自然语言理解和计算机视觉等技术的发展,使得人形机器人能够更加智能地感知和理解环境,更加自然地与人类进行交互。同时,这些技术也为人形机器人的自主学习和自主决策提供了基础,使其能够更好地适应不同的任务和环境。
人形机器人在未来的发展方向。随着人工智能技术的进一步成熟和应用门槛的降低,人形机器人将从面向工程师的可编程专用设备逐渐转变为普通用户可用的智能设备。这将为人形机器人的应用普及打开广阔的市场空间,使其在医疗、教育、养老、服务等领域发挥更大的作用。
人形机器人应用场景
人工智能技术的进步成为机器人产业进一步发展的关键驱动力。传统机器人已经走入成熟期,机器人产业整体正向着“智能化”高速迈进。凭借机器视觉、自然语言理解等人工智能技术的发展,初代“AI+”机器人产品逐步成熟,在特定领域形成已经形成规模应用,处于成长期。生成式AI的爆发与通用人工智能的曙光,为人形机器人与“具身智能”带来希望,二者仍将长时间处于培育期,等待通用人工智能来临。
人工智能技术的进步已成为带动机器人产业发展的关键驱动力。从产线自动化到机器智能再到人工智能。在产线自动化阶段,技术特点是事先程序设定控制,主要功能是替代重复劳动,应用场景包括标准化工业生产线和单一任务,产品形态为自动化生产设备。在机器智能阶段,技术特点是传感器感知环境信息,主要功能是根据环境变化调整自身行为,应用场景包括智能制造协作和公共服务,产品形态为机械臂和轮式机器人。在人工智能阶段,技术特点是深度学习和强化学习技术,主要功能是任务导向和自主处理复杂问题,应用场景为通用机器人全场景,产品形态为四足机器人和双足人形机器人。目前所处的阶段是AI大模型将是突破契机,发展阶段是人工智能。
人形机器人具有广泛的潜在应用领域,这些领域涵盖了经济发展和社会民生的各个方面。在经济发展领域,人形机器人可以应用于制造业,如装配、安装、焊接和巡检等岗位;在建筑业,可以进行测量、材料配送、钢筋加工、混凝土浇筑等工作;在能源业,可以用于能源基础设施建设、巡检、操作和维护等任务;在商贸物流领域,可以应用自动导引车、自主移动机器人、配送机器人等产品。在社会民生领域,人形机器人在商业社区、医疗健康、养老服务等方面也有广泛应用前景。具体来说,在商业社区中,可以用于餐饮、配送、迎宾、导览、咨询、清洁、代步等服务;在医疗健康领域,可以辅助进行手术、检验采样、消毒清洁等医疗活动;在养老服务中,可以提供残障辅助、助浴、康复训练、家务、情感融合、娱乐休闲和安防监控等服务;在教育领域,可以用于交互教学和竞赛等教育活动;在安全应急领域,可以应用于矿山、民爆、社会安全、应急救援和极限环境等场景。
经济发展领域
- 制造业:人形机器人在制造业中具有广泛的应用前景。它们可以用于执行重复性、危险或对精确度要求高的任务,如焊接、装配、喷涂、搬运和磨抛等。通过使用人形机器人,企业可以提高生产效率、降低成本,并改善工作环境的安全性。
- 农业:农业是另一个人形机器人可以发挥重要作用的领域。它们可以用于各种农业活动,如耕整地、育种育苗、播种、灌溉、植保、采摘、分选和巡检等。人形机器人可以帮助农民提高农作物产量、减少劳动力成本,并实现农业的可持续发展。
- 建筑:在建筑行业,人形机器人可以用于执行危险、繁重或需要高精度的任务,如测量、材料配送、钢筋加工、混凝土浇筑和构部件安装等。它们可以帮助建筑工人提高工作效率、减少事故风险,并改善建筑质量。
- 能源:能源行业是另一个人形机器人可以产生重大影响的领域。它们可以用于能源基础设施的建设、巡检、操作和维护等任务。人形机器人可以帮助能源企业提高运营效率、降低成本,并确保能源供应的安全性和可靠性。
社会民生领域
- 商业社区:人形机器人在商业社区中有广泛的应用潜力。它们可以用于提供各种服务,如餐饮、配送、迎宾、导览、咨询和清洁等。人形机器人可以帮助企业提高服务质量、降低运营成本,并增强客户体验。
- 医疗健康:医疗健康是另一个人形机器人可以产生积极影响的领域。它们可以用于辅助医疗活动,如手术、检验采样和消毒清洁等。人形机器人可以帮助医疗专业人员提高工作效率、减少人为错误,并改善患者的治疗效果。
- 养老服务:随着全球老龄化问题的加剧,养老服务变得越来越重要。人形机器人可以用于提供各种养老服务,如残障辅助、助浴、康复训练、家务和情感融合等。它们可以帮助老年人提高生活质量,减轻护理人员的工作负担,并降低养老成本。
- 教育:教育是人形机器人可以产生积极影响的另一个领域。它们可以用于交互教学和竞赛等教育活动。人形机器人可以帮助学生提高学习兴趣、增强学习效果,并为教师提供教学支持。
- 安全应急:在安全应急领域,人形机器人可以用于执行危险或高风险的任务,如矿山救援、民爆处理和社会安全等。它们可以帮助应急人员提高救援效率、减少人员伤亡,并确保公共安全。
人形机器人概述
人形机器人是多领域交叉技术的产物,主要由三大系统组成:感知系统、决策系统和执行系统。
感知系统
感知系统是人形机器人获取外界信息的途径,主要由各种传感器组成。其中,视觉传感器用于获取图像信息,如摄像头、激光雷达等;触觉传感器用于感知触碰和压力,如力/力矩传感器、声学传感器等。这些传感器收集到的信息为机器人的决策和执行提供基础。
决策系统
决策系统是人形机器人的大脑,负责处理和决策各种信息。它由芯片和算法组成。芯片是硬件基础,提供计算能力;算法是软件基础,用于处理和分析传感器收集到的信息,并做出相应的决策。
执行系统
执行系统是人形机器人的行动部分,由动力单元、旋转关节、线性关节和手部关节等组成。动力单元为机器人提供能量和动力;旋转关节和线性关节用于实现各种运动;手部关节则用于抓取和操作物体。
多领域交叉技术的应用
人形机器人的开发涉及机械、电气、人工智能等多个领域。机械设计用于构建机器人的物理结构;电气工程用于设计和控制机器人的电路和电机;人工智能技术则用于开发机器人的感知、决策和学习能力。
与机器人动力相关的公司,如特斯拉、波士顿动力、Agility Robotics、小米、小鹏、博实股份、优必选、智宇、宇树、达闼、追觅等。
机器人的感知系统,包括视觉、听觉、触觉等不同方面的传感器。视觉部分由摄像头、毫米波雷达、激光雷达等组成,这些部分涉及到的公司或技术有纯视觉、摄像头、毫米波雷达、激光雷达、超声波雷达等。触觉部分由力/力矩传感器、声学传感器、温度传感器等组成,这些部分涉及到的公司或技术有柯力、四方股份、昊志机电等。
决策系统是机器人的大脑,负责处理和决策各种信息。这部分涉及到的公司或技术有芯片、算法、深度学习等。
动力系统为机器人提供能量和动力,这部分涉及到的公司或技术有电池、驱动器、旋转执行器、线性关节、手部关节等。电池部分由宁德时代提供,驱动器部分由五洲新春、长盈精密提供,旋转执行器部分由步科股份提供,线性关节部分由鸣志电器提供,手部关节部分由伟创电气提供。
执行系统是机器人的四肢,负责执行各种动作。这部分涉及到的公司或技术有离合器、谐波、行星减速器、编码器等。离合器部分由三花智控提供,谐波部分由双环传动提供,行星减速器部分由新剑传动提供,编码器部分由鼎智科技提供。
人形机器人关键硬件
上面图图是人形机器人的详细构造图,展示了机器人的各个组成部分和相应的供应商。从图中可以看出,这个机器人具有复杂的结构和高度的精密性,它的设计和制造涉及到许多不同的技术和工艺。
首先,机器人的旋转执行器部分由14个供应商提供,包括步科股份、奥比中光、埃夫特、大族激光、苏州固锝、汉威科技、固高科技、汇川技术、雷赛智能、四联精密轴承、贝思特、恒拓高新传动、步科股份和埃夫特。这些执行器负责机器人的转动和移动,是机器人运动的关键部件。
其次,机器人的视觉部分由3D摄像头和MEMS IMU组成,这些组件由奥比中光、大族激光、苏州固锝、汉威科技提供。视觉系统使机器人能够感知和理解环境,进行精确的定位和导航。
此外,机器人的力觉部分由力矩传感器、行星减速机、线缆和连接件组成,这些组件由步科股份、埃夫特、雷赛智能、恒拓高新传动、汇川技术和鑫业盛等公司提供。力觉系统使机器人能够感知和响应外部力量,确保操作的安全和精准。
最后,机器人的控制部分由控制芯片和工业机器人控制器组成,这些组件由特斯拉、固高科技、汇川技术等公司提供。控制芯片和工业机器人控制器是机器人的大脑,负责控制和协调机器人的各个部分,确保机器人能够执行复杂的任务。
运动执行部件
不同关节位置,如何选择旋转or线性驱动器?
人形机器人的关节设计需权衡平衡性、动态运动控制、高负载等多方面因素。
①旋转驱动器:通常应用于高扭矩关节处,例如腕部、肩部、腰部、髋部关节转动幅度较大,对关节方 案提出了较高的扭矩要求,多使用旋转驱动器。
②直线驱动器:通常应用于旋转角度不大、高负载的位置,例如人形机器人双腿&双臂位置,采用直线 驱动器可以起到较好的支撑和承重效果。
直线驱动器: 人形机器人要求直线驱动器 具备良好的刚性表现和较高 负载能力、精密的线性运动 控制、柔顺连续的直线运动 性能。 人形机器人双足、双臂采用 连杆结构,连杆末端采用 “电机+丝杠”结构,无需搭 配减速器。 综合来看,滚柱丝杠&滚珠丝 杠是直线驱动器中丝杠的较 好选择,滚珠丝杠性价比较 高,未来有望在人形机器人 小负载位置。
旋转驱动器: 选用“电机+减速器”方案,电机 主要用于提供动力,减速器主要用 于放大扭矩。 基于不同选型思路,旋转驱动器主 要分为刚性、弹性和准直三种驱动 器方案:①刚性驱动器方案优势是 关节体积小、输出扭矩密度高,劣 势是透明度低,需搭载力/力矩传感 器;②弹性驱动器方案能提升关节 的柔顺性,但控制复杂、精度较低; ③准直驱驱动器方案优势是透明度 高,可采用电流环控制,柔顺性表 现好,劣势是扭矩密度低。
直线驱动器用于对运动旋转角度不大、高负载的场景,多用于四肢。直线驱动器多采取“电机+ 丝杠”,将旋转运动变为关节末端的直线运动,能够起到较好的支撑和承重效果,能够较好适配应 用场景的负载需求。 在双腿&双臂位置,直线驱动器通过电机与关节分离的方式,将双腿质心向上移动、双臂质心向 内移动,一方面提升提高整机质心,另一方面减轻四肢的运动惯量,从而提升整机的稳定性、提升 整机的运控表现。
旋转驱动器的选型原理与各方案比较?
旋转驱动器有望以“电机+减速器”方案为主。人形机器人实际工作场景中对输出扭矩密度要求较高, 只靠电机难以满足,减速器成为必选项;从驱动器分类来看,关节方案主要分为刚性、弹性和准直驱方 案。
①谐波减速器需求量最大,带动力传感器需求:谐波减速器减速密度高,Optimus中14个自由度均搭载 谐波减速器,国内人形机器人也广泛使用谐波减速器;在谐波方案中,由于力矩透明度较低,需搭载力 /力矩传感器共同使用;
②行星&类RV减速器或迎发展机会:出于经济性考虑,国内部分主机厂(优必选、傅利叶、智元等)在 大负载关节使用行星减速器;出于性能考虑,类RV减速器或将应用至高性能人形机器人(Optimus等) 的大负载关节。
人形机器人的关节设计需权衡平衡性、动态运动控制、高负载等多方面因素,通常混合使用旋转 执行器和线性执行器,以Optimus为例:
①旋转执行器,包括腕部、肩部、腰部、髋部4个位置,共 计有14个旋转自由度;
②线性执行器,包括腕部、肘部、踝部、髋部、膝部5个位置,共计有14个线 性自由度。
旋转驱动器主要应用于高扭矩关节处。腕部、肩部、腰部、髋部关节转动幅度较大,并对关节方 案提出了较高的扭矩要求,旋转执行器通过“电机+减速器”方案能够同时满足转动幅度、扭矩两方 面的需求,同时结合力矩传感器实现对末端的运动控制。
旋转驱动器总成选型思路
问题①:旋转驱动器为什么不选取单电机方案? (分布式电机合理性理由)
人形机器人旋转驱动器在实际应用中的扭矩要求较高,单电机方案无法满足需求。通过搭配减速 器的方式可以放大力臂,从而大幅提升输出扭矩,满足实际场景需求。
问题②:不同类别减速器的选型理由是什么? (差速控制精准性原因)
电机扭矩密度难以显著提升,所以电机输出扭矩越大,体积越大。在大扭矩电机情况下,可以搭 载低减速比减速器(行星等),此方案具备经济性优势;小扭矩电机情况下,搭载高减速比减速 器(谐波等),此方案具备小体积优势。
问题③:旋转驱动器是否必须搭配力矩传感器? (反馈控制闭环的必要性)
力矩透明度是决定是否加装力矩传感器的关键。高减速比减速器的力矩透明度低,需要加装力矩 传感器进行测量;低减速比减速器力矩透明度较高,可以使用电流环控制,加装力矩传感器不是 必选项。
问题④:不同旋转驱动器方案的优劣势对比?
基于不同选型思路,旋转驱动器主要分为刚性、弹性和准直三种驱动器方案。 刚性驱动器方案优 势是关节体积小、输出扭矩密度高,劣势是透明度低,需搭载力/力矩传感器;弹性驱动器方案 能提升关节的柔顺性,但控制复杂、精度较低;准直驱驱动器方案优势是透明度高,可采用电流 环控制,柔顺性表现好,劣势是扭矩密度低。
减速器能够显著提升关节输出扭矩
人形机器人旋转驱动器在实际应用中需要解决大扭矩问题,搭载减速器是必选项。在齿轮传动中, 啮合处的齿面作用力大小相等、方向相反,通过改变齿轮的半径可以改变输出扭矩。人形机器人要 求关节体积小,且在实际应用中面临大扭矩场景,单纯依靠电机难以实现。通常来看,减速器能够 显著提升扭矩输出值,适配相应高扭矩密度的应用场景。 目前提升扭矩密度主要通过两种方式:①提升电机输出扭矩密度,②提高减速器减速比。
电机提升扭矩密度的难度较高
从电机角度来看,提升扭矩密度主要可以通过三种方式:①采用外转子结构;②扩大电机半径; ③通过绕线结构提升电机功率密度。 增大半径能显著提升扭矩,但此方案对人形机器人关节而言不现实。提升电机半径可以直接提高 电机的输出扭矩数值,但是人形机器人对关节体积有要求(不能过大),所以难以通过大幅提升电 机半径来提高扭矩。
电机绕线方式能够在一定程度上影响电机扭矩密度。增加线圈匝数能提升功率密度,从而间接提 升电机扭矩密度。但是目前由于技术原因,在人形关节紧凑的空间中,电机绕线瓶颈难以突破。 相同体积下,外转子电机比内转子电机的输出扭矩更高。内转子电机线圈固定在外壳,主轴为转 子,通常极数少、转速快,转动惯量更小,扭矩小。外转子电机的线圈在内部,相对而言极数更多、 转速更慢,转动惯量更大,相同电流下输出的扭矩更大。无框力矩电机的扭矩密度较高,是人形机 器人关节电机的较优选择。
力矩透明度是决定是否加装力矩传感器的关键
大力矩输出密度和动态物理交互能力是足式机器人关节驱动器设计的关键因素,目前驱动器方案 主要分为刚性驱动器方案、弹性驱动器方案和准直驱驱动器方案。不同方案由于存在力矩透明度差 异,所以存在是否采用力/力矩传感器的区别。 谐波减速器减速比高,存在非线性摩擦力矩,力矩透明度低。仅依靠电流环进行关节末端的力反 馈难以进行建模,需要额外添加力矩传感器。 行星减速器减速比低,刚性强,非线性摩擦力可忽略不计,关节输出扭矩和电流之间呈较好的线 性关系,易于建模,可用电流环控制。
驱动器方案包括刚性、弹性和准直方案
【刚性驱动器方案】搭载大减速比减速器(例如谐波、RV减速器),优势是关节体积小、输出扭 矩密度高,劣势是透明度低,需搭载力/力矩传感器。
【弹性驱动器方案】通过串联或并联弹性体提升关节的柔顺性;弹性驱动方案控制复杂、精度较 低,在人形机器人中的应用具备较大潜力。
【准直驱驱动器方案】搭载小减速比减速器(例如行星、针摆减速器),优势是透明度高,可采 用电流环控制,柔顺性表现好,劣势是扭矩密度低。
刚性驱动器方案的技术发展最为成熟,在双足机器人领域中已经得到了成熟验证。 刚性驱动器优势:高减速比减速器克服了电机的扭矩输出限制,实现关节末端的高密度扭矩输出。 常规电机和谐波减速器的体积较小,有助于实现人形机器人关节的小体积化;在加装力传感器后, 能够实现高精度力控场景。
刚性驱动器劣势:①谐波/RV减速器相较于传统减速器,产品价格较高;②需额外加装力/力矩传 感器,对应单关节成本增加500-1000元。
准直驱方案更具经济性
准直驱方案能够满足高频动态响应和降低成本的需求,在MIT的四足机器人已有应用。 准直驱方案优势:采用刚性低减速比减速器,力矩透明度高,采用电流环实现力的闭环反馈控制。 不需要添加力传感器,整体成本更低,可实现高动态物理响应。 准直驱方案劣势:输出扭矩提升依靠电机扭矩密度提升。结构上采用大输出力矩、低转速的扁平 无框力矩电机,关节轴向长度小、径向长度大,并需要添加液冷装置进行散热。人形机器人关节对 体积和重量的要求限制电机的输出扭矩和行星减速器减速比,从而限制关节末端输出的扭矩密度。
特斯拉Optimus采取技术较为成熟度刚性驱动器方案,使用以谐波减速器(三花&绿的)为代表的 高减速比减速器,有助于保障Optimus关节更拟人化,同时相较于高动态响应,工业场景对于末端负 载的要求更高,现已成熟的刚性方案更有助于人形机器人在工业场景的落地。特斯拉Optimus关节处逐步添加离合器等弹性元件,有助于提升整体关节的安全性,使人形机器 人的动作更加柔顺。
RV减速器耐重载、抗冲击性更强,适用于较大载荷的作业场景。相较于谐波减速器,RV减速器 一方面具备更高的减速比,另一方面由于内部为刚性结构,所以呈现出抗冲击、大体积、大重量的 特点。一般来看,RV减速器在大负载工业机器人中的应用较多。 人形机器人部分关节载荷较大,有望应用类似RV减速器的产品。通常来看,人形机器人腰部、髋 部等位置受力较大,在搬运等负载场景中,谐波减速器不能匹配应用需求,未来有望使用类RV减速 器匹配相应场景。
国内主机厂采用谐波+行星减速器方案
和特斯拉不同,国内主机厂大多采用准直驱驱动方案。相比刚性驱动方案,准直驱关节采用电流 环控制,关节末端不使用力矩传感器,成本更低,动态响应能力更强。当下人形机器人即将迎来量产,关节驱动的技术路线尚未固化。硬件降本成为人形机器人产业化 的关键因素,准直驱方案具有成本优势。而针对工业场景应用,出于负载和关节体积之间的权衡, 准直驱方案的应用范围有望进一步扩大。因此我们认为,未来国内主机厂在驱动方案上更可能根据 关节特性不同而同时选择谐波和行星减速器方案。
直线驱动器总成选型思路
问题①:直线驱动器方案为什么选择“电机+丝杠”? 人形机器人直线驱动器的要求:良好的刚性表现和较高负载能力、精密的线性运动控制、柔顺连 续的直线运动性能。 人形机器人双足、双臂采用连杆结构,连杆末端采用“电机+丝杠”结构,能够满足刚性、载荷、 运动精度和连续性要求,且伺服电机能够满足直线运动的力矩、精度要求,所以无需搭配减速器。
问题②:滚柱or滚珠丝杠的选型理由及优劣势比较? 滚珠丝杠在部分关节处替代滚柱丝杠的可行性高,且能大幅降低成本。 可行性:滚珠丝杠产品成熟度较高、精度高、传动效率高,能够满足人形机器人需求,且在小臂、 小腿等负载较小的位置,滚珠丝杠负载能力能够满足相应负载要求。 必要性:人形机器人逐渐步入量产阶段的背景下,产品降本成为大势所趋;使用滚珠丝杠替代滚 柱丝杠能够降低约91%的产品成本,降本效果显著。
问题③:直线驱动器对自锁性能的要求? 由于直线驱动器需要配合实际场景频繁执行前进、后退运动,所以相较于自锁性能,直线驱动器 更需要丝杠具备运动可逆的性能。综合来看,滚柱&滚珠丝杠可以满足人形机器人的自锁需求。 在少数场景下,直线驱动器需要自锁功能,其实现方式主要包括:①使用本身具备自锁功能的T 型丝杠,但是T型丝杠存在精度差、传动效率低等劣势,其应用弊端显著;②使用滚柱&滚珠丝 杠,加装具备自锁功能的电机或设备,此方案在保留滚柱&滚珠丝杠优势的同时实现自锁功能。
“电机+丝杠”能良好适配直线驱动器需求
人形机器人直线驱动器对刚性、载荷、运动精度、运动连续性有较高要求。人形机器人双腿、双 臂采用连杆结构,并通过结构改型,有效减轻运动惯量,提升主机的运动稳定性。从实际场景出发, 连杆末端需要具备较高刚性、输出较大载荷,并需要具备运动的高精度和连续性, “电机+丝杠” 方案是最佳选择。此外,由于伺服电机能够满足直线运动的力矩、精度要求,所以无需搭配减速器。
人形机器人可选丝杠包括滚柱丝杠、滚珠丝杠和T型丝杠,综合来看滚柱丝杠具备高负载、高精 度的特点,综合性能表现最优;滚珠丝杠负载能力稍弱,但是精度较高,产品性价比较高;T型丝杠 虽具备较强经济性,但其运动精度较差。
线性传动方案采用丝杠实现精密控制
滚柱丝杠具备高负载、高精度的特点,在人形机器人直线驱动器中的应用优势显著。
①运动精度高,能实现连续、柔顺的直线运动:滚柱丝杠通过螺母、滚柱和丝杆之间的螺纹咬合, 能够实现高速旋转运动与低速直线运动之间的转换,以GSA的外径20mm滚柱丝杠为例,丝杠螺 距约为2.5mm,搭配目前主流伺服电机能够实现较精密的直线运动。
②负载能力强,能够适配实际应用场景:特斯拉Optimus提供了500N、3900N、8000N三款滚柱丝杠,具备较强的负载能力,能够适配人形机器人绝大多数的实际应用场景。
通用型人形机器人主要面向泛工业、泛生活场景,大重量搬运涉及关节自锁等场景占比不高,对 直线驱动器自锁性能的要求较低。直线驱动器主要可以通过丝杠自锁和电机自锁两种方式实现自锁功能。
①滚珠&滚柱丝杠:高精度、低摩擦,具备良好的刚度和稳定性,能实现灵活可逆的运动,能够 通过电机自锁的方式适配自锁场景,是直线驱动器丝杠的主要产品;
②T型丝杠:传动效率和导程精度低,具备良好的自锁性能,但难以满足直线驱动器的精度、寿 命、传动效率要求。
特斯拉Optimus下肢采用行星滚柱丝杠方案
Optimus下肢关节混合采用旋转和直线执行器,通过并联提升电机高度,将膝关节和踝关节的电 机分别上移至大腿和小腿上侧,减轻腿部惯量。Optimus首先面向工厂应用场景,运动稳定性与高负 载是首要的考虑因素,目前主要采用滚柱丝杠方案。
滚柱丝杠&滚珠丝杠均具备高精度、高传动效率的优势,能够通过加装制动装置实现自锁,均能 较好适配人形机器人下游需求。未来在人形机器人逐步量产的背景下,滚珠丝杠有望替代部分滚柱 丝杠,应用于小负载位置,降低整机成本。
空心杯/灵巧手关节
机器人中操作和动作决策的执行输出工具在机器人学领域被称之为末端执行器 (End-Effector)。末端执行器是机器人执行部件的统称,一般安装于机器人腕部 的末端,是直接执行任务的装置。末端执行器作为机器人与环境相互作用的最后 环节与执行部件,对提高机器人的柔性和易用性有着极为重要的作用,其性能的 优劣在很大程度上决定了整个机器人的工作性能。
末端执行器按其功能可以分为两大类,即:工具类和抓手类。工具类末端执行器 是根据具体工作需求专门设计并预留标准化接口的机器人专用工具,可以直接实 现具体的加工工种、生产工艺或日常动作;抓手类机器人末端执行器恰如人的双 手,担负着执行各种动作、抓持和操作的任务。
机器人多指灵巧手是一种高度灵活、复杂的末端执行器,因其能够模仿人手的各 种灵巧抓持和复杂操作能力,得到持续的研发投入和广泛关注。
20 世纪 90 年代,随着驱动元件体积减小与电气系统集成度的提高,灵巧手体积 迅速减小,并且在手指数目、自由度数、传感器的丰富程度等方面有所提高。这 一时期的灵巧手开始注重手掌的构型设计,以提高灵巧手的抓取能力,代表作品有 UB-II Hand、DLR-I Hand、DIST Hand 等。由于采用了新型的驱动器,DLR-I Hand 得以将驱动系统、电气系统以及传感器系统都集成在灵巧手内部,被认为 是当时世界上最复杂、集成度最高的灵巧手。
21 世纪以来,多指手进入了一个稳步提高的发展阶段,多指手的集成化、智能 化和灵巧操作水平得到了新的提升。由于实现了电气系统的完全集成化和数字 化,DLR-II 手与主处理器之间的连线数量从 DLR-I 手的 400 多条减少到 8 条。
从灵巧手设计层面来看,主要有全驱动和欠驱动两种。DOF 为手指关节的自由 度,DOA 为由驱动器控制的自由度。若 DOA 小于 DOF,则为欠驱动结构;若 DOA 等于 DOF,则为全驱动结构。
全驱动手的代表包括 Robonaut Hand、Shadow Hand、DLR Hand II 等,分别 使用了 14/20/12 个驱动器,通过对每个自由度的独立控制,达到对灵巧手出色 的掌控效果。但考虑到鲁棒性和功能性之间的取舍,欠驱动灵巧手成为更主流的 选择。其优势在于通过合理的结构设计以少于手指关节自由度的驱动器,从而降 低整只手的系统复杂度,同时提高可靠性。
从驱动源来看,目前灵巧手的驱动源包括电机、液压、气压、形状记忆合金等。从传动方式看,灵巧手的传动方式主要包括腱传动、连杆传动、齿轮/蜗轮蜗杆等。从结构形式来看,主要有外置式、内置式、混合置式。随着电机和控制电路的小 型化发展,除了某些全驱动/腱绳传动的灵巧手外,内置式已成为灵巧手设计的 发展趋势。其优点在于,通过将驱动、传动装置放置于灵巧手内部,可实现灵巧 手的模块化设计,有利于灵巧手与机器人本体的无缝切换。
欠驱动与全驱动:灵活度设计
从自由度与原动机数量上来看,可将其划分为欠驱动灵巧手和全驱动灵巧手。欠驱动灵巧手原动机的数量少于被控制的灵巧手自由度,没有驱动源的关节则是 进行耦合随动。全驱动灵巧手则是原动机数量与被控制灵巧手的自由度数量相等。
欠驱动灵巧手优点在于易于控制,但拟人性不强,稳定性有所欠缺。由于耦合关 节结构简单,所占空间小并具备可控性,如今大部分灵巧手都是欠驱动灵巧手。 相对于欠驱动灵巧手,全驱动灵巧手的手指更加灵活,省去了无驱动手指关节的 耦合机构,但由于驱动器增多,导致体积变大、安装困难并且灵巧手的控制变得 更加繁琐。
单关节双自由度实现
拇指:对掌运动是拇指的基本运动,通过对掌运动拇指可与其余 4 指接触形成 钳状,它是实现人手功能的基础。这说明,拇指的双自由度处于较为优先的位置。
手指:手指拥有两种运动形式,通过各指节旋转副的屈曲/前伸运动以及通过手 指末端球形副的侧摆运动。
要实现单个关节的双自由度运动,具有代表性的传动形式有三种:
(1)实现外展/内收和翘曲的两个轴正交,但却不是相互交叉的。它们在轴线位 置上有一定的距离,并且分别由单驱动器驱动,如 Salisbury 手。这种结构可 以使手指结构简单化,但降低了手指的灵活性,同时对驱动系统有更高的要求。
2)球/孔结构,如 Omni 手。这种结构可以使手指的运动具有更大灵活性和 适应性,也可以使手指的计算机控制简化。同时,它所具有的机械限位可以避免 手指产生过度的伸展。虽然这种结构有很好的紧凑性和灵活性,但结构复杂,增 加了手指的加工难度和成本。
(3)四个齿轮组成的差动结构。这种基关节的两个自由度通过 4 个相互啮合的 伞齿轮来实现。灵巧手基关节采用锥齿轮差动结构不但能够有效减小灵巧手的外 形尺寸,而且能够有效提高基关节的承载载荷。
通常情况下包含两个主动轮和两个从动轮。当主动轮同向转动时,实现基关节俯 仰方向的运动;当主动轮逆向运动时,实现基关节侧摆方向的运动。
动力源分类
按驱动方式,灵巧手动力源可分为电机驱动、气压驱动(气动)、液压驱动与形 状记忆合金驱动。
电机驱动是目前多指灵巧手的主要驱动方式,具有驱动力大,控制精度高、响应 快、模块化设计、易于更换维护等优点。
作为灵巧手典型代表的 Stanford/JPL 手、DLR 手和 NASA 手均采用电机作为 驱动源。体积小、输出力大的电机及集成驱动芯片的采用使电机、驱动电路板能 与手指机械本体融为一体,利于实现多指灵巧手手指的模块化控制。
综合比较驱动器类型,电机驱动的综合性能更好,具有标准化、稳定可靠、精度 高、响应快、驱控一体等优势,是目前技术成熟、应用广泛的一种驱动方式,为大多数灵巧手采用。
动力源位置及数量
按结构形式,灵巧手可分为驱动器外置式、驱动器内置式与驱动器混合置式。
早期的多指灵巧手一般将驱动器外置,主要是受驱动器结构尺寸影响,难以嵌入 手指内。外置式的典型代表 NASA 手和 Shadow 手,其突出的优点是灵巧手 的仿人化程度较高,灵巧手本体内没有需要布置的器件,可以缩减手本体的体积, 做到接近人手的外形,自由度的布置也很灵活。
同时也具有以下缺点:第一,驱动器与手本体之间空间距离较远,必须借助腱实 现两者的连接,不可避免地具有腱传动的相关弊病。第二,可维护性差。当某根 腱断裂时,必须进行灵巧手整体的拆卸,工作量大。
随着材料、工艺技术的发展,驱动器的尺寸逐渐减小,机器人多指灵巧手逐渐走 向驱动器内置式。内置式的多指灵巧手的出现,除能够有效地克服由于绳索驱动带来的缺点外,还具备下列优势:
1、由于驱动器集成在手指内部,因此集成度较高,简化手指同外部的软硬接口, 便于手指模块化设计;
2、高集成度带来的好处就是手指间互换性增强,便于维护和实际应用;
3、能够作为一个局部自主系统同任何机器人手臂通过标准接口相连。
动力源位置及数量的一般性规律:
1) 对于非电机驱动(如气压、液压),往往采用驱动器外置;对于电机驱动的 灵巧手,外置+腱绳传动普遍适用于驱动器数量较多的情况(如 10 个以上驱 动器);内置式则适用于 1-15 个电机的各类型灵巧手;
2) 6 电机方案是较为经典的一种配置类型。即拇指 2 个+其他手指各 1 个;
3) 在追求高自由度的情景下,可采用单手指 3 电机方案,在 4 指/5 指灵巧手 中分别使用 12/15 个电机。
电机与减速器选型
在现代灵巧手的发展过程中,电机驱动逐渐成为主流驱动方式。作为灵巧手典型 代表的 Stanford/JPL 手、DLR 手和 NASA 手均采用电机作为驱动源。体积小、 输出力大的电机及集成驱动芯片的采用,使电机、驱动电路板能与手指机械本体 融为一体,利于实现多指灵巧手手指的模块化控制。
从已有案例的电机选型来看,灵巧手用到的电机有直流无刷电机、无框力矩电机、 空心杯有刷电机、空心杯无刷电机。
从电机外形来看,灵巧手存在着两种方案:
1) 扁平电机,即直流无刷电机、无框力矩电机,普遍搭配谐波减速器,两者之 间可以轴心垂直,也可以平行放置,并通过传动带实现耦合;
2) 细长电机,即空心杯有刷电机和空心杯无刷电机,而空心杯有刷电机的电刷 又分为稀有金属电刷和石墨电刷。空心杯电机普遍搭配行星齿轮减速器。
模块化手指基关节的驱动器和传动系统中,两个内置位置传感器的盘式电机(型 号:EC-20flat)和谐波减速器并排横卧于手指后侧。手指单元的驱动器同样是 盘式电机,该电机横卧于第一关节内部、谐波减速器横卧于手指第三关节处,二 者之间通过同步带结构连接。
无框力矩电机
已有的灵巧手案例中,Dexhand、Spacehand 使用了同一款无框力矩电机 ——Robodrive ILM 25。在上述两款灵巧手中,无框力矩电机与传动比 100:1 的 谐波减速器 HFUC 8 结合,组成圆柱体驱动单元,提供 2.4Nm 的连续扭矩,峰 值高达 9Nm。
Dexhand 中,该驱动单元直径为 27 毫米、长度为 17.5 毫米、重 46 克;后续的 Spacehand 中,该驱动单元直径 27 毫米、长度 20 毫米、重量 50 克。
空心杯电机(有刷/无刷)
空心杯电机在灵巧手中得到广泛应用,已有的灵巧手案例中,Pisa//IIT SoftHand、Vincent Hand、Ilimb Ultra、IDLA hand 均使用了空心杯有刷电机, 而 RIC Arm 则使用了空心杯无刷电机。
空心杯电机分为有刷和无刷两种,有刷电机转子无铁芯,无刷电机(又称无刷无 齿槽电机)定子无铁芯。有刷空心杯电机利用碳刷(或者金属电刷)和换向器的 配合来完成换向,无刷空心杯电机没有这种物理结构,线圈导线直接连接到控制 器,通过处理连接板上的霍尔反馈的位置信号完成换向。
空心杯电机的优点包括:无齿槽效应(低速运行平稳、低振动、低噪音、转子可 控制在任意位置),结构紧凑(磁路设计更优、功率密度更高、温升低、效率高), 低电感(高动态响应、高加速度)。
传动
按灵巧手手指的传动方式可分为腱绳传动、连杆传动与齿轮传动。传动系统负责 把驱动器产生的动力以一定的方式传递到手指关节,从而使关节做相应的运动。 因此,传动系统的设计不仅决定了灵巧手的机械结构,而且直接影响到灵巧手的 抓取稳定性和灵活性。
腱传动
腱绳传动是指通过腱绳和缠绕腱绳的辅助装置把驱动源的力矩传送到手指各个 关节上的传动方式,由于传动腱绳具有较高的柔性以及较小的尺寸,使得腱绳传 动对驱动器和减速机构的结构尺寸要求较低,并且传动路线灵活多样,但也具有 以下缺点:难以对绳索结构进行预紧,并且所有的绳索都具备弹性,致使传感器 无法准确反应手指关节位置的信息,使精确控制难于实施。
腱驱动控制系统采用由微型伺服力矩电机、微型滚珠丝杠减速器和高强度碳氟纤 维腱组成的解决方案。
连杆传动
连杆传动是指灵巧手采用多个连杆串并联混合的形式传递运动和力矩,传递的刚 性比较强,手指具备较大的抓取力,并且结构比较紧凑,但连杆手指受连杆尺寸 以及传动误差的影响,不易实现远距离操作,抓取稳定范围较小。
连杆传动中的指尖、二指节、三指节均为不同形状的三角形连杆,驱动连杆以及 耦合连杆为直线形式,K1 以及 K2 为复位弹簧,当 K1 处的驱动连杆顺/逆时针 转动时,手指做屈曲/前伸运动。
齿轮传动
齿轮传动的优点是能进行精确传动,传递效率高、稳定性好。但也存在结构相对 复杂,使灵巧手的惯性增大、自重增大的缺点。且当灵巧手需要的手指较长时, 传递所需的相应齿轮数目也会增多,这极大限制了齿轮链传动结构的应用。
通过对以上几种主流灵巧手的驱动及传动方式的介绍可知,这些方法都已有较多 使用案例,其展现出的特性也各有不同,而且不同的驱动及传动方式,对灵巧手 的性能也有所制约和影响。
特斯拉灵巧手
特斯拉 Optimus 产品的灵巧手具有 6 个执行器,操作 5 根手指,其中拇指分配 2 个执行器,其他手指各分配 1 个执行器。手指执行器采用空心杯电机+蜗轮蜗 杆传动+腱传动。一方面,特斯拉 Optimus 采用了经典的六电机方案,在电机数 量有限的情况下最大程度上实现手指自由度;另一方面,蜗轮蜗杆的不可反驱动 特性使得灵巧手可以在抓握完成后实现无功耗保持。
Optimus 灵巧手属于欠驱动、电机驱动、线绳驱动的类型。单只灵巧手主要由 6 个空心杯关节(空心杯驱动器/执行器)驱动,大拇指三个自由度,相比其余手指多了一个内收外展的自由度,由两个执行器驱动,其余手指均为两个自由度,分别由一个执行器驱动。空心杯关节由空心杯电机+多级行星减速器+蜗轮蜗杆+位置传感器(双编)+驱动器+金属腱绳构成。Optimus 手指具有防反驱特性,可以避免电机在抓握物体时长时间堵转发热。
空心杯电机:一般采用无刷空心杯电机,电机定子线圈无铁芯,解决了传统铁芯电机因铁芯形成涡流而造成的电能损耗,线圈作为转子,转动惯量小、好控制、效率高、转速快。
多级行星减速器:一般空心杯电机均需搭配行星减速器使用,由于空心杯电机多呈现高速、低扭矩的特性,故为了在较小空间内获得较大的手指抓握力,一般都会集成2-3级的行星减速器。 蜗轮蜗杆:一级蜗轮蜗杆传动机构,手指电机输出端为蜗杆,带动蜗轮旋转。另一方面利用蜗轮蜗杆的自锁特性去提升灵巧手的负载(自锁)能力。 金属腱绳:金属腱绳(线)带动远端手指运动,蜗轮上有绕线轴,当电机转动时,绕线轴会转动通过卷线来实现手指运动。Optimus 之所以选择绳驱,原因在于一是考虑量产难易程度;二是相比连杆,绳驱可以消隙,手指的运动不会滞后。 传感器:输入端和输出端均配置位置传感器,采用双编方案,高速端做电机拖动FOC,低速端记录实际输出位置,用于反馈控制;Gen2 在手指末端增加了触觉传感器(阵列传感器),提升物体操作和环境感知能力,且从宣传视频中看,对比Gen1的手部结构,我们预计 Gen2 在手腕处增加了多维力传感器。
传感器部件
不同类型机器人所常用的传感器。从工业机器人到自动导引车,从移动机器人到协作机器人,每一种机器人都根据其特定的应用场景和功能需求,精心挑选了最适合的传感器组合。
例如,工业机器人通常配备有高分辨率的相机和力/力矩传感器,以确保在生产线上能够进行精确的装配和焊接工作。而自动导引车则更多地依赖于定位传感器,如激光雷达、雷达或GPS,以便在仓库或工厂中实现高效的货物运输。
移动机器人和协作机器人则需要更多的环境感知能力,因此它们常常配备有视觉传感器、激光雷达和触觉传感器等,以实现自主导航和安全的人机交互。无人机作为空中机器人的代表,则需要借助定位传感器、IMU、高度计和超声波传感器等,以确保在飞行过程中的稳定性和安全性。
机器人的感知过程分解为三个关键部分:内部传感器、外部传感器和其他传感器。内部传感器,如同机器人的内眼,包括位置传感器和角度传感器,它们负责探测机器人自身的位置和姿态,为机器人的运动和操作提供基础信息。
而外部传感器则赋予了机器人观察和理解周围环境的能力。视觉传感器,犹如机器人的双眼,通过捕捉图像或视频,使机器人能够识别和跟踪物体。接近传感器则像机器人的触手,通过测量距离和深度,帮助机器人避障和导航。触觉传感器和力觉传感器赋予了机器人触感,使它们能够感知力的大小和方向,从而实现更精细的操作。
此外,陀螺仪和GPS传感器作为其他传感器的代表,进一步扩展了机器人的感知能力。陀螺仪帮助机器人感知自身的姿态和角速度,而GPS则提供了机器人在地球上的精确位置,为导航和路径规划铺平了道路。
视觉
工业机器人的视觉对其移动、操作有着重要决定作用,机器人手眼系统在工 业领域有着广泛应用。根据成像单元安装方式不同,机器人手眼系统分为两类: 固定成像单元眼看手系统(Eye-to-Hand)和随动成像单元眼在手系统(Eyein-HandorHand-Eye)。眼看手系统是将视觉成像单元安装在本体之外的固定位 置,不随机器人移动的一种系统,具有视线全面、控制简单、抗震性能好、姿态 估计稳定等优点,但也存在分辨率低、容易产生遮挡问题等缺点。眼在手系统顾 名思义即为视觉成像单元安装在机器人手臂末端的系统,摄像头随机器人一同移 动,尽管会产生机械臂遮挡成像的问题,但有着空间分辨率高、有效克服标定误差等优点。有些场合也会采用两者混用的协同模式,通过眼看手系统负责定位, 用眼在手系统负责定向和高精度操作。 除了根据位置进行分类,不同的原理也衍生出了不同的方案。3D 视觉是机 器人感知的最先进、最重要的方法,可以分为光学和非光学成像方法。目前应用 最多的方法是光学方法,包括:飞行时间法、结构光法、激光扫描法、莫尔条纹 法、激光散斑法、干涉法、照相测量法、激光跟踪法、从运动获得形状、从阴影 获得形状,以及其他的 ShapefromX 等。 飞行时间法(TOF)主要利用信号在两个被反射面之间往返的飞行时间来测 量节点间的距离,精度为厘米级,原理简单,模块体积小,测量距离范围较大, 抗干扰能力较强。直接 TOF(D-TOF)是探测器系统在发射光脉冲的同时启动探 测接收单元进行计时,当探测器接收到目标发出的光回波时,探测器直接存储往 返时间,通过光飞行时间测算目标距离,常用于单点测距系统。为了实现面积范 围 3D 成像,通常需要采用扫描技术,无扫描 TOF 三维成像技术直到近几年才实 现。间接 TOF(I-TOF)方案中,时间往返行程是从光强度的时间选通测量中间 接外推获得的,不需要精确的计时,而是采用时间选通光子计数器或电荷积分器, 它们可以在像素级实现。I-TOF 是目前基于 TOF 相机的电子和光混合器的商用化 解决方案。 结构光投影三维成像目前是机器人 3D 视觉感知的主要方式。结构光成像系 统是由若干个投影仪和相机组成,常用的结构形式有:单投影仪-单相机、单投 影仪-双相机、单投影仪-多相机、单相机-双投影仪和单相机-多投影仪等。结构 光投影三维成像的基本工作原理是:通过投影仪向目标物体投射具有特殊结构的 图案(如离散光斑、条纹光、编码结构光等),使用另一个相机去观察在三维物 理表面成像的畸变情况,再通过图像处理和视觉模型求出目标物体的三维信息。 根据结构光投影次数划分,结构光投影三维成像可以分成单次投影 3D 和多次投 影 3D 方法。
立体视觉字面意思是用一只眼睛或两只眼睛感知三维结构,一般情况下是指 从不同的视点获取两幅或多幅图像重构目标物体 3D 结构或深度信息。目前立体 视觉 3D 可以通过单目视觉、双目视觉、多(目)视觉、光场 3D 成像(电子复 眼或阵列相机)实现。 单目视觉深度感知线索通常有:透视、焦距差异、多视觉成像、覆盖、阴影、 运动视差等。在机器人视觉里还可以用镜像,以及其他 shapefromX 等方法实现。 双目视觉深度感知视觉线索有:眼睛的收敛位置和双目视差。在机器视觉里利用 两个相机从两个视点对同一个目标场景获取两个视点图像,再计算两个视点图像 中同名点的视差获得目标场景的 3D 深度信息。典型的双目立体视觉计算过程包 含下面四个步骤:图像畸变矫正、立体图像对校正、图像配准和三角法重投影视 差图计算。
多(目)视觉成像,也称多视点立体成像,用单个或多个相机从多个视点获 取同一个目标场景的多幅图像,重构目标场景的三维信息。多视点立体成像主要 用于下列几种场景:1)使用多个相机从不同视点,获取同一个目标场景多幅图 像,然后基于特征的立体重构等算法求取场景深度和空间结构信息;2)从运动 恢复形状的技术。使用同一相机在其内参数不变的条件下,从不同视点获取多幅 图像,重构目标场景的三维信息。该技术常用于跟踪目标场景中大量的控制点, 连续恢复场景的 3D 结构信息、相机的姿态和位置。 光场 3D 成像的原理与传统相机成像原理在结构原理上有所差异,传统相机 成像是光线穿过镜头在后续的成像平面上直接成像,一般是 2D 图像。光场相机 的优点是:单个相机可以进行 3D 成像,横向和深度方向的空间分辨率可以达到 20μm到mm量级,景深比普通相机大好几倍,比较适合 Eye-in-Hand 系统 3D测量与引导,但目前精度适中的商业化光场相机价格昂贵。
特斯拉 Optimus 机器人的 3D 传感模块以多目视觉为主,头部使用三颗 Autopilot 摄像头作为感知系统:Left/RightPillarCamera 左肩/右肩摄像头,和 FisheyeCamera 中央鱼眼摄像头,提供大于 180 度体前场景覆盖。在采集信息 后,通过强大的神经网络处理和识别不同任务,依靠其胸腔内部搭载的 FSD 全套 计算机完成。
优必选 WALKERX 采用基于多目视觉传感器的三维立体视觉定位,采用 Coarse-to-fine 的多层规划算法,第一视角实景 AR 导航交互及 2.5D 立体避障 技术,实现动态场景下全局最优路径自主导航。WALKER 应用视觉 SLAM 算法, 视觉定位技术已经达到商用水平。
小米发布的 CyberOne 机器人所搭载的 Mi-Sense 深度视觉模组是由小米设 计,欧菲光协同开发完成。而据欧菲光公开的资料,其机器视觉深度相机模块主 要由 iToF 模组、RGB 模组、可选的 IMU 模块组成,产品在测量范围内精度高达 1%,应用场景十分广泛,可通过第三方实验室 IEC60825-1 认证,满足激光安 全 Class1 标准。结合 AI 交互算法,Mi-Sense 深度视觉模组使其不仅拥有完整 的三维空间感知能力,更能够实现人物身份识别、手势识别、表情识别, CyberOne 做到不仅看得到也能看得懂。
波士顿动力的 Atlas 头部有两个摄像头,一个是彩色相机,另一个则是 TOF 深度相机。Atlas 使用 TOF 深度相机以每秒 15 帧的速度生成环境的点云,点云 是测距的大规模集合。Atlas 的感知软件使用一种名为多平面分割的算法从点云中提取平面。多平面分割算法的输入馈入到一个映射系统中,该系统为 Atlas 通 过相机看到的各种不同对象构建模型,Atlas 再基于它构建的模型来规划路径。
触觉
机器人通过力控制系统获得“触觉”
力控制系统给予机器人以“触觉”。对应于人的触觉,机器人的触觉传感系统就是一种可以通过接触 来测量物体给定属性的装置或系统。一般来说,机器人的触觉感知与在预定区域内的力的测量有关。为 了改进机器人的应用效果,也应当为机器人配备先进的触觉感知系统,以使其能够感知周围环境,远离 潜在的破坏性影响,并为后续任务(如手部操作)提供有效信息。 以力传感器为核心的力/位控制是机器人主要控制方式之一。力控制一般泛指机器人应用领域中,利用 力传感器作为反馈装置,将力反馈信号与位置控制(或速度控制)输入信号相结合,通过相关的力/位混 合算法,实现的力/位混合控制技术。也称力/位混合控制技术,简称力控制。
力传感器是精准直接力控最佳解决方案
➢ 直接力控通过不同的力反馈方式实现,其中使用多维力矩/力传感器是最佳方案。
a. 电流环:通过电流反馈和辨识的动力学模型估计外力,适用于直驱电机或者带小减速比的应用场景,如小型阻抗控制的人机交互的机械臂和小型四足等。对于大减速比的机器人,其关节back-drive的摩擦力巨大, 电机电流不足以精确估计末端执行器上收到的外力。优势是无需额外的传感器,缺点是受摩擦力影响导致的力控精度差,适用场景有限。
b. 弹性体——抗外界冲击性能强: SEA(串联弹性驱动器)用弹性的形变和高精度的位置传感器来间接地测量力距的大小,往往适用于人型机器人集成度较高和驱动器输出力矩要求较高的应用场合。
c. 力传感器:通过在机械臂末端加装一个力传感器来实现。相对于一维力传感器,六维力传感器的力控维度更多,能够测量物体在三维空间内所有受力情况,可测量在任何方向、任何轴上的应用负载,并能承受额定测量范围5到20倍的过载,精度甚至可达0.01N,相应的价格也更贵。典型应用案例包括KUKA LBR iiwa机械手等机械臂及特斯拉Optimus人形机器人。
机器人力控方式不断演进 - 从位置控制到力/位混合控制
传统位置控制引起的瞬间过载易损害机器人。位置控制下,机器人严格按照预先设定的位置轨迹进行 运动。若机器人运动过程中遭遇到了障碍物的阻拦,导致位置追踪误差变大,此时机器人会努力地“出 力”去追踪预设轨迹,最终导致了机器人与障碍物之间产生巨大的内力,从而伤害零件或机器人。
柔顺控制提高机器人在复杂场景下对接触环境顺从的能力。传统的位置控制技术无法满足柔性装配或 不均匀复杂曲面打磨等任务的需求。由于空间不一致性造成的位置偏差可能引发系统超载和损坏,因此 必须引入力矩/力控制作为输出或反馈,实现更精细的控制,提高机器人对外界环境中的力的顺从或控制 能力就是提高机器人的柔顺性。 机器人的柔顺性来自对位置和力的综合控制。柔顺控制分为被动柔顺和主动柔顺,被动柔顺是对外部 作用力的顺从,而主动柔顺是对外部作用力的控制,从而解决与外界环境的交互问题。
柔性触觉传感器:助力机器人感知能力再上一层楼
“电子皮肤”的应用有望赋予机器人更丰富的触觉,进一步升级其感知能力。人体皮肤中分布着众多由不同类型的神经元组成的感受器,其中默克尔细胞和鲁菲尼小体主要感受持续的低频压力,二触觉传感器正是对人体这两个触感受器的模仿。触觉传感器的原理是将触觉刺激转换为电信号,为机器人感知提供压力、 温度、等信息;而电子皮肤则是由点状的触觉传感器组合构成,多被排列成矩阵。同时,由于电子皮肤由柔 性材料制备而成,具备高柔韧性、拓展性、高弹性等特点,因此又称柔性触觉传感器。
➢ 柔性触觉传感器有望集成更强的信息收集能力。六维力传感器通常仅能反映机器人关节(单点)受力情 况,而分布于肢端、表皮的柔性传感器可以收集更为丰富的信息,以帮助机器人完成精细动作。目前, 柔性触觉传感器主要仅能够感受压力,未来有望收集粗糙度、温度等其它物理量,具备真正意义的触觉。
➢ 柔性触觉传感器的结构主要分为外层的基底材料和内层的敏感材料。基底材料通常采用PET、PDMS等高 柔性、高拓展性的材料制成;而敏感层材料通常包括有机聚合物、碳纳米管、石墨烯等。
对于人形机器人,除了手指、肢端等需要高灵敏度的部位外,四肢、前胸、后背等外露的部位也期望进行全面覆盖以实现类似人类的触觉感知。
➢ 机器人灵巧手:机械手注重手的驱动控制,对电子皮肤和相关柔性传感器的需求较高,是灵巧手领域催生的主要新硬件,清华大学研究团队研发的新型多功能电子皮肤仅采用4个分布式压热传感单元就实现了大覆面电子皮肤的力感知与接触位置感知,而且其还集成了温度传感和接近感知功能,可实现人机碰撞前的安全预警和防控,保障人机交互安全。
➢ 机器人领域为柔性触觉传感器市场增长的主要驱动力。根据QYResearch数据,2022年全球柔性触觉传感 器约15.3亿美元市场,预计2029年全球柔性触觉传感器市场规模将达到53.2亿美元,2022-2029CAGR为 17.9%,机器人领域需求为市场增长的主要驱动力。
定位
IMU在人形机器人中发挥的作用主要体现在精确的姿态控制和平衡维持、导航和定位、动作执行和路径规划3 个方面,具体看其应用方向在于惯性导航和测量稳控。
➢ 姿态控制和平衡:惯性稳控是通过连续监测系统姿态与位置变化,利用伺服机构动态调整系统姿态,帮助机 器人维持稳定的姿态和平衡。人形机器人在执行各种动作中,需要精确地控制机体姿态和平衡。 ➢ 导航和定位:通过对角速率和线加速度按时间积分以及叠加运算,可以动态确定自身位置变化,其优势在于 不借助外源信息,可以独立使用。同时IMU可以与卫星定位结合,提供准确的室内和室外定位信息,人形机 器人在复杂环境中导航和定位的能力大大提升。
➢ 动作执行和路径规划:基于IMU的测量数据,人形机器人可以更精确地执行各种动作,如行走、转弯、跳跃 等。此外,IMU数据还可以用于路径规划,帮助机器人避开障碍物,规划出更合理的运动轨迹。
何为惯性传感器和IMU?
惯性技术广泛应用于海、陆、空、天各种载体的导航、定位与控制。而惯性传感器是将物体运动的加速 度、位置和姿态转换为电信号的器件,主要包括加速度计、陀螺仪和惯性测量单元(IMU)。
惯性测量单元(Inertial measurement unit,简称 IMU), 是测量物体三轴姿态角(或角速率)及加速度 的装置。一个IMU模组通常包含三个轴向的陀螺和三个轴向的加速度计(或增加三个轴向的磁力计),甚至 包含磁力计、GPS等辅助单元以完成更复杂的测量。
➢ 构成:IMU模组通常包括一个速度传感器(加速度计)和一个角速度传感器(陀螺仪)。加速度计用于 测量物体的线性加速度,而陀螺仪则用于测量物体的角速度。
➢ 重要性:单独使用MEMS加速度计的测量结果会受到运动加速度的影响,使倾角测量不够准确,所以通 常需利用 MEMS 陀螺仪和磁传感器补偿。同理,单独使用陀螺仪亦无法准确判断设备的姿态。因此需要 确认运动状态的设备通常组合使用三轴加速度计、三轴陀螺仪和三轴磁传感器,即为六轴IMU或九轴IMU。
惯性传感器有望成为机器人标配。惯性传感器又称惯性测量单元(IMU:Inertial Measurement Unit)在机 器人上可以与摄像头、力传感器等多传感器数据融合,以达到维持身体平衡,预测速度和轨迹并进行定位导航等功能,在四足机器人、人形机器人上均有望标配。惯性传感器技术壁垒高,目前单个高精度IMU售价约为几千元至万元,价值量较高,国内已有公司掌握核心技术并实现稳定量产。
MEMS(Micro-Electro-Mechanical System)微电机系统技术被广泛用于IMU及传感器的制造过程中。 MEMS可利用大规模集成电路制造技术和微加工技术,把微传感器、微执行器、微结构、信号处理与控制 电路、电源以及通信接口等集成在一片或者多片芯片上。
➢ MEMS传感器在人形机器人的适应性较高。通过MEMS技术制成的传感器具有体积小、重量轻、成本 低、功耗低、可靠性高、适于批量化生产、易于集成和智能化等优点。随着机器人感知功能的提升, 所需求的传感器数量势必增加,对于小体积、轻重量、低成本的诉求十分强烈。
➢ MEMS技术助力传感器实现高度集成化。通过MEMS技术,可以在同一衬底上集成多种敏感元件,使 其能同时检测多种物理量并能输出多个信号,提高MEMS芯片的集成度。
根据下游应用场景不同,对惯性传感器的精度要求亦不相同,通常其精度与制造成本和售价呈正相关。 我们认为由于智能驾驶、机器人、人机交互等新兴应用领域对惯性传感器需求的增加,传统的分类可能无 法准确划分下游应用领域,仅可作为参考。 ➢ 消费级:普通的消费级电子产品所使用到的IMU 都是低精度且十分廉价的IMU,对精度要求较低,普 遍应用于手机、运动手表等消费电子产品中,通常售价在几十元至几百元级别。
➢ 战术级:战术级IMU的精度高于消费级,广泛应用于高端工业领域、车辆控制、无人机等领域。制造 成本相对可控,售价通常在几百至几千元不等,可用于智能驾驶领域。
➢ 导航级:精确度极高,主要用于无人系统和航空领域。根据其参数和下游应用不同,售价波动较大。
➢ 战略级:主要用于航天工业、航海等尖端领域,通常体积较大,且价格极为昂贵。
能源动力部件
机器人的电池主要有镍氢电池、锂电池、铅酸蓄电池三类。其中,镍氢电池主要用于成本 控制严格,不需要大容量和大电流放电、安全性要求较高的玩具机器人、扫地机器人等领域。 铅酸蓄电池技术较锂电池更为成熟,但由于比较笨重,移动不方便,基本用于不需要移动的机 器人领域,由于污染较为严重,正在逐渐被锂电池取代。 锂电池主要应用于智能服务机器人、娱乐经纪机器人、探险排爆等特种用途机器人领域。 一般,对于成本不敏感的机器人,切要求电池较轻、可提供大电流放电、保障长使用寿命的机 器人一般会选择聚合物锂电池,如竞技机器人、特种机器人。 磷酸铁锂在不需要电池大电流放电、低温性能的 AI 服务机器人、工业较大型机器人领域应 用较多。三元锂电池相比聚合物电池成本更低,且能量密度较磷酸铁锂电池更大,在机器人领 域应用较为广泛,尤其是 18650 锂电池。
除了最基本的供电功能之外,人形机器人还要考虑到电池的配重问题,保证身体的平衡。 以 48 千克的本田 ASIMO 机器人为例,其电池重量约为 6kg,约为体重的 1/8 左右,优必选 Walker X 机器人的电池重量约为 3.6kg,约为体重的 5.7%。 但前文提到,目前的几款知名人形机器人主要停留在展示和实验阶段,因此电池做到月清 凉越好。而根据我们的产业链调研,若要实现大规模商业化,其带电量和续航可能有更高的要 求,相对应地,一般电池重量应占到人形机器人重量的 1/3 左右。根据 OFweek 锂电网,目前 磷酸铁锂电池的能量密度一般为 150Wh/kg,三元电池的能密度约为 200Wh/kg。假设特斯拉 人形机器人体重 68kg,电池重量占比 1/3 计算,则其锂电池重量约为 22.7 千克,若采用三元 锂电池,则带电量约为 4.54kWh,续航时长在 3.54-9.08 小时,若采用磷酸铁锂电池,带电 量约为 3.41kWh,续航时间在 3.41-6.81 小时。
此外,由于目前所有的人形机器人都是直流驱动,用 48V、24V、12V 的总线 将电机、控制器串起来,通过电源分配器分配电流,因此,还要考虑电池的动态管 理问题。有些人形机器人由于没有刹车,在电量耗尽的时候会倒下,因此当电量快 要耗尽的时候需要预留一些余电在其中,以供机器人回到原位。
控制器部件
控制器是人形机器人的大脑和小脑,是产业发展核心基础。控制器相比执行器更为“无形”, 但对机器人本体的表现起到至关重要的作用,且在长期的发展迭代可能成为拉开距离的关 键点,是各家人形机器人公司的核心技术。整体控制器框架通常包括感知、语音交互、运 动控制等层面。其中,运动控制器重要且复杂,如果机器人在不平坦地面和不确定的外部 环境中进行动态运动,运动控制器需要实时调整其计划和轨迹,并协调双足和全身肢体的 状态。同时,控制器也是政策层面重点支持的环节,在今年工信部发布的两大人形机器人 重磅政策中,“运动控制”均放在关键位置。
人形机器人相比其他成熟产业,控制器原理殊途同归,但在具体结构和要求存在区别。① 工 业机器人:控制器用于控制机械臂运行轨迹、空间位置,相比人形对控制精度、工艺理解 要求更高;② 扫地机器人:控制器主要用来规划路径,避障,以及人机交互,这是人形机 器人控制器的功能之一,此外人形机器人所需的算法实时性要求、控制器处理能力更高;③ 汽车域控制器:通常分为动力域、底盘域、座舱域、自动驾驶域和车身域,其中自动驾 驶汽车域控制器和人形机器人的控制器的控制原理类似,需要多传感器融合、定位、路径 规划、决策控制、图像识别、高速通讯、数据处理的能力;但是汽车和人形机器人在安全 性、控制精度、算法要求、接口复杂程度不同。
特斯拉可将汽车的 FSD 技术运用于 Optimus。特斯拉工程师团队表示,从机器人概念到 设计,再到生产和验证的全过程,他们均使用车辆设计作为基础。马斯克曾说“汽车是四 的轮子的机器人,而 Optimus 则可以看作是一个有四肢的机器人”。1)人形机器人的外 部环境更复杂,更需要依赖神经网络解决路径规划和执行问题,FSD 系统若整合到人形机 器人系统中,端到端解决方案有望显著提升人形机器人的视觉感知水平和运动规划、控制 能力;2)人形机器人的算力要求高,Dojo 超算系统可为其提供支持。
工控领域:控制器发展成熟,国产替代潜力巨大。运动控制系统是机械设备的核心部件, 上百年发展至今形成多种技术路线并存的格局,如数控系统(CNC)、通用控制器(GMC)、 可编程逻辑控制器(PLC)、专用控制器等,分别适用于不同下游场景。运动控制器的国 产化率低,技术瓶颈在于硬件(芯片)、软件算法、定制设计和集成等。高端运动控制器、 PLC 和数控系统 CNC 均有具有的国产替代空间。
控制器面临新应用场景、政策重点支持、国产替代等多重发展机遇。由于人形机器人尚未 实现产业化落地,因此尚未出现批量供应相关控制器的公司;但控制器作为工业及消费领 域自动化设备的“大脑”,控制框架和原理同源,在控制器领域长期深耕的优质公司将在 新的产业浪潮中具备明显的先发优势。
参考:
1.中泰证券:《人形机器人产业系列报告》
2.华宝证券:《拆解人形机器人结构,寻找高价值量细分领域》
3.甲子光年智库:《闵行智能机器人产业发展白皮书》
4.光大证券:《人形机器人金属材料行业深度报告》
5.太平洋证券:《人形机器人行业深度报告》
开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!
更多推荐
所有评论(0)