本发明涉及一种基于元动作空间的人形机器人线束操作大模型训练,该方法包括:基于人类线束操作构建线束操作元动作;构建线束操作元动作数据集;基于所述的线束操作元动作数据集,利用强化学习训练人形机器人线束操作大模型;获取输入数据,利用训练好的人形机器人线束操作大模型输出关节电机参数并基于所述的关节电机参数实时更新输入数据;获取基础策略,并基于所述的基础策略获取残余策略;基于所述的基础策略和残余策略进行人形机器人线束操作。与现有技术相比,本发明提高了模型对复杂线束操作任务的理解与执行,解决了线束操作训练数据匮乏的问题。
同济大学
何斌 | 郭朝晨 | 朱忠攀 | 宋越 | 王志鹏 | 周艳敏
More Posts
“规则的天空”:中国低空空域管理与安全体系演进趋势研究
2025年11月10日

新闻资讯 | 海外项目路演推介会暨乐清市科学技术局-国家技术转移东部中心产学研项目对接会成功举办
2023年11月24日