加急见刊

一种动态环境下空间机器人的快速路径规划方法

胡晓东; 黄学祥; 胡天健; 王峰林; 梁书立 北京跟踪与通信技术研究所; 北京100094

摘要:针对动态环境下空间机器人采用深度强化学习进行路径规划时存在的收敛速度慢问题,采用迁移学习算法设计了一种适应动态环境的快速路径规划器.首先,综合考虑空间机器人运动过程中存在的避障、时间和扰动约束,在静态环境下对深度神经网络进行预训练.其次,将上述训练后的权值作为动态环境下深度神经网络的初始权值,再经过动态环境下的训练进行参数微调.最后,以平面五自由度空间机器人为例对所设计的方法进行了验证,并与直接训练方法进行了比较.实验结果表明,该方法能够将训练收敛时间从1033回合缩短到450回合,在保证规划路径准确率的前提下,提高训练的收敛速度.

注: 保护知识产权,如需阅读全文请联系空间控制技术与应用杂志社