答辩博士:孙涛
指导教师:戴振东,Poramate Manoonpong 教授/博导
论文题目:四足机器人自组织运动的神经网络自适应控制
答辩委员会名单:
职务 | 姓名 | 职称 | 导师类别 | 工作单位 |
答辩主席 | 宋爱国 | 教授 | 博导 | 东南大学 |
答辩委员 | 宋胜利 | 教授 | 博导 | 陆军工程大学 |
答辩委员 | 徐胜元 | 教授 | 博导 | 南京理工大学 |
答辩委员 | 骆敏舟 | 教授 | 博导 | 河海大学 |
答辩委员 | 陈柏 | 教授 | 博导 | 南京航空航天大学 |
答辩委员 | 吉爱红 | 研究员 | 博导 | 南京航空航天大学 |
答辩委员 | 戴振东 | 教授 | 博导 | 南京航空航天大学 |
答辩秘书:段晋军 讲师/硕导
答辩时间:2021-4-28 下午2:00
答辩地点:南航明故宫校区12#517
学位论文简介:
动物运动具有环境适应性、结构适应性和灵活性,这吸引了众多研究者的兴趣。研究表明,动物的运动行为是动物的神经系统、肌肉-骨骼系统和环境三者相互作用的结果。该相互作用过程具有自组织性,伴随着动物肢体运动从无序不协调到有序协调的收敛过程。然而动物实现肢体运动协调的具体机制尚不清楚,多种神经调控机制(如,中枢模式发生器(Central pattern generator,CPG),反射机制,感知反馈和运动学习等)在实现肢体运动协调中的协同作用方式有待深入研究。足式机器人为动物自组织的研究提供了科学的方法。足式机器人自组织运动控制的研究可以系统、灵活地探究自组织运动中各要素之间的相互作用,提出神经调控机制的可能的协同作用方式,不仅有助于对生物学和神经生理学关于动物运动机理研究结论的检验,而且有助于人们以系统论的角度理解动物自组织运动机理。
当前,仿生四足机器人自组织运动控制主要由分布式非耦合/弱耦合CPG 和运动地面反力GRF(Ground reaction force) 反馈实现。利用GRF 调节分布式非耦合CPG 的相位,使CPG控制下的四足机器人自动形成适应性的肢体运动协调。GRF调节CPG相位的方式主要由两种,相位微调和相位重置,但是这两种机制在非耦合CPG相位调节和形成自组织运动中的特点还不清楚。此外,基于非耦合CPG和GRF反馈控制的四足机器人自组织运动形成的基本条件尚未得到清晰地阐述,自组织运动中GRF 的形成原因尚不可知。现有的GRF反馈调控非耦合CPG的方式需要人为设定GRF反馈的增益,否则无法保证CPG相位收敛,这种方式限制了机器人自组织运动的适用性。同时,仅依靠GRF 在分布式CPG 之间建立的相位协调方式(CPG 物理通信(APC)) 的可靠性差,导致机器人自组织运动的鲁棒性和记忆性差,并且CPG输出的控制指令的偏置无适应性,导致机器人无法适应不同的地形。
针对以上四足机器人自组织运动控制中存在的问题,本论文开展了以下几个方面的工作:
(1) 研制了小型四足机器人Lilibot。相比已有的仿生四足机器人,该机器人尺寸小、重量轻、本体感知反馈丰富和腿部构型灵活,为四足机器人自组织运动及其控制研究提供了安全便捷的实验平台。
(2) 将相位调节原理构建到分布式非耦合特定正交组中枢模式发生器SO(2) CPG (Special orthogonal group CPG) 模型中,创建了非耦合SO(2) CPG 的两种适应性肢体运动协调方法: 相位微调PM (Phase modulation) 和相位重置PR (Phase resetting) 的模型。对比研究了两种方法在四足机器人自组织运动形成中的特点,发现了两种方法的最优参数和对不同工况的选择适应性。
(3) 分析基于PM 方法的四足机器人自组织运动形成过程,总结了四足机器人自组织形成的三个基本条件;通过非耦合SO(2) CPG 和机器人动力学建模和分析,揭示了四足机器人自组织运动中GRF 形成的原因。
(4) 利用双速率学习DL (Dual-rate learner) 算法自动生成PM 的感知反馈增益因子,实现了非耦合SO(2) CPG 的适应性物理通信(APC),提高了四足机器人自组织运动的形成速度和适应性。
(5) 利用自动相位锁合技术将基于APC 的四足机器人自组织运动模式转化为适应性CPG 神经连接,实现适应性CPG 神经通信(ANC)。综合利用APC 和ANC 两种CPG 通信机制设计了一种新型神经网络自适应控制,使四足机器人自组织运动具有鲁棒性和记忆性。
(6) 利用GRF 和双速率积分学习DIL (Dual-rate integral learner) 算法设计了具有参数自学习能力的分布力反射DFRL (Distributed-force-feedback-based reflex with online learning),将其用于调控分布式CPG 的输出偏置,实现四足机器人在不同地形上的姿态稳定性。DIL可以自动调节DFRL反射网络的增益,实现反射网络快速且无超调的输出,可使DFRL直接应用在不同尺寸和重量的四足机器人上。
主要创新点:
(1) 自适应CPG 物理通信(ANC):利用DL 算法自动生成肢体运动协调机制PM 的感知反馈增益因子,实现非耦合SO(2) CPG 的ANC,提高四足机器人自组织运动的形成速度和适应性。
(2) 自适应CPG 神经通信(APC):利用自动相位锁技术和APC 构建自适应非耦合SO(2) CPG 的神经连接,实现了非耦合SO(2) CPG 的APC,使四足机器人自组织运动具有鲁棒性和记忆性。
(3) 具有参数自学习的分布力反射(DFRL):利用GRF 反馈和DIL 算法设计了DFRL,用于调控分布式CPG 的输出偏置,实现机器人在不同地形上的姿态稳定性。DFRL可直接应用在不同尺寸和重量的四足的机器人上。