第八十七章 动力装甲技术难题(1 / 2)
普沃大学被一条公路分为东院和西院,人工智能学院位于东院,而他自己的实验室则在西院。 这个实验室正是校长李进分配给他,并被他改建为军工保密级实验室的。 该实验室长20米,宽15米,高6米,专门用于进行阿纳海姆IV型动力装甲原型机的研发和初步测试。 虽然没有阿纳海姆动力装甲实验室那么开阔的空间,但各种测试设备非常齐全,用于原型机的开发没有任何问题。 苏寒雨正在指导一名硕士生如何通过控制台操纵动力装甲的飞行高度,而张飞和其他几名硕士生,则分别坐在不同的全息显示面板前,紧张地注视着动力装甲的参数变化。 尚斌的出现并没有使他们停下手中的工作,甚至连招呼也没有打。 这是尚斌定下的规矩——在实验室就要全神贯注做实验,其他都不重要。 接近半吨的动力装甲在数个微型推进器的推力下以站立姿态平稳地浮在空中。 与执行西洲大陆考古任务中使用的凯夫拉III试作型动力装甲不同,IV型动力装甲只有背部的推进器是固定的,四肢推进器的自由度不再固定,而是具有1个自由度,并且所用的推进器功率更高,以满足各种姿态调整需求。 这样做不仅可以在更大范围内对动力装甲的姿态进行调整,还大大提高了驾驶员的安全性。 “开始调整为水平姿态,角速度峰值:10度/s。” 随着苏寒雨一声指令的下达,旁边的硕士生立即操作起来。 动力装甲的上半身开始前倾,下半身向后伸展。 与此同时,四肢上安装的推进器与地面的角度始终保持不变,并且喷射出的气流也明显增大,而背部的推进器则很快停止工作——如果继续工作,动力装甲会沿其他方向喷射出去。 “关节峰值转速位于安全阈值内,头部受力正常,躯干受力正常,四肢受力正常。”张飞一边盯着显示面板,一边报告重要的参数情况。 动力装甲内部并没有操作者,只有一个装满传感器的假人,测试开始后,传感器数据被源源不断地从动力装甲传送到控制台。 “恢复站立姿态,角速度峰值:10度/s。” 动力装甲在10秒之内恢复了站立姿态,从头到尾都没有出现抖动和过载的情况。 相比刚刚接手项目时的情况,现在的测试结果已经有了突破性进展。 尚斌曾经翻阅过第一次到达阿萨海姆动力装甲实验室时看到的那次场外实验的数据——动力装甲中的假人身体多处出现过载情况,几处关节的扭曲程度也超过了人类的耐受值。 “重新对上述姿态调整过程进行测试,角速度峰值增大为:20度/s。” 动力装甲的上半身开始前倾,手臂抬起到一半的位置时,控制台响起了冰冷的报警声: 【右臂肘部关节扭曲程度超过最大安全值,腰部002号、003号、004号、008号、009号、010号传感器检测到受力过载。】 “实验中止,进行复位操作。” 动力装甲一边缓缓恢复为站立姿态,一边缓缓降落。 苏寒雨不满地摇了摇头,马上开始检查刚刚采集到的实验数据。 尚斌走到苏寒雨身边,拿起一台平板,飞快扫了一眼数据,侧身问道: “找到问题出现的原因了吗?” 苏寒雨一边盯着数据,一边开口说道:“我们试图用一个单一而巨大的长短期循环神经网络对各种角速度峰值下的姿态调整过程进行控制,但总会出现一些训练不好的情况。” 她继续补充道, “每次训练得到的控制策略都不太稳定,有时在角速度峰值为10度/s下表现良好,但切换为20度/s的情况后会出现刚才发生的动作过载。有时正好反过来,20度/s下的控制效果比10度/s下的控制效果要好。 出现过载动作的问题虽然可以通过设置安全阈值加以控制,但会对算法收敛性产生影响,导致训练过程不稳定。” 尚斌听完后微微一笑: “可以用级联式方法和惩罚项来解决吗?” “是哦!我怎么没想到。”苏寒雨豁然开朗,马上与张飞进行了短暂的讨论,然后着手下一个版本文档的制作。 一点就通,不错! 尚斌很喜欢基础扎实头脑灵活的学生。有时候,他觉得苏寒雨有些……成熟,一种与年龄不符的干练与成熟,甚至觉得那句“我怎么没想到”是在恭维他。 所谓的级联方法,是指由两个和两个以上的神经网络联合起来组成的网络。在控制策略差异较大的不同环境下,将环境控制参数提取出来,作为前一级神经网络的输入,其余特征向量和前一级神经网络的输出作为下一级神经网络的输入。 这种方法虽然需要更多的计算资源,但能对一些高度非线性的情况进行很好的处理。 而惩罚项则是一种安全强化学习的技巧。有时,为了学习的稳定性,会给到达非安全状态的动作加一个非常大的惩罚性回报。 惩罚项如果太大,会导致学习到的策略过于保守,从而无法使性能达到最优,如果太小,则很可能失去惩罚作用。因此其大小需要精心调试或通过自动学习的方式得到。 苏寒雨很快将具体算法的变动画在平板上,然后发送给张飞。 张飞来自计算机科学与技术学院,是一名软件工程专业的学生。 几个月前,他被郝俊物色并招致麾下的。 虽然他刚来时与苏寒雨不熟,但自从加入实验室后一直与团队
↑返回顶部↑