1内蒙古天润化肥股份有限公司,内蒙古鄂尔多斯市,010321;
2内蒙古工业大学,内蒙古呼和浩特市,010051;
摘要:机器人系统应用于工业巡检的某些任务时,不可能覆盖各种环境和传感器属性,导致机器人在未知环境下需自动探索、自适应环境。为了解决上述问题,提出了一种基于深度强化学习的决策算法,通过将机器人的探索过程分解为决策、规划和地图绘制模块,构建一个通用的探索框架,弥补了由于学习效率低及难以从模拟到现实的可移植性而受到的损害,提高了机器人系统的模块化程度,为相关领域的发展提供了可行思路与实践范式。
关键词:深度强化学习;巡检机器人;自主探索;TD3算法
参考文献
[1]李业谦,陈春苗.基于ROS和激光雷达的移动机器人自动导航系统设计[J].现代电子技术,2020,43(10):176-178,183.
[2]金书奎,寇子明,吴娟.煤矿水泵房巡检机器人路径规划与跟踪算法的研究[J].煤炭科学技术,2022,50(5):253-262.
[3]王清珍,杨丽.远距离激光机器人嵌入式视觉传感器灵敏度优化方法[J].激光杂志,2022,43(7):184-188.
[4]黄凌杰.服务机器人室内投递的全局路径规划仿真[J].福建电 脑,2023,39(3):104-106.
[5]李春晖,周松涛,张谢许,等.AGV自动导航智能化计量设备搬 运技术研究及应用[J].河南科技,2021,40(32):47-50.