
岭南师范学院,广东省湛江市,524048;
摘要:PID控制是工业过程控制中经典且应用广泛的策略,其参数整定是研究热点。传统整定方法依赖精确数学模型,面对复杂系统难以获理想效果。强化学习为PID参数自适应整定提供新思路。本文综述基于强化学习的自适应PID控制器研究进展,重点探讨虚拟仿真平台构建技术。文章先阐述传统PID控制与强化学习结合的必要性与优势;接着分析强化学习自适应PID控制的核心原理与典型算法;然后提出分层模块化的虚拟仿真平台总体架构,论述其核心组成模块;之后通过典型被控对象仿真案例验证平台有效性;最后总结当前领域面临的主要挑战,如训练效率等问题,并对未来发展方向,如与深度学习融合等进行展望。本文旨在为相关研究人员提供技术参考和实践指南。
关键词:强化学习;自适应PID控制;虚拟仿真平台;数字孪生
参考文献
[1]陈学松,杨宜民.基于执行器-评价器学习的自适应PID控制[J].控制理论与应用,2011,28(8):6.DOI:10.7641/j.issn.1000-8152.2011.8.ccta100618.
[2]谢琪琦.基于强化学习的半主动悬架PID控制[J].汽车电器,2024(12):29-32.
[3]吕铁良,张运涵,袁凯平.一种基于强化学习的自适应PID温度控制算法:202510020286[P][2025-10-13].