基于Off-policy Q-学习的时延系统线性二次型跟踪控制算法
对被控系统数学模型参数未知的线性离散时间系统,同时考虑到工业过程中数据存在控制输入时间延时的问题,提出了一种数据驱动算法来解决时延系统线性二次型跟踪控制问题。通过对时延系统控制问题的描述,构建了基于模型驱动的强化学习算法框架,在此基础上为了避免使用数...
无线电工程
网络首发
立即查看 >
图书推荐
相关工具书