模型自由的离散时间系统的随机线性二次最优控制

辽宁石油化工大学学报 ›› 2016, Vol. 36 ›› Issue (6): 64-68.DOI: 10.3969/j.issn.1672-6952.2016.06.014

• • 上一篇下一篇

模型自由的离散时间系统的随机线性二次最优控制

么彩莲¹,王涛^2,3

1.辽宁石油化工大学理学院,辽宁抚顺113001;2.东北大学信息科学与工程学院,辽宁沈阳110004;3.沈阳师范大学计算机与数学基础教学部,辽宁沈阳110034

收稿日期:2016-02-09 修回日期:2016-09-26 出版日期:2016-12-27 发布日期:2016-12-29
作者简介:么彩莲(1980-),女,博士研究生,讲师,从事随机优化研究;E-mail:yclwt8079@163.com。
基金资助:
教育部基本科研业务项目(N140404004)。

Received:2016-02-09 Revised:2016-09-26 Published:2016-12-27 Online:2016-12-29

摘要/Abstract

摘要： 针对模型自由的随机线性离散时间系统,通过Q 学习算法求解无限时间随机线性二次最优控制问题。首先根据贝尔曼最优性原理定义Q函数,通过值迭代算法的思想构造Q 学习算法;其次给出Q 学习算法的等价形式并证明其收敛性;最后通过一个仿真实例说明Q 学习算法的有效性。

关键词: Q 学习算法, 值函数, 随机线性二次最优控制, 随机代数方程

么彩莲, 王涛. 模型自由的离散时间系统的随机线性二次最优控制[J]. 辽宁石油化工大学学报, 2016, 36(6): 64-68.

参考文献

相关文章 1

编辑推荐

Metrics