辽宁石油化工大学学报

辽宁石油化工大学学报 ›› 2016, Vol. 36 ›› Issue (6): 64-68.DOI: 10.3969/j.issn.1672-6952.2016.06.014

• • 上一篇    下一篇

模型自由的离散时间系统的随机线性二次最优控制

么彩莲1,王 涛2,3   

  1. 1.辽宁石油化工大学理学院,辽宁抚顺113001;2.东北大学信息科学与工程学院,辽宁沈阳110004;3.沈阳师范大学计算机与数学基础教学部,辽宁沈阳110034
  • 收稿日期:2016-02-09 修回日期:2016-09-26 出版日期:2016-12-27 发布日期:2016-12-29
  • 作者简介:么彩莲(1980-),女,博士研究生,讲师,从事随机优化研究;E-mail:yclwt8079@163.com。
  • 基金资助:
    教育部基本科研业务项目(N140404004)。

  • Received:2016-02-09 Revised:2016-09-26 Published:2016-12-27 Online:2016-12-29

摘要: 针对模型自由的随机线性离散时间系统,通过Q 学习算法求解无限时间随机线性二次最优控制问题。首先根据贝尔曼最优性原理定义Q函数,通过值迭代算法的思想构造Q 学习算法;其次给出Q 学习算法的等价形式并证明其收敛性;最后通过一个仿真实例说明Q 学习算法的有效性。

关键词: Q 学习算法, 值函数, 随机线性二次最优控制, 随机代数方程

引用本文

么彩莲, 王 涛. 模型自由的离散时间系统的随机线性二次最优控制[J]. 辽宁石油化工大学学报, 2016, 36(6): 64-68.

使用本文

0
    /   /   推荐

导出引用管理器 EndNote|Ris|BibTeX

链接本文: https://journal.lnpu.edu.cn/CN/10.3969/j.issn.1672-6952.2016.06.014

               https://journal.lnpu.edu.cn/CN/Y2016/V36/I6/64