刘克
演讲人
中国科学院数学与系统科学研究院应用数学所研究员
刘克,中国科学院数学与系统科学研究院应用数学所研究员。
Au_60069_0.jpeg
马尔可夫是彼得堡数学学派的代表人物,以数论和概率论方面的工作著称。马尔可夫决策过程是基于马尔可夫过程理论的随机动态系统的最优决策过程。马尔可夫决策过程是序贯决策的主要研究领域。它是马尔可夫过程与确定性的动态规划相结合的产物,故又称马尔可夫型随机动态规划,属于运筹学中数学规划的一个分支。马尔可夫决策过程是指决策者周期地或连续地观察具有马尔可夫性的随机动态系统,序贯地作出决策。即根据每个时刻观察到的状态,从可用的行动集合中选用一个行动作出决策,系统下一步(未来)的状态是随机的,并且其状态转移概率具有马尔可夫性。决策者根据新观察到的状态,再作新的决策,依此反复地进行。
马氏决策理论与应用第二讲
Vod_60187.jpeg
CJFZFGB0820104216004.flv
288
350
60187/info.html
error.html
http://gffgaf75067c2e8a043a7hbfwob96cqq5w6xpf.fbyb.hbpu.cwkeji.cn/adksvod/PublicFolder/Player
http://gffga05319f78c7994b03hbfwob96cqq5w6xpf.fbyb.hbpu.cwkeji.cn/flvServer.aspx