非线性期望在强化学习和多臂老虎机中的应用

发布者:文明办作者:发布时间:2022-11-23浏览次数:314

主讲人:陈增敬 山东大学教授


时间:2022年11月25日15:00


地点:腾讯会议 603 883 366


举办单位:数理学院


主讲人介绍:陈增敬,山东大学教授,博士生导师。国家杰出青年科学基金获得者,第十四届孙冶方经济科学奖获得者。作为独立完成人完成的项目“资产定价理论中的非线性期望方法”荣获2015年度国家自然科学二等奖。主要研究方向包括金融数学,倒向随机微分方程,计量经济学等。与美国艺术与科学院士、著名经济学家Epstein合作发表在国际顶级经济刊 Econometrica上的论文是大陆学者第一篇发表在该顶级期刊的论文。得到了被称为Chen-Epstein的资产定价公式,被诺贝尔经济奖获得者Sargent和Hansen等国际著名专家引用或推广。


内容介绍:本报告将介绍强化学习以及老虎机问题的模型和方法,并考虑几个关于老虎机问题的策略极限定理:包括策略大数定律、策略大偏差原理和策略中心极限定理。