Tom StepletonGoogle DeepMind London England关注立即认领分享关注立即认领分享基本信息浏览量:61职业迁徙个人简介暂无内容研究兴趣论文共 3 篇作者统计合作学者相似作者按年份排序按引用量排序主题筛选期刊级别筛选合作者筛选合作机构筛选时间引用量主题期刊级别合作者合作机构Model-Free Counterfactual Credit AssignmentThomas Mesnard,Théophane Weber,Fabio Viola,Shantanu Thakoor,Alaa Saade,Anna Harutyunyan,Will Dabney,Tom Stepleton,Nicolas Heess,Marcus Hutter,Lars Buesing,Rémi Munosuser-5f8cf9244c775ec6fa691c99(2021)引用0浏览0引用00Counterfactual Credit Assignment in Model-Free Reinforcement LearningThomas Mesnard,Théophane Weber,Fabio Viola,Shantanu Thakoor,Alaa Saade,Anna Harutyunyan,Will Dabney,Tom Stepleton,Nicolas Heess,Arthur Guez,Marcus Hutter,Lars Buesing,INTERNATIONAL CONFERENCE ON MACHINE LEARNING, VOL 139(2021)引用61浏览0EI引用610Q(λ) with Off-Policy CorrectionsAnna Harutyunyan,Marc G. Bellemare,Tom Stepleton,Rémi Munosalgorithmic learning theory(2016)引用25浏览0EI引用250作者统计合作学者合作机构D-Core合作者学生导师暂无相似学者,你可以通过学者研究领域进行搜索筛选数据免责声明页面数据均来自互联网公开来源、合作出版商和通过AI技术自动分析结果,我们不对页面数据的有效性、准确性、正确性、可靠性、完整性和及时性做出任何承诺和保证。若有疑问,可以通过电子邮件方式联系我们:report@aminer.cn