世界模型:基于强化学习捕捉环境的时间和空间表示 发表评论 146 views 中文标题:世界模型 英文标题:World Models 发布平台:NeurIPS 发布日期:2018-03-28 引用量(非实时):1031 1 文章萃取 1.1 核心观点 1.2 综合评价 1.3 主观评分:⭐⭐⭐⭐⭐ 2 精读笔记 2.1 背景知识 2.2 模型细节 2.3 赛车实验 2.4 VizDoom 实验 2.5 讨论与后记 相关资源 中文标题:世界模型 英文标题:World Models 发布平台:NeurIPS NeurIPS 发布日期:2018-03-28 引用量(非实时):1031 DOI:10.5281/ZENODO.1207631 作者:Dav Read more
AlphaGo Zero:无师自通的围棋大师 发表评论 861 views 中文标题:AlphaGo Zero:无师自通的围棋大师 英文标题:Mastering the game of Go without human knowledge 发布平台:Nature 发布日期:2017-10-01 引用量(非实时):8443 1 文章萃取 1.1 核心观点 1.2 综合评价 1.3 主观评分:⭐⭐⭐⭐⭐ 2 精读笔记 2.1 背景介绍 2.2 前置知识 2.3 算法细节 2.4 模型训练 2.5 结果分析 相关资源 中文标题:AlphaGo Zero:无师自通的围棋大师 英文标题:Mastering the game of Go without Read more