MuZero
此条目需要补充更多来源。 (2020年12月25日) |
MuZero是DeepMind研发的计算机程序,可以在不被告知规则的情况下通过观察大量游戏和棋类比赛来掌握围棋、国际象棋、日本将棋和视频游戏的玩法和规则[1]。
相关连结
- AlphaZero
- DeepMind
- 无监督学习
参考资料
- ^ 无需告知规则 MuZero算法自学成“棋”才. 科技日报. [2021-01-28]. (原始内容存档于2021-02-02).
外部链接
- Open-Source MuZero Implementations (页面存档备份,存于互联网档案馆)