强化学习简明教程

强化学习通过与环境互动试错来学习完成某项任务,本文介绍其基本概念和两种实现方法:Q-Learning和Deep Q Networks。