GitHub 项目:强化学习训练机器人打网球

当AlphaGO战胜了世界围棋冠军李世石之后,整个工业界都为之振奋,越来越多的学者意识到强化学习在人工智能领域是一个非常令人exciting的。 什么是强化学习 强化学习的基本思想是通过最大化智能体(agent) 从环境中获得的累计奖赏值,以学习到完成目标的最优策略。强调如何基于环境而行动,以取得最...