Chapter1 Introduction
当我们在思考人类是如何学习的时候,第一个蹦出来的想法很可能就是通过与环境的交互来学习。婴儿玩耍、挥舞手臂或者紧盯物体的时候都是没有专门的老师来教导的,只是与他所在的环境有可以感觉运动的直接连接。通过利用这一连接,可以产生十分丰富的信息,包括因果关系、一系列动作后的结果、如何达到目标。纵观我们的生活,这类交互无疑是我们了解环境和自己的最大的知识来源。不管是我们驾驶汽车还是进行会话,我们都可以很明显的感知到周边环境对我们所作所为的响应,我们自己则会通过自己的行为来影响未来会发生什么。与环境的交互学习几乎是所有学习与智能理论的基本理念。
这本书会探索通过计算的手段来从环境交互中学习的方法。我们不会直接的去推理人或者动物都是怎样学习的,而是研究一些理想的学习情景还有评估各种学习方法的有效性。也就是利用人工智能研究者或者工程师的视角。我们研究针对机器的设计,关注如何更加有效的解决涉及科学问题或者经济利益的学习问题,利用数学分析或者计算机实验来评估这些设计。这种通过计算研究学习的手段就是增强学习,它更加专注于通过环境交互进行目标导向的学习而非其他机器学习的手段。