Reinforcement Learning: An Introduction
Introduction
Chapter1 Introduction
1.1 增强学习
1.2 例子
1.3 增强学习基础
1.4 限制与使用领域
1.5 扩展实例:井字棋
1.6 本章总结
1.7 增强学习的早期历史
Part I: 表格解决方法
Chapter2 多臂老虎机
2.1 多臂老虎机问题
2.2 行动-价值方法
2.3 10臂测试案例
2.4 增量法实现
2.5 解决非固定情况
2.6 乐观初始化价值
2.7 置信上界法
2.8 梯度老虎机算法
2.9 相关性搜索(具有上下文的老虎机)
2.10 本章总结
Powered by
GitBook
2.9 相关性搜索(具有上下文的老虎机)
2.9 相关性搜索(具有上下文的老虎机)
results matching "
"
No results matching "
"