更新时间:2020-08-21 17:45:51
封面
版权信息
译者序
前言
作者简介
审校者简介
第1章 欢迎来到机器人世界
1.1 开始你的AI旅程
1.2 四种不同的AI模型
1.3 学习AI可以让你做什么
1.4 小结
第2章 探索你的AI工具包
2.1 GitHub源代码页面
2.2 Colaboratory运行环境
2.3 小结
第3章 Python基础——学习如何用Python编程
3.1 显示文本
3.2 变量和操作
3.3 列表和数组
3.4 if语句和条件
3.5 for循环和while循环
3.6 函数
3.7 类和对象
3.8 小结
第4章 AI基础技巧
4.1 什么是强化学习
4.2 强化学习的五大原理
4.2.1 原理#1——输入与输出系统
4.2.2 原理#2——奖励
4.2.3 原理#3——AI环境
4.2.4 原理#4——马尔可夫决策过程
4.2.5 原理#5——训练与推断
4.3 小结
第5章 你的第一个AI模型——小心老虎机
5.1 多臂老虎机问题
5.2 汤普森采样模型
5.2.1 模型编程
5.2.2 理解模型
5.2.3 什么是分布
5.2.4 应对多臂老虎机问题
5.2.5 汤普森采样策略三步走
5.2.6 汤普森采样模型的临门一脚
5.2.7 汤普森采样模型与标准模型
5.3 小结
第6章 销售和广告中的AI——像“AI街之狼”一样销售
6.1 待解决的问题
6.2 用仿真构建AI环境
6.2.1 运行仿真程序
6.2.2 回顾
6.3 AI解决方案及其直觉的回顾
6.3.1 AI解决方案
6.3.2 直觉
6.4 技术实现
6.4.1 汤普森采样与随机策略选择
6.4.2 开始编程
6.4.3 最终结果
6.5 小结
第7章 欢迎来到Q学习
7.1 迷宫
7.1.1 第一步
7.1.2 构建环境
7.1.3 构建AI模型
7.2 Q学习的完整流程
7.2.1 训练模式
7.2.2 推断模式
7.3 小结
第8章 物流行业中的AI——仓库中的机器人
8.1 构建环境
8.1.1 状态
8.1.2 行为
8.1.3 奖励
8.1.4 AI解决方案回顾
8.2 技术实现
8.2.1 第1部分——构建环境
8.2.2 第2部分——用Q学习构建AI解决方案
8.2.3 第3部分——进入推断模式
8.2.4 改进1——自动化奖励分配
8.2.5 改进2——加入一个中间目标
8.3 小结
第9章 人工大脑——深度Q学习
9.1 预测房价
9.1.1 上传数据集
9.1.2 导入依赖库
9.1.3 排除变量
9.1.4 准备数据
9.1.5 构建神经网络
9.1.6 训练神经网络
9.1.7 展示结果
9.2 深度学习理论
9.2.1 神经元
9.2.2 激活函数
9.2.3 神经网络的工作原理
9.2.4 神经网络如何学习
9.2.5 正向传播算法和反向传播算法
9.2.6 梯度下降算法
9.3 深度Q学习
9.3.1 归一化指数方法
9.3.2 深度Q学习回顾
9.3.3 经验回放
9.3.4 深度Q学习的完整算法