登录/注册
已购课程
个人中心
已购课程
优惠券
我的收藏
播放记录
我的证书墙
内容中心
关注我们
进入关怀模式
APP下载
反馈
意见反馈
您有什么问题?告诉我们,我们会为你解决
选择问题类型:
新版本体验建议
视频画面花屏
音/视频画面花屏
播放不流畅
其他
请详细描述您的建议、意见、问题等。
提交
2.4 从值函数计算最优策略(上)
802 播放
魔法财经
财经
收藏
课程免费缓存,随时观看~
下载
打开
网易公开课APP
扫码下载视频
分享
分享到
扫码分享到微信
通过代码可以让这个视频再其他地方播放哦!
复制HTML代码
复制页面代码
手机看
扫描二维码 用手机看
已观看至0分0秒
打开网易公开课APP-我的-右上角扫一扫,在手机上观看,还可以缓存视频,加入学习计划
还没有公开课客户端?
立即下载
登录
后可发评论
评论沙发是我的~
热门评论
(0)
全部评论
(0)
选集(89)
自动播放
[1] Pybullet安装
1454播放
06:24
Pybullet安装
[2] 通用强化学习框架
1326播放
06:51
通用强化学习框架
[3] GYM
1299播放
06:32
GYM
[4] 裂缝检测实践(上)
1123播放
05:51
裂缝检测实践(上)
[5] 裂缝检测实践(下)
1453播放
05:49
裂缝检测实践(下)
[6] 1.1 绪论
892播放
06:29
1.1 绪论
[7] 2.1 强化学习的基本概念
825播放
07:57
2.1 强化学习的基本概念
[8] 2.2 马尔可夫决策问题模型(上)
1063播放
05:34
2.2 马尔可夫决策问题模型(上)
[9] 2.2 马尔可夫决策问题模型(下)
1124播放
05:37
2.2 马尔可夫决策问题模型(下)
[10] 2.3 强化学习值函数(上)(上)
1148播放
05:48
2.3 强化学习值函数(上)(上)
[11] 2.3 强化学习值函数(上)(下)
610播放
05:52
2.3 强化学习值函数(上)(下)
[12] 2.3 强化学习值函数(下)(上)
1111播放
05:32
2.3 强化学习值函数(下)(上)
[13] 2.3 强化学习值函数(下)(下)
517播放
05:28
2.3 强化学习值函数(下)(下)
[14] 2.4 从值函数计算最优策略(上)
802播放
待播放
2.4 从值函数计算最优策略(上)
[15] 2.4 从值函数计算最优策略(下)
701播放
06:53
2.4 从值函数计算最优策略(下)
[16] 3.1 动态规划算法(上)(上)
609播放
05:42
3.1 动态规划算法(上)(上)
[17] 3.1 动态规划算法(上)(下)
1181播放
05:41
3.1 动态规划算法(上)(下)
[18] 3.1动态规划算法(下)(上)
1174播放
06:16
3.1动态规划算法(下)(上)
[19] 3.1动态规划算法(下)(下)
644播放
06:18
3.1动态规划算法(下)(下)
[20] 3.2蒙特卡罗算法(上)
715播放
06:05
3.2蒙特卡罗算法(上)
[21] 3.2蒙特卡罗算法(下)
1406播放
06:07
3.2蒙特卡罗算法(下)
[22] 3.3 时差分方法
926播放
09:12
3.3 时差分方法
[23] 3.4 Q-Learning算法
1432播放
06:33
3.4 Q-Learning算法
[24] 4.1 人脑神经网络和人工神经网络...
1319播放
05:56
4.1 人脑神经网络和人工神经网络(上)
[25] 4.1 人脑神经网络和人工神经网络...
1070播放
05:53
4.1 人脑神经网络和人工神经网络(下)
[26] 4.2 人工神经元(上)
1375播放
05:44
4.2 人工神经元(上)
[27] 4.2 人工神经元(下)
1100播放
05:48
4.2 人工神经元(下)
[28] 4.3 前馈神经网络
1490播放
07:43
4.3 前馈神经网络
[29] 5.1 多层神经网络的参数学习(上...
1427播放
07:11
5.1 多层神经网络的参数学习(上)
[30] 5.1 多层神经网络的参数学习(下...
796播放
07:15
5.1 多层神经网络的参数学习(下)
[31] 5.2 梯度下降方法(上)
644播放
05:14
5.2 梯度下降方法(上)
[32] 5.2 梯度下降方法(下)
848播放
05:14
5.2 梯度下降方法(下)
[33] 5.3 反向传播算法(上)
843播放
07:56
5.3 反向传播算法(上)
[34] 5.3 反向传播算法(下)
593播放
07:53
5.3 反向传播算法(下)
[35] 6.1 多机器人集群(上)
1386播放
06:56
6.1 多机器人集群(上)
[36] 6.1 多机器人集群(下)
947播放
06:54
6.1 多机器人集群(下)
[37] 6.2 多智能体信息融合
1462播放
07:37
6.2 多智能体信息融合
[38] 6.3 多智能体协调的学习控制方法
684播放
07:03
6.3 多智能体协调的学习控制方法
[39] 7.1 搜索-问题定义
1471播放
09:31
7.1 搜索-问题定义
[40] 7.2 搜索-树搜索
637播放
08:00
7.2 搜索-树搜索
[41] 7.3 搜索-广度优先
876播放
07:15
7.3 搜索-广度优先
[42] 7.4 搜索-深度优先(上)
1545播放
05:56
7.4 搜索-深度优先(上)
[43] 7.4 搜索-深度优先(下)
667播放
06:01
7.4 搜索-深度优先(下)
[44] 7.5 搜索-一致代价
1173播放
06:27
7.5 搜索-一致代价
[45] 8.1 启发搜索-启发函数(上)
730播放
05:39
8.1 启发搜索-启发函数(上)
[46] 8.1 启发搜索-启发函数(下)
1409播放
05:44
8.1 启发搜索-启发函数(下)
[47] 8.2 启发搜索-A*算法(上)
639播放
07:53
8.2 启发搜索-A*算法(上)
[48] 8.2 启发搜索-A*算法(下)
855播放
07:56
8.2 启发搜索-A*算法(下)
[49] 8.3 博弈搜索-对抗游戏
1295播放
07:32
8.3 博弈搜索-对抗游戏
[50] 8.4 博弈搜索-MINMAX算法...
1206播放
07:15
8.4 博弈搜索-MINMAX算法(上)
[51] 8.4 博弈搜索-MINMAX算法...
845播放
07:15
8.4 博弈搜索-MINMAX算法(下)
[52] 8.5 博弈搜索-alpha_be...
1495播放
10:18
8.5 博弈搜索-alpha_beta算法(上)
[53] 8.5 博弈搜索-alpha_be...
1272播放
10:16
8.5 博弈搜索-alpha_beta算法(下)
[54] 9.1 约束满足-问题定义
631播放
08:53
9.1 约束满足-问题定义
[55] 9.2 约束满足-回溯搜索
676播放
08:20
9.2 约束满足-回溯搜索
[56] 9.3 约束满足-约束传播
525播放
09:22
9.3 约束满足-约束传播
[57] 9.4 约束满足-树结构
898播放
06:46
9.4 约束满足-树结构
[58] 机器学习-高等代数(上)
1040播放
09:37
机器学习-高等代数(上)
[59] 机器学习-高等代数(下)
610播放
09:33
机器学习-高等代数(下)
[60] 机器学习-高等数学Ⅰ(上)
792播放
12:45
机器学习-高等数学Ⅰ(上)
[61] 机器学习-高等数学Ⅰ(下)
978播放
12:46
机器学习-高等数学Ⅰ(下)
[62] 机器学习-高等数学Ⅱ(上)
1212播放
10:14
机器学习-高等数学Ⅱ(上)
[63] 机器学习-高等数学Ⅱ(下)
1457播放
10:11
机器学习-高等数学Ⅱ(下)
[64] 机器学习-高等数学Ⅲ(上)
1128播放
12:27
机器学习-高等数学Ⅲ(上)
[65] 机器学习-高等数学Ⅲ(下)
1365播放
12:30
机器学习-高等数学Ⅲ(下)
[66] 机器学习-概率初步(上)
1006播放
11:18
机器学习-概率初步(上)
[67] 机器学习-概率初步(下)
742播放
11:22
机器学习-概率初步(下)
[68] 机器学习-统计回归(上)
949播放
06:47
机器学习-统计回归(上)
[69] 机器学习-统计回归(下)
1143播放
06:52
机器学习-统计回归(下)
[70] 机器学习-增量计算(上)
683播放
05:52
机器学习-增量计算(上)
[71] 机器学习-增量计算(下)
501播放
05:52
机器学习-增量计算(下)
[72] 知识表示-一阶谓词(上)
658播放
07:32
知识表示-一阶谓词(上)
[73] 知识表示-一阶谓词(下)
927播放
07:37
知识表示-一阶谓词(下)
[74] 知识表示-产生式
1089播放
07:19
知识表示-产生式
[75] 确定性推理-推理概念
1092播放
05:03
确定性推理-推理概念
[76] 确定性推理-自然演绎
1298播放
03:18
确定性推理-自然演绎
[77] 不确定性推理-概率回顾I
593播放
06:49
不确定性推理-概率回顾I
[78] 不确定性推理-概率回顾II
522播放
06:34
不确定性推理-概率回顾II
[79] 不确定性推理-概率回顾III
1116播放
06:56
不确定性推理-概率回顾III
[80] 不确定推理-贝叶斯网络I
1330播放
07:24
不确定推理-贝叶斯网络I
[81] 不确定性推理-贝叶斯网络II
909播放
08:08
不确定性推理-贝叶斯网络II
[82] 不确定性推理-贝叶斯网络III(上...
1145播放
05:53
不确定性推理-贝叶斯网络III(上)
[83] 不确定性推理-贝叶斯网络III(下...
574播放
05:52
不确定性推理-贝叶斯网络III(下)
[84] 不确定性推理-D-分离I(上)
1351播放
06:08
不确定性推理-D-分离I(上)
[85] 不确定性推理-D-分离I(下)
1083播放
06:08
不确定性推理-D-分离I(下)
[86] 不确定性推理-D-分离II(上)
1182播放
06:11
不确定性推理-D-分离II(上)
[87] 不确定性推理-D-分离II(下)
1494播放
06:08
不确定性推理-D-分离II(下)
[88] 不确定性推理-D-分离III(上)
735播放
06:40
不确定性推理-D-分离III(上)
[89] 不确定性推理-D-分离III(下)
1175播放
06:46
不确定性推理-D-分离III(下)
为你推荐
27:31
第九章1 多元函数基本概念(中)
1517播放
第九章1 多元函数基本概念(中)
09:25
3.5.1 迭代计算函数和标准平衡
1406播放
3.5.1 迭代计算函数和标准平衡
08:22
概念3.1 矩阵秩的定义
1132播放
概念3.1 矩阵秩的定义
05:32
10.5 正则化逻辑回归
780播放
10.5 正则化逻辑回归
07:44
5.1.2 多元回归模型的表达式及...
1895播放
5.1.2 多元回归模型的表达式及含义
12:16
144、第六章 可分离变量微分方程...
1983播放
144、第六章 可分离变量微分方程的求解(下)
09:54
11二维离散随机变量及其分布(下)
1370播放
11二维离散随机变量及其分布(下)
05:16
3.SVM算法推导的目标函数(下)
1462播放
3.SVM算法推导的目标函数(下)
16:35
9.1.2 多变量函数(上)
1141播放
9.1.2 多变量函数(上)
17:25
02几类不同增长的函数模型(上)
1747播放
02几类不同增长的函数模型(上)
10:54
判别域界面方程分类的概念、线性判别...
1500播放
判别域界面方程分类的概念、线性判别函数(中)
05:14
1.2 二值逻辑变量与基本逻辑运算...
1508播放
1.2 二值逻辑变量与基本逻辑运算(上)
14:09
7.1 模式识别基础(1)基本概念...
1147播放
7.1 模式识别基础(1)基本概念和判别函数(上)
06:53
4.1 线性映射迭代概念(下)
763播放
4.1 线性映射迭代概念(下)
评论沙发是我的~