APP下载
反馈
2.4 从值函数计算最优策略(上)
802 播放
收藏
下载
手机看
登录后可发评论

评论沙发是我的~

热门评论(0)
    全部评论(0)
      选集(89)
      自动播放
      [1] Pybullet安装
      1454播放
      06:24
      [2] 通用强化学习框架
      1326播放
      06:51
      [3] GYM
      1299播放
      06:32
      [4] 裂缝检测实践(上)
      1123播放
      05:51
      [5] 裂缝检测实践(下)
      1453播放
      05:49
      [6] 1.1 绪论
      892播放
      06:29
      [7] 2.1 强化学习的基本概念
      825播放
      07:57
      [8] 2.2 马尔可夫决策问题模型(上)
      1063播放
      05:34
      [9] 2.2 马尔可夫决策问题模型(下)
      1124播放
      05:37
      [10] 2.3 强化学习值函数(上)(上)
      1148播放
      05:48
      [11] 2.3 强化学习值函数(上)(下)
      610播放
      05:52
      [12] 2.3 强化学习值函数(下)(上)
      1111播放
      05:32
      [13] 2.3 强化学习值函数(下)(下)
      517播放
      05:28
      [14] 2.4 从值函数计算最优策略(上)
      802播放
      待播放
      [15] 2.4 从值函数计算最优策略(下)
      701播放
      06:53
      [16] 3.1 动态规划算法(上)(上)
      609播放
      05:42
      [17] 3.1 动态规划算法(上)(下)
      1181播放
      05:41
      [18] 3.1动态规划算法(下)(上)
      1174播放
      06:16
      [19] 3.1动态规划算法(下)(下)
      644播放
      06:18
      [20] 3.2蒙特卡罗算法(上)
      715播放
      06:05
      [21] 3.2蒙特卡罗算法(下)
      1406播放
      06:07
      [22] 3.3 时差分方法
      926播放
      09:12
      [23] 3.4 Q-Learning算法
      1432播放
      06:33
      [24] 4.1 人脑神经网络和人工神经网络...
      1319播放
      05:56
      [25] 4.1 人脑神经网络和人工神经网络...
      1070播放
      05:53
      [26] 4.2 人工神经元(上)
      1375播放
      05:44
      [27] 4.2 人工神经元(下)
      1100播放
      05:48
      [28] 4.3 前馈神经网络
      1490播放
      07:43
      [29] 5.1 多层神经网络的参数学习(上...
      1427播放
      07:11
      [30] 5.1 多层神经网络的参数学习(下...
      796播放
      07:15
      [31] 5.2 梯度下降方法(上)
      644播放
      05:14
      [32] 5.2 梯度下降方法(下)
      848播放
      05:14
      [33] 5.3 反向传播算法(上)
      843播放
      07:56
      [34] 5.3 反向传播算法(下)
      593播放
      07:53
      [35] 6.1 多机器人集群(上)
      1386播放
      06:56
      [36] 6.1 多机器人集群(下)
      947播放
      06:54
      [37] 6.2 多智能体信息融合
      1462播放
      07:37
      [38] 6.3 多智能体协调的学习控制方法
      684播放
      07:03
      [39] 7.1 搜索-问题定义
      1471播放
      09:31
      [40] 7.2 搜索-树搜索
      637播放
      08:00
      [41] 7.3 搜索-广度优先
      876播放
      07:15
      [42] 7.4 搜索-深度优先(上)
      1545播放
      05:56
      [43] 7.4 搜索-深度优先(下)
      667播放
      06:01
      [44] 7.5 搜索-一致代价
      1173播放
      06:27
      [45] 8.1 启发搜索-启发函数(上)
      730播放
      05:39
      [46] 8.1 启发搜索-启发函数(下)
      1409播放
      05:44
      [47] 8.2 启发搜索-A*算法(上)
      639播放
      07:53
      [48] 8.2 启发搜索-A*算法(下)
      855播放
      07:56
      [49] 8.3 博弈搜索-对抗游戏
      1295播放
      07:32
      [50] 8.4 博弈搜索-MINMAX算法...
      1206播放
      07:15
      [51] 8.4 博弈搜索-MINMAX算法...
      845播放
      07:15
      [52] 8.5 博弈搜索-alpha_be...
      1495播放
      10:18
      [53] 8.5 博弈搜索-alpha_be...
      1272播放
      10:16
      [54] 9.1 约束满足-问题定义
      631播放
      08:53
      [55] 9.2 约束满足-回溯搜索
      676播放
      08:20
      [56] 9.3 约束满足-约束传播
      525播放
      09:22
      [57] 9.4 约束满足-树结构
      898播放
      06:46
      [58] 机器学习-高等代数(上)
      1040播放
      09:37
      [59] 机器学习-高等代数(下)
      610播放
      09:33
      [60] 机器学习-高等数学Ⅰ(上)
      792播放
      12:45
      [61] 机器学习-高等数学Ⅰ(下)
      978播放
      12:46
      [62] 机器学习-高等数学Ⅱ(上)
      1212播放
      10:14
      [63] 机器学习-高等数学Ⅱ(下)
      1457播放
      10:11
      [64] 机器学习-高等数学Ⅲ(上)
      1128播放
      12:27
      [65] 机器学习-高等数学Ⅲ(下)
      1365播放
      12:30
      [66] 机器学习-概率初步(上)
      1006播放
      11:18
      [67] 机器学习-概率初步(下)
      742播放
      11:22
      [68] 机器学习-统计回归(上)
      949播放
      06:47
      [69] 机器学习-统计回归(下)
      1143播放
      06:52
      [70] 机器学习-增量计算(上)
      683播放
      05:52
      [71] 机器学习-增量计算(下)
      501播放
      05:52
      [72] 知识表示-一阶谓词(上)
      658播放
      07:32
      [73] 知识表示-一阶谓词(下)
      927播放
      07:37
      [74] 知识表示-产生式
      1089播放
      07:19
      [75] 确定性推理-推理概念
      1092播放
      05:03
      [76] 确定性推理-自然演绎
      1298播放
      03:18
      [77] 不确定性推理-概率回顾I
      593播放
      06:49
      [78] 不确定性推理-概率回顾II
      522播放
      06:34
      [79] 不确定性推理-概率回顾III
      1116播放
      06:56
      [80] 不确定推理-贝叶斯网络I
      1330播放
      07:24
      [81] 不确定性推理-贝叶斯网络II
      909播放
      08:08
      [82] 不确定性推理-贝叶斯网络III(上...
      1145播放
      05:53
      [83] 不确定性推理-贝叶斯网络III(下...
      574播放
      05:52
      [84] 不确定性推理-D-分离I(上)
      1351播放
      06:08
      [85] 不确定性推理-D-分离I(下)
      1083播放
      06:08
      [86] 不确定性推理-D-分离II(上)
      1182播放
      06:11
      [87] 不确定性推理-D-分离II(下)
      1494播放
      06:08
      [88] 不确定性推理-D-分离III(上)
      735播放
      06:40
      [89] 不确定性推理-D-分离III(下)
      1175播放
      06:46
      为你推荐
      27:31
      第九章1 多元函数基本概念(中)
      1517播放
      09:25
      3.5.1 迭代计算函数和标准平衡
      1406播放
      08:22
      概念3.1 矩阵秩的定义
      1132播放
      05:32
      10.5 正则化逻辑回归
      780播放
      07:44
      5.1.2 多元回归模型的表达式及...
      1895播放
      12:16
      144、第六章 可分离变量微分方程...
      1983播放
      09:54
      11二维离散随机变量及其分布(下)
      1370播放
      05:16
      3.SVM算法推导的目标函数(下)
      1462播放
      16:35
      9.1.2 多变量函数(上)
      1141播放
      17:25
      02几类不同增长的函数模型(上)
      1747播放
      10:54
      判别域界面方程分类的概念、线性判别...
      1500播放
      05:14
      1.2 二值逻辑变量与基本逻辑运算...
      1508播放
      14:09
      7.1 模式识别基础(1)基本概念...
      1147播放
      06:53
      4.1 线性映射迭代概念(下)
      763播放