Bellman equation里没有梯度下降为什么会有学习率?

  统计/机器学习 强化学习    浏览次数:3218        分享
0

Q learning的迭代过程需要用到Bellman equation。Bellman equation其中一个变量是学习率,但是这个式子本身并没有涉及到梯度或者梯度下降的概念,为什么会有学习率呢?

 

wxjjnss   2018-12-02 13:32



   1个回答 
4

学习率和梯度下降算法并没有直接关系。学习率是指模型根据新样本更新模型参数的“速率”。

比如Q-learning里就是根据一个新的数据点(新的行为和奖励),来更新Q-table里的数值;如果学习率太大,新样本的权重就太大,忽略了历史数据的作用。

SofaSofa数据科学社区DS面试题库 DS面经

Marvin_THU   2018-12-07 12:34

谢谢 - wxjjnss   2018-12-08 14:35


  相关讨论

Q-learning里的Q是什么意思?

关于DQN训练速度慢的问题

关于举办“迁移学习(Transfer Learning)核心技术

计算机视觉与信息最新技术

用tensorflow实现强化学习的dql算法报错:tensorflow.python.framework.errors_impl.InternalError: Could not find valid device for node. Node: {{node OneHot}} = OneHot[T=DT_FLOAT, TI=DT_FLOAT, axis=-1](dummy_input, dummy_input, dummy_input, dummy_input)

关于张量运算,求问框框部分运算是怎么计算的?具体运算规则是怎样的?

深度强化学习课程介绍

RNN

深度强化学习核心课程

迁移学习(Transfer Learning)核心技术课程开课了

  随便看看

医学统计里的c-index或者c-statistic是什么意思?

自助法(bootstrap)的0.632是怎么来的?

查看sklearn的线性回归系数的p value

两个独立的正态随机变量的乘积服从什么分布?

为什么过拟合不好?