随机梯度下降(SGD)可以被并行计算吗?

  数学 数值计算    浏览次数:4700        分享
0

随机梯度下降(SGD)是对样本进行逐个计算,感觉效率还有提升的空间。SGD可以被并行计算吗?

 

桐桐酱   2019-07-05 22:20



   1个回答 
5

2010年的NIPS就有关于SGD并行的论文了。论文Parallelized Stochastic Gradient Descent传送门

论文里回顾了之前的做法,就是把数据分成k份,各自计算,然后最后做一个平均。(论文中的Algorithm 2)

他们提出的是算法是在算法的过程中不断汇总平均,而不是只在最后做平均。(论文中的Algorithm 3)

具体算法如下:


SofaSofa数据科学社区DS面试题库 DS面经

wxw_pku   2019-09-18 23:41



  相关讨论

怎么用牛顿法近似求解根号2?

计算中的截断误差是什么意思?

关于随机梯度下降法(SGD)的问题

能不能用梯度下降法求平方根或者立方根?

SGD with clipping是什么意思?

常说的低秩分解或者低秩逼近是什么意思?

高斯消元选部分主元为什么要选最大的?

梯度上升算法是什么?

Newton–Raphson和牛顿法区别?

python里怎么求矩阵的条件数?

  随便看看

numpy.array从行向量转为列向量

随机森林会发生过拟合(overfitting)吗?

T检验的effect size是什么?有什么含义吗?

什么是SMOTE sampling方法?

numpy.array转换为图片并显示出来