优化算法-整理中...
Gradient descent & SGD,batch GD,mini-batch ing...
Gradient Discent 梯度下降
梯度下降是降低损失的一个过程
步长(Learning rate):步长决定了在梯度下降迭代的过程中,每一步沿梯度负方向前进的长度。用上面下山的例子,步长就是在当前这一步所在位置沿着最陡峭最易下山的位置走的那一步的长度。
特征(feature):指的是样本中输入部分,比如2个单特征的样本(x(0),y(0)),(x(1),y(1)),则...