怎么使用numpy实现LR算法
更新:HHH   时间:2023-1-7


这篇文章主要介绍“怎么使用numpy实现LR算法”,在日常操作中,相信很多人在怎么使用numpy实现LR算法问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”怎么使用numpy实现LR算法”的疑惑有所帮助!接下来,请跟着小编一起来学习吧!

一个例子

问题: 如果给你一个给你 1000000 个数据 a1~a1000000,以及 1000000 个数据 b1~b1000000,要你求每一对 ai 和 bi 相乘的结果的总和c,你会怎么做?

采用for循环累加的代码如下

计算结果:249879.05298545936, for 循环计算耗时:519.999980927ms

如果采用numpy来进行同等的操作(向量化)

计算结果:249879.05298545936, 矩阵计算耗时:0.999927520752ms

这计算速度的差距比马里亚纳海沟还深, 之所以差距会这么大, 是因为numpy, matlab这类矩阵运算的程序, 充分利用了现代CPU的SIMD技术, 极大提高了运算效率

向量化在LR中的应用

现在我们拿最简单的LR逻辑回归来讲一下, 如何使用向量化的技巧, 手动训练模型

假如我们选用 BGD(批量梯度下降) 或者 MBGD(小批量梯度下降), 那么LR的参数训练公式为

可以看到, 上述推导的公式中,中间的那个大矩阵, 其实就是输入数据矩阵的转置,这样代码实现就很简单了, 使用numpy实现的LR算法为

def grand_ascent(data_train, data_label):
    dataMatrix = np.mat(data_train)
    labelMat = np.mat(data_label).transpose()
    m, n = np.shape(dataMatrix)
    weights = np.ones((n, 1))
    alpha = 0.001
    
    for i in range(0, 500):
        h = sigmoid(dataMatrix * weights)
        weights = weights + alpha * dataMatrix.transpose() * (labelMat - h)        
    return weights

到此,关于“怎么使用numpy实现LR算法”的学习就结束了,希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习,快去试试吧!若想继续学习更多相关知识,请继续关注天达云网站,小编会继续努力为大家带来更多实用的文章!

返回大数据教程...