怎么使用numpy实现LR算法-大数据-互联网-天达云

怎么使用numpy实现LR算法
更新：HHH 时间：2023-1-7

这篇文章主要介绍“怎么使用numpy实现LR算法”，在日常操作中，相信很多人在怎么使用numpy实现LR算法问题上存在疑惑，小编查阅了各式资料，整理出简单好用的操作方法，希望对大家解答”怎么使用numpy实现LR算法”的疑惑有所帮助！接下来，请跟着小编一起来学习吧！

一个例子

问题: 如果给你一个给你 1000000 个数据 a1~a1000000，以及 1000000 个数据 b1~b1000000，要你求每一对 ai 和 bi 相乘的结果的总和c，你会怎么做？

采用for循环累加的代码如下

计算结果：249879.05298545936, for 循环计算耗时：519.999980927ms

如果采用numpy来进行同等的操作(向量化)

计算结果：249879.05298545936, 矩阵计算耗时：0.999927520752ms

这计算速度的差距比马里亚纳海沟还深, 之所以差距会这么大, 是因为numpy, matlab这类矩阵运算的程序, 充分利用了现代CPU的SIMD技术, 极大提高了运算效率

向量化在LR中的应用

现在我们拿最简单的LR逻辑回归来讲一下, 如何使用向量化的技巧, 手动训练模型

假如我们选用 BGD(批量梯度下降) 或者 MBGD(小批量梯度下降), 那么LR的参数训练公式为

可以看到, 上述推导的公式中,中间的那个大矩阵, 其实就是输入数据矩阵的转置,这样代码实现就很简单了, 使用numpy实现的LR算法为

def grand_ascent(data_train, data_label):
    dataMatrix = np.mat(data_train)
    labelMat = np.mat(data_label).transpose()
    m, n = np.shape(dataMatrix)
    weights = np.ones((n, 1))
    alpha = 0.001
    
    for i in range(0, 500):
        h = sigmoid(dataMatrix * weights)
        weights = weights + alpha * dataMatrix.transpose() * (labelMat - h)        
    return weights

到此，关于“怎么使用numpy实现LR算法”的学习就结束了，希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习，快去试试吧！若想继续学习更多相关知识，请继续关注天达云网站，小编会继续努力为大家带来更多实用的文章！


返回大数据教程...

一个例子

向量化在LR中的应用

新手上路

产品管理

支付方式

关于我们