当前在线人工客服
天达云-技术
QQ:1324027256
天达云-技术
QQ:1902643386
天达云-售前
QQ:1650874901
天达云-售前
QQ:2207995833
天达云-合作
QQ:1984186903
天达云微信小程序
400-837-6568

如何利用selenium库爬取京东python书籍一百页存入csv
更新:HHH   时间:2023-1-7


本篇文章为大家展示了如何利用selenium库爬取京东python书籍一百页存入csv,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。

1、分析页面。

我们以前利用requests库等获取获取很麻烦。

利用selenium库可以省很多事情,我们只需要获取点击到下一页,

爬取我们需要的商品信息,存入csv。

所以我们要写三个方法来实现。

2、实现获取商品信息get_products方法。

我们需要抓取,编号,书名,价格,评价数量,出版社,

我们打开京东页面,切换到开发者模式,如图:

  1. 所有的商品都有一个类名:gl-item

  2. data-sku为一个编号,后面的class名需要用到。

  3. 价格的class是J_加上编号

  4. 评价数的id是J_comment_加上编号

  5. 书名的class是p-name

  6. 出版社的class是curr-shop

于是乎我们可以实现get_products获取商品的信息:

3、实现点击下一页

4、存入csv

上述内容就是如何利用selenium库爬取京东python书籍一百页存入csv,你们学到知识或技能了吗?如果还想学到更多技能或者丰富自己的知识储备,欢迎关注天达云行业资讯频道。

返回大数据教程...