python xpath读取属性举例分析
更新:HHH   时间:2023-1-7


本篇内容主要讲解“python xpath读取属性举例分析”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“python xpath读取属性举例分析”吧!

爬取豆瓣电影网页

发现数据在属性标签里,用xpath读取

import urllib.request
import lxml.etree as le
import user_agent
import pandas as pd 

best_data = []
request = urllib.request.Request(
    url='https://movie.douban.com/cinema/nowplaying/zhengzhou/',
    headers={'User-Agent':user_agent.get_user_agent_pc()}
)

response = urllib.request.urlopen(request)


html_x = le.HTML(response.read())

sub_data = html_x.xpath('//ul[@class="lists"]/li')

for i in sub_data:
    temp_data = {}
    temp_data['编号'] = ''.join(i.xpath('@id'))
    temp_data['电影名'] = i.xpath('@data-title')
    temp_data['电影评分'] = i.xpath('@data-score')
    best_data.append(temp_data)

pd.DataFrame(best_data).to_csv('db.csv')
xpath可以爬取属性

到此,相信大家对“python xpath读取属性举例分析”有了更深的了解,不妨来实际操作一番吧!这里是天达云网站,更多相关内容可以进入相关频道进行查询,关注我们,继续学习!

返回大数据教程...