本篇内容主要讲解“python xpath读取属性举例分析”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“python xpath读取属性举例分析”吧!
爬取豆瓣电影网页
发现数据在属性标签里,用xpath读取
import urllib.request
import lxml.etree as le
import user_agent
import pandas as pd
best_data = []
request = urllib.request.Request(
url='https://movie.douban.com/cinema/nowplaying/zhengzhou/',
headers={'User-Agent':user_agent.get_user_agent_pc()}
)
response = urllib.request.urlopen(request)
html_x = le.HTML(response.read())
sub_data = html_x.xpath('//ul[@class="lists"]/li')
for i in sub_data:
temp_data = {}
temp_data['编号'] = ''.join(i.xpath('@id'))
temp_data['电影名'] = i.xpath('@data-title')
temp_data['电影评分'] = i.xpath('@data-score')
best_data.append(temp_data)
pd.DataFrame(best_data).to_csv('db.csv')
xpath可以爬取属性
到此,相信大家对“python xpath读取属性举例分析”有了更深的了解,不妨来实际操作一番吧!这里是天达云网站,更多相关内容可以进入相关频道进行查询,关注我们,继续学习!