爬虫入门基础-HTTP协议过程
更新:HHH   时间:2023-1-7



网站会检查是不是真的浏览器访问。需加上 User-Agent: Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.1276.73 Safari/537.36 ,表明你是浏览器访问即可。有时还会检查是否带 Referer 信息还会检查你的 Referer 是否合法

服务器一般会使用cookie来标识用户,如果接受并带上该cookie继续访问,服务器会认为你是一个已标识的正常用户。因此,大部分网站需要使用cookie的来爬取内容。

返回编程语言教程...