设为首页
收藏本站
切换到宽版
用户名
Email
自动登录
找回密码
密码
登录
注册
快捷导航
论坛
BBS
排行榜
Ranklist
搜索
搜索
热搜:
香港vps
香港VPS
amh
机柜
vps
分销
VPS
域名出售
火车头
云主机
不限流量
香港服务器
美国服务器
香港
全能空间
whmcs
digitalocean
本版
帖子
用户
MJJ论坛
»
论坛
›
技术交流分享
›
Web技术
›
[笔记] 解决网络爬虫登陆问题
返回列表
查看:
1208
|
回复:
0
[笔记] 解决网络爬虫登陆问题
[复制链接]
odmin
odmin
当前离线
积分
9338
发表于 2023-11-2 22:33:23
|
显示全部楼层
|
阅读模式
网络爬虫在爬取网站时会遇到一些登陆的问题,登陆过程中会遇到输入验证码,如何解决爬虫解决登陆和输入验证码?一般有两种方案。
1、使用cookie登陆
使用cookies登陆,获取浏览器的cookies,然后利用requests 库直接登陆cookies,服务器会认为你是一个真实登陆用户,所以就会返回给你一个已登陆的内容。因此,需要验证码的情况可以使用带验证码登陆的cookie解决。
2、强行登陆
使用requests登陆,requests的好处是速度快。
使用requests登陆一般分为几步:
1、发出请求时使用sess
2、需要把验证码图片下载到本地保存
3、需要通过验证码
4、使用post请求访问登陆网站
回复
举报
返回列表
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
注册
本版积分规则
发表回复
回帖后跳转到最后一页
浏览过的版块
美国VPS综合讨论
支付工具讨论
美国虚拟主机交流
Archiver
|
手机版
|
小黑屋
|
MJJ论坛
Copyright
MJJ论坛
© 2022 All Rights Reserved.
快速回复
返回顶部
返回列表