pycharm爬虫打印网页出现中文乱码问题

论坛 期权论坛 编程之家     
选择匿名的用户   2021-6-2 20:21   1633   0
方法一:response = requests.get(url, verify=False)
response.encoding = 'GBK'

将得到的response编码转换一下即可。

方法二:

# BeautifulSoup解析后得到的soup,打印出来是乱码,实际上其本身已经是正确的(从原始的GB2312编码)解析(为Unicode)后的了。
# 之所以乱码,那是因为,打印soup时,调用的是__str__,其默认是UTF-8,
res.encoding = 'gb18030'
soup = BeautifulSoup(res.text,'lxml')
分享到 :
0 人收藏
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

积分:3875789
帖子:775174
精华:0
期权论坛 期权论坛
发布
内容

下载期权论坛手机APP