scrapy中文字符问题 - 代码天地

scrapy中文字符问题

其他 2020-08-14 10:49:24 阅读次数: 0

问题描述

在scrapy spider的解析函数中，有时候通过如下两种方式获得的html数据中中文字符出现类似于\\u3010\\u6bdb\\u91cc这种格式的字符。

respone.text

或者

response.body.decode(response.encoding)

该字符串产生的问题是因为将unicode类型的数据转换为了str类型。在后续的处理中，中文字符只展示编码后的情况。

解决方法

html = response.body.decode(response.encoding)
html = html.encode().decode('unicode_escape')

通过上述方法，中文字符可以正常显示。

猜你喜欢

转载自blog.csdn.net/shuizhongmose/article/details/103425048

scrapy中文字符问题

IDA中文字符显示问题

scrapy输出中文字符到文件

中文字符的存储

中文字符脱敏

osg 中显示中文字符出现乱码问题

JAVA中文字符编码问题详解

AIX下中文字符集问题

Python读取中文字符编码问题

解决python的中文字符编码问题

关于mac matplotlib中文字符乱码问题

FME中中文字符长度问题

PHP截取中文字符串乱码问题

js 处理中文字符排序问题

Qt中中文字符转换问题

中文字符乱码问题的解决方法

ajax 传递中文字符参数问题

MySQL 不能插入中文字符的编码问题。

配置Tomcat 中文字符集问题

tomcat7中文字符编码问题

mysql:中文字符显示问号的问题

navicate中中文字符变为？的问题

解决QT不能中文字符输出问题

servlet HttpServletRequest 类 3 中文字符编码问题

中文字符串截取乱码问题

Mac上texstudio无法显示中文字符的问题

使用matplotlib绘图中文字符显示问题

用Scrapy抓取的中文字符导出到csv中出现乱码

Scrapy保存中文字符到json文件时编码设置

正则匹配中文字符

今日推荐

周排行

深度学习------Lingvo框架下的加速通道GPipe

webjars管理静态资源

C专家编程_2.2

mysql 源码安装

json文件操作

123231432

注解的实现

Spring MVC 控制器

《人月神话》读后感二

C#使用HttpWebRequest和HttpWebResponse上传文件示例

每日归档

更多

2024-09-08(0)

2024-09-07(0)

2024-09-06(0)

2024-09-05(0)

2024-09-04(0)

2024-09-03(0)

2024-09-02(0)

2024-09-01(0)

2024-08-31(0)

2024-08-30(0)