python爬虫或web中出现"\\u4e00"unicode字符串的原因

我们的python在爬虫或web中,默认是不需要我们获取进行编码和解码的
因为框架自动帮我们编码然后返回给我们,但是一般用的都是UTF-8,如果这个数据的编码方式是unicode-escape怎么办呢,那么我们就会获得一堆类似于"\u4e00"这样的字符串

解决办法:
unicode_str = '\\u4e00'
str_a = unicode_str.encode().decode("unicode-escape")
# 此时stra就是我们的中文字符了
# 先用UTF-8编码方式将其转换回字节码,然后再用正确的对应的编码转回来

如果我们获得的是’\u4e00’这样的字符串,那么不用转换,存储的时候以utf-8存储即可

with open('test.txt','w',encoding='utf-8') as f:
    f.write("\u4e00")
发布了29 篇原创文章 · 获赞 3 · 访问量 4681

猜你喜欢

转载自blog.csdn.net/weixin_44898301/article/details/102630457