读txt文件报错_CodingPark编程公园

其他 2020-06-26 10:17:55 阅读次数: 0

报错

’utf-8’ codec can’t decode byte 0xb6 in position 2
在这里插入图片描述

解决办法

1 ✅


file = open('/Users/atom-g/Desktop/DanMuAnalyzePark/FuDanUniversity_data/test_corpus/corpus/1.txt', 'r', encoding='gbk')

在这里插入图片描述

2-代码美观一点 ✅

from pyhanlp import *

def readtxt(path):
    with open(path, 'r', encoding='gbk') as fr:
        content = fr.read()
        return content


text = readtxt('/Users/atom-g/Desktop/DanMuAnalyzePark/FuDanUniversity_data/test_corpus/corpus/1.txt')
text_process = HanLP.segment(text)
text_list = [(str(i.word), str(i.nature)) for i in text_process]
# print(text_list)

words = []
for i in text_list:
    if i[1] != 'w' and len(i[0])>1:
        words.append(i[0])

print(words)

在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/weixin_38411989/article/details/106929448

读txt文件报错_CodingPark编程公园

神奇的短信_CodingPark编程公园

TransferLearning迁移学习_CodingPark编程公园

Conda介绍与基本使用_CodingPark编程公园

OpenCV图像处理基础_CodingPark编程公园

python修改列表元素_CodingPark编程公园

CNN-ResNet_完整项目_CodingPark编程公园

Java那些必须知道的事儿_CodingPark编程公园

高效连接Mac与Ipad_小技巧_CodingPark编程公园

IDEA(Mac版)_常用快捷键_CodingPark编程公园

Eclipse引入Jar包_小技巧_CodingPark编程公园

LDA主题模型_完整项目_CodingPark编程公园

生成个性二维码_CodingPark编程公园

命名实体识别_利用cocoNLP包_CodingPark编程公园

cmd命令行实用技巧_CodingPark编程公园

Pycharm使用-取消pytest的办法_CodingPark编程公园

隐马尔可夫链_CodingPark编程公园

自然语言处理思维导图_CodingPark编程公园

Minist手写体识别_完整项目_CodingPark编程公园

自定义数据集-Pokenom Go_完整项目_CodingPark编程公园

正则表达式_帮助手册_CodingPark编程公园

Pycharm输入字母无法正常显示_小技巧_CodingPark编程公园

xml转PDF(xml&xslt->fo->pdf)_完整项目_CodingPark编程公园

人工智能中神经网络与自然语言处理共生关系_CodingPark编程公园

Safari浏览器报kCFErrorDomainCFNetwork:303错误_CodingPark编程公园

Gensim库生成与导入W2V模型_CodingPark编程公园

Anaconda-Navigator打开时闪退的解决办法【Mac】_CodingPark编程公园

词性标注-利用HMM_完整项目_CodingPark编程公园

1、读txt文件

读Txt文件

今日推荐

周排行

成为C++高手之宏与枚举

在CAD二次开发中使用进度条

Js插件ECharts，HighCharts学习网址整理

Celery提交任务出错(on windows.)

cephfs内核客户端性能追踪

thinkphp中PHPExcel用法

EntityFramework动态组合多排序字段

汇编语言（八）实验9 根据材料编程

安装ubuntu后必须做的事情（对我而言）

JS函数式编程

每日归档

更多

2024-10-22(0)

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)