1. 错误代码
import nltk
sentence = """are you ok?"""
tokens = nltk.word_tokenize(sentence)
tokens
2. 错误信息
3. 错误分析
- niltk.download()下载不了相应模块,可能是因为被墙了的原因。
- 错误内容为:在指定目录下找不到指定依赖包
4. 解决方案
- 科学上网下载相应的依赖包(笔者试过,不好使)
- 去github上下载全部的工具包,并解压到以上任意目录下(git地址:https://github.com/nltk/nltk_data)
5. 解决步骤
- 下载相应的依赖包集合(文件大小大概有700MB)
- 解压到指定目录下,(由于文件过大,下载不方便,且有可能在其他虚拟环境中用的到,所以笔者解压到了以下目录),并且注意吧
packages
名字改为nltk_data
- 这里注意,需要解压你所需依赖包里的压缩文件,例如,我需要的是
punkt
,我则需要进去解压相应的文件。(为了防止报错,我建议解压nltk_data下的所有子压缩包)
- 解压文件,并注意路径
- 重新打开代码,重新运行
6. 参考资料
- nltk官网地址:https://www.nltk.org/
- nltk_data链接:https://github.com/nltk/nltk_data
- 参考博客:nltk.download()下载失败