Skip to content

newspaper常见问题 #24

@ljk99

Description

@ljk99

https://www.knowledgedict.com/tutorial/python-nltk-resource-punkt-not-found.html
python 使用 nltk 时,报错信息 Resource punkt not found 的解决方法
Python 笔记 Python 笔记

python 使用 nltk 模块进行分词等自然语言处理时,如果没有提前安装 punkt,会报出 Resource punkt not found 错误,那下面介绍如何解决该问题。

1解决方法
解决方法
错误信息中,可能会包含如下解决方法:

import nltk
nltk.download('punkt')
但是很有可能,实际操作中会报 Connection refused 或 ssl 验证等错误,那就需要进行笔者提供的下一步解决方案。

到官方网站下载地址:https://github.com/nltk/nltk_data/blob/gh-pages/packages/tokenizers/punkt.zip 下载 punkt 压缩包;
解压后,在如下目录之一(如没有就新建)下建立 tokenizers 目录,然后将解压的 punkt 文件夹迁移到该目录下;

Attempted to load tokenizers/punkt/PY3/english.pickle
Searched in:
- '/Users/xxx/nltk_data'
- '/usr/share/nltk_data'
- '/usr/local/share/nltk_data'
- '/usr/lib/nltk_data'
- '/usr/local/lib/nltk_data'
- ''

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions