如何NLTK全集添加到谷歌云功能?(How to add NLTK corpora to a goo

2019-10-29 14:09发布

我试图运行涉及使用NLTK的谷歌云功能。 我又增加了textblob == 0.15.3 NLTK == 3.4.3到requirement.txt。 但每次我运行它崩溃的脚本和日志显示“请使用NLTK下载获取资源:”。

我知道我们需要下载NLTK全集以在本地系统上运行的脚本。 但不知道如何下载它在谷歌的云功能。 任何帮助将不胜感激。 提前致谢。

Answer 1:

有两种方法为用Python编写的云功能指定依赖:在使用PIP封装经理requirements.txt文件或包装本地依赖性旁边的功能。 这里你可以找到说明。 还要检查该链接可能的解决方案。



Answer 2:

这是我通过我的特拉维斯管道得到nltk_data:

    # To install the core NLTK package
    pip install nltk   

    # Installs only the extra packages you need. You could also use 'all' instead. 
    python -m nltk.downloader punkt averaged_perceptron_tagger wordnet    

然后您可以将文件夹复制到文件夹功能,并压缩它:

    mkdir -p function/nltk_data/
    cp -a ~/nltk_data/. function/nltk_data/
    cp -a path/to/your/code/. function/

一定要设置NLTK_DATA环境变量。 正如我的文件夹结构是

    - nltk_data/
    - main.py
    - requirements.txt

我只是需要设置NLTK_DATA = nltk_data,然后Python可以找到这些文件。

希望这可以帮助!



文章来源: How to add NLTK corpora to a google cloud function?