hanlp问题分析及解决方案

windows环境分析

github地址
可以看到setup.py最下方两行安装环境要求
hanlp setup.py
1.最重要的python环境要求,python>=3.6,如果不满足,那需要升级python。
2.首先因为Hanlp原来是Java的一个jar包,只是后来被引进到python中,因此JDK环境是必不可少的。
3.micrsoft c++ 14.0,该组件是很多软件的运行库,包括一些游戏,需要安装。
4.fasttext==0.9.1,笔者在安装过程中要到了该错误,一会单独安装。
5、最新的hanlp2.0版本要求tensorflow=2.1.0版本,这里如果网速有问题,应该单独安装。

解决方案

1.由于笔者本机已安装过java jdk1.8.0_202版本,这里就不再赘述jdk的安装过程了。
【基本上就是下载安装->更改环境变量->打开命令框,输入java与javac命令有输出,不报错,则证明安装成功->你也可以通过java -version查看已安装java的版本,实在不会,就去百度一下】
2.micrsoft c++ 14.0安装,你可以去Microsoft 官网下载;如果你不想去官网下,可以从这里下载-提取码:zjno
安装过程,直接默认安装,路径可以更改,还有很多附加功能,可以不安装。
3.fasttext安装,这是一个词向量工具,也能做简单的文本分类,通过如下命令安装。

pip3 install fasttext==0.9.1 -i https://pypi.tuna.tsinghua.edu.cn/simple 

4.windows下安装该环境,最好使用Anaconda3,由于hanlp可以使用GPU/TPU,因此最好安装gpu版本tensorflow-gpu=2.1.0,安装命令如下

conda install tensorflow==2.1.0

安装完成后,测试代码如下:

import tensorflow as tf
print(tf.__version__)

如果没有报错,万事大吉;
如果报错:
情况一:
tensorflow2.1.0报错
需要卸载numpy,或者升级numpy:

pip3 install –U numpy

情况二:
报错为tensorflow自身的问题,很遗憾需要卸载,重装。

conda uninstall tensorflow==2.1.0
conda install tensorflow==2.1.0

5.最终安装完成这些基础环境之后,安装hanlp

pip3 install hanlp

jieba问题分析及解决方案

问题分析

可以看到github上提出的环境要求
jieba paddle
如果报错,基本是使用了Paddle,但是没有安装paddle且没有升级jieba。

解决方案

pip install paddlepaddle-tiny==1.6.1
pip3 install -U jieba

nlpir问题分析及解决方案

问题分析

一般是授权问题,pip安装的是旧一些的版本。由于授权过期的问题,需要重新授权。

解决方案

windows(win7 x64)

去其github网站下载源文件
NLPIRgithub
下载该文件,获取授权。
NLPIR授权
将其复制到其安装目录,笔者使用anconda安装,目录如下
NLPIR安装目录
直接将其复制过来,解决问题。

linux(ubuntu16.04.0 x64)

与windows下解决方法类似
但是可以使用

git clone git@github.com:NLPIR-team/NLPIR.git

同样的方法
查看已安装环境的路径
在这里插入图片描述
替换NLPIR.user

cp 你的下载路径/NLPIR-master/License/license for a month/NLPIR-ICTCLAS分词系统授权/NLPIR.user 你的安装路径/anaconda3/envs/experiment/lib/python3.6/site-packages/pynlpir/Data/

好了,问题至此应该解决了。

参考博文

[1]https://www.cnblogs.com/pythoner6833/p/10108964.html

Logo

开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!

更多推荐