五、Solr 安装中文分词器
一、分词器配置https://repo1.maven.org/maven2/com/github/magese/ik-analyzer/8.3.0/ik-analyzer-8.3.0.jar IK 分启器 支持 sole7、8的版本
一、分词器配置
https://repo1.maven.org/maven2/com/github/magese/ik-analyzer/8.3.0/ik-analyzer-8.3.0.jar IK 分启器 支持 sole 7、8的版本
其它版本的分词器下载地址 https://repo1.maven.org/maven2/com/github/magese/ik-analyzer/
将下载的jar放到 E:\solr-8.6.3\server\solr-webapp\webapp\WEB-INF\lib 这个目录 下
在核心配置文件managed-schema 增加如下内容
<!-- ik分词器 -->
<fieldType name="text_ik" class="solr.TextField">
<analyzer type="index">
<tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="false" conf="ik.conf"/>
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
<analyzer type="query">
<tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="true" conf="ik.conf"/>
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
</fieldType>
将业务字段的type类型改为text_ik(如果原来有数据,需要重新索引或删除重新导入)
然后重新启动服务。
二、测试
在WEB管理界面 ,选择 order-> Analysis -> 选择分词器 text_ik 输入 "黑夜给了我黑色的眼睛" 点击"Analyse Values"按钮可以看到结果已经分词成功了。
solr分词后的搜索结果
Sql 模糊搜索结果
所以还是有必要使用IK分词的,在100万条数据中测试,只有第一次查询的时候,可能耗时200毫秒左右,其它 都在15毫秒之内返回,加了IK 性能上没有发现变化的。
开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!
更多推荐
所有评论(0)