一、分词器配置

https://repo1.maven.org/maven2/com/github/magese/ik-analyzer/8.3.0/ik-analyzer-8.3.0.jar  IK 分启器 支持 sole  7、8的版本 

其它版本的分词器下载地址 https://repo1.maven.org/maven2/com/github/magese/ik-analyzer/

将下载的jar放到  E:\solr-8.6.3\server\solr-webapp\webapp\WEB-INF\lib 这个目录 下

在核心配置文件managed-schema 增加如下内容 

	<!-- ik分词器 -->
	<fieldType name="text_ik" class="solr.TextField">
		<analyzer type="index">
			<tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="false" conf="ik.conf"/>
			<filter class="solr.LowerCaseFilterFactory"/>
		</analyzer>
		<analyzer type="query">
			<tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="true" conf="ik.conf"/>
			<filter class="solr.LowerCaseFilterFactory"/>
		</analyzer>
	</fieldType>

将业务字段的type类型改为text_ik(如果原来有数据,需要重新索引或删除重新导入) 

然后重新启动服务。

二、测试

在WEB管理界面 ,选择 order-> Analysis -> 选择分词器 text_ik 输入 "黑夜给了我黑色的眼睛" 点击"Analyse Values"按钮可以看到结果已经分词成功了。

solr分词后的搜索结果

Sql 模糊搜索结果

所以还是有必要使用IK分词的,在100万条数据中测试,只有第一次查询的时候,可能耗时200毫秒左右,其它 都在15毫秒之内返回,加了IK 性能上没有发现变化的。

Logo

开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!

更多推荐