Skip to main content

自然语言处理(NLP)
把人类的语言通过一些方式或者技术翻译成机器可以读懂的语言。

搜索引擎里面输入语言很多种,而中文的分词是比较关键的技术点,ES本身默认的分词是将每个汉字逐个分开。

所以就需要中文分词器, 业界强大的有两个 HanLP 和 IK分词器,IK是官方推荐和ES版本同步更新。

而HanLP更强大,分词效果更好,而且还可以标注单词的词性,且和java整合更方便。

HanLP官网地址: https://www.hanlp.com/

本文内容转载自小滴课堂