61
Surfing-Segment是一个先进的文本分词工具,专门增强ik-analyzer。包含多个自定义词典,动态识别型号、同义词功能、elasticsearch插件等功能。显著的增强了对专业术语及复杂型号的分词精确度。是电商平台优化体验的理想选择。
Java
2个月前
8919053 indexea 1673024392
192
基于 NLP 技术实现的中文分词插件,准确度比常用的分词器高太多,同时提供 ElasticSearch 和 OpenSearch 插件。
Java
7个月前
5187 lionsoul 1578914315
Jcseg是基于mmseg算法的一个轻量级Java中文分词器,同时集成了关键字提取,关键短语提取,关键句子提取和文章自动摘要等功能,并且提供了一个基于Jetty的web服务器,方便各大语言直接http调用,同时提供了最新版本的lucene、solr、elasticsearch、opensearch的搜索分词接口
Java
8个月前
812591 tenlee 1578933525
7
可能是东半球hao用的elasticsearch(es)中文分词器插件
Java
12个月前
0
IK分词器,主要针对lucene进行支持,版本与lucene版本同步
Java
1年多前
138
基于HanLP自然语言处理包的elasticsearch分词器
Java
1年多前
5008798 detachina 1659674630
79
快速中文分词分析word segmentation
Java
接近2年前
12 mirrors 1578989292
2
The IK Analysis plugin integrates Lucene IK analyzer (http://code.google.com/p/ik-analyzer/) into opensearch, support customized dictionary.
Java
2年多前
12 mirrors 1578989292
7
首先感谢jieba分词原作者fxsjy,没有他的无私贡献,我们也不会结识到结巴 分词,更不会有现在的java版本
Java
3年多前
12 mirrors 1578989292
13
CoreNLP 是斯坦福提供的一组用Java编写的自然语言分析工具
12 mirrors 1578989292
0
mmseg4j core 使用 Chih-Hao Tsai 的 MMSeg 算法实现的中文分词器。
Java
3年多前
438805 eavnfor 1578923885
16
针对mmseg4j (1.10.0)的拓展,弥补了多处不足,分词,随心所欲
Java
4年多前
5187 lionsoul 1578914315
36
elasticsearch便捷版本,集成了一些常用的插件
Java
4年多前
22
基于ik-analyzer分词器,在其基础上实现对不同版本的lucene兼容,ik-analyzer项目主页地址为:https://code.google.com/archive/p/ik-analyzer/
Java
4年多前
7122 ysc 1578914462
4
Superword is a Java open source project dedicated in the study of English words analysis and auxiliary reading。本站是superword在Github的镜像站点,仅做备份使用。
Java
5年多前

搜索帮助