es-pattern-analyzer

时间:2024-07-24 00:53:34
【文件属性】:

文件名称:es-pattern-analyzer

文件大小:608KB

文件格式:ZIP

更新时间:2024-07-24 00:53:34

Java

es-pattern-analyzer 自定义 ElasticSearch 分析器和自定义 ElasticSearch tokenizer 插件插件名称 - Pattern-as-Key-Pluging 这个 ES 插件扩展了 lucine PatternTokenizer。 它将索引模式而不是索引 TERMS。 当不需要进行*文本查询搜索但确实需要弄清楚在流中找到了多少术语时非常有用。 例子: 文本带有一堆不同的帐号、信用卡或 SSN。 它不是索引术语,而是识别每个单词的正则表达式模式 分析器是一个隐藏 ssn 的好地方:123-74-7894 和账号 123456 如果我们使用正则表达式:[0-9]{3}-[0-9]{2}-[0-9]{4} 表示“SSN”,正则表达式 [0-9]{6} 表示“帐号”那么输出是 ES 中的索引:SSN 和帐号。


【文件预览】:
es-pattern-analyzer-master
----elastic-search-pattern-tokenizer()
--------src()
--------.classpath(705B)
--------.settings()
--------pom.xml(2KB)
--------target()
--------.project(584B)
--------.svn()
----README.md(802B)

网友评论