Tantivy 是受 Apache Lucene 启发并用 Rust 编写的全文搜索引擎库

时间:2024-07-18 12:11:11
【文件属性】:

文件名称:Tantivy 是受 Apache Lucene 启发并用 Rust 编写的全文搜索引擎库

文件大小:607KB

文件格式:ZIP

更新时间:2024-07-18 12:11:11

rust search-engine

Tantivy是一个用 Rust 编写的全文搜索引擎库。它更接近Apache Lucene,而不是Elasticsearch或Apache Solr ,因为它不是现成的搜索引擎服务器,而是可用于构建此类搜索引擎的 crate。事实上,Tantivy 的灵感来自于 Lucene 的设计。基准以下基准会分解不同类型的查询/集合的性能。您的里程将根据查询的性质及其负载而有所不同。特征全文检索可配置的分词器(词干可用于 17 种拉丁语言,第三方支持中文(tantivy-jieba和cang-jie )、日语(lindera和tantivy-tokenizer-tiny-segmente )和韩语(lindera +lindera-ko-dic-builder )快速(查看:horse::sparkles:基准:sparkles::horse:)极小的启动时间(<10ms),非常适合命令行工具BM25评分(与Lucene相同)自然查询语言(例如(michael AND jackson) OR "king of pop" )短语查询搜索(例如"michael jackson" )增量索引多线程索引(在我的桌面上索引英文*需要 < 3 分钟)映射目录平


网友评论