文件名称:word源码java-elasticsearch:springboot整合ElasticSearch
文件大小:66KB
文件格式:ZIP
更新时间:2024-06-25 17:15:18
系统开源
word源码java 全文检索: 数据结构: 数据总体分为两种: 结构化数据: 有固定格式或有限长度的数据 如:数据库中的数据、元数据(文件、文件夹...)等 非结构化数据: 不定长或无固定格式的数据 如:邮件,word文档等磁盘上的文件 数据的搜索方式: 结构化数据: 数据库中数据通过sql语句可以搜索 元数据(windows中的)通过windows提供的搜索栏进行搜索 非结构化数据: 顺序扫描法: 拿到搜索的关键字,去文档中,逐字匹配,直到找到和关键字一致的内容为止 优点: 如果文档中存在要找的关键字就一定能找到想要的内容 缺点: 慢, 效率低 全文检索:Full-text Search 先建立索引,再对索引进行搜索的过程就叫全文检索 如:字典(有拼音和部首索引) 相当于字典,分为目录和正文两部分 查询的时候通过先查目录,然后通过目录上标注的页数去正文页查找需要的内容 分词: 去掉停用词(a, an, the ,的, 地, 得, 啊, 嗯 ,呵呵) 因
【文件预览】:
elasticsearch-master
----.gitignore(276B)
----gradle()
--------wrapper()
----README.md(9KB)
----build.gradle(937B)
----gradlew.bat(2KB)
----gradlew(5KB)
----src()
--------test()
--------main()
----settings.gradle(35B)