Book-Search-Engine:图书搜索引擎(Java,Apache Lucene,crawler4j,Apache Spark)

时间:2024-05-18 21:39:28
【文件属性】:

文件名称:Book-Search-Engine:图书搜索引擎(Java,Apache Lucene,crawler4j,Apache Spark)

文件大小:8KB

文件格式:ZIP

更新时间:2024-05-18 21:39:28

search-engine apache-spark apache pagerank indexing

图书搜索引擎 图书搜索引擎(Java,Apache Lucene,crawler4j,Apache Spark) 使用crawler4j爬行了大约100,000个网页,并通过使用Apache Spark的Graphx在Web图表上实现PageRank来执行链接分析。 使用Apache Lucene对爬网的文档建立索引,并通过PageRank和TF / IDF分数的组合对每个查询的文档进行排序。


【文件预览】:
Book-Search-Engine-master
----Book Search Engine.iml(80B)
----src()
--------main()
----README.md(384B)
----pom.xml(2KB)
----.gitignore(288B)

网友评论