Lucene-Search-Engine-on-Covid19-articles-

时间:2024-05-07 09:23:40
【文件属性】:

文件名称:Lucene-Search-Engine-on-Covid19-articles-

文件大小:22.76MB

文件格式:ZIP

更新时间:2024-05-07 09:23:40

Covid19文章上的Lucene搜索引擎文章 这是python脚本的演示(不是实时的),从以下页面抓取 保存500多个单独的文章,创建要在项目的下一阶段使用的csv文件 csv文件包含用符号(“ /-/”)分隔的文章的标题和内容 python脚本使用Selenium库进行页面测试,自动化,抓取等。它使用chromedriver,该驱动程序应与将在Windows 10中运行该程序的系统的chrome相对应 点安装Selenium 下一步,我们将在Java程序中加载创建的csv文件,并设计索引 我们将在Lucene中重复加载文章的标题和内容。搜索引擎的计划是,可以轻松地找到用户提供的关键字,并根据它们的相关性显示相关的标题。


【文件预览】:
Lucene-Search-Engine-on-Covid19-articles--main
----ezgif.com-gif-maker.gif(22.98MB)
----README.md(2KB)

网友评论