indexingMod:该软件包使用SPIMI算法实现了信息检索系统的索引组件

时间:2024-04-09 05:00:09
【文件属性】:

文件名称:indexingMod:该软件包使用SPIMI算法实现了信息检索系统的索引组件

文件大小:10.69MB

文件格式:ZIP

更新时间:2024-04-09 05:00:09

Python

indexingMod 该软件包使用SPIMI算法实现了信息检索系统的索引组件。 作者:Bilal Ansari @ Ye Thi Ha ==========说明============= 此python程序(indexingMod)使用SPIMI算法实现信息检索系统的索引组件。 输入索引程序: 包含文本文件的数据集目录的路径。 (例如“ C:\ Dataset”) SPMI算法的块大小。 (例如50000) 索引程序的输出: 包含反向索引的文本文件,即“ out_SPIMI_Output.txt”。该文件与输入数据集输出在同一目录中。 ==========环境设置============= 从GitHub下载此索引包(indexingMod)(作为zip文件轻松下载)。将其保存并解压缩到计算机的首选目录中(例如“ C:\ Test \ indexingMod”)。注意:数据包中的示


【文件预览】:
indexingMod-main
----ExampleDataset.zip(9.2MB)
----tokenStreamer.py(3KB)
----blockHandler.py(2KB)
----SampleOutput()
--------out_SPIMI_Output.zip(2.45MB)
--------out_timeStats4BlkSz200000.txt(471B)
----indexingMain.py(5KB)
----helperMod.py(3KB)
----README.md(3KB)

网友评论