【文件属性】:
文件名称:wikiplag-multi:使用Spark,Hadoop和Apache Cassandra查找Wikipedia gia窃
文件大小:122KB
文件格式:ZIP
更新时间:2021-04-30 05:58:03
Scala
wikiplag-multi
Wikiplag项目组织为sbt多项目项目。 该存储库包含wikiplag的“后端”。 该webapp是一个单独的项目,可以在找到。
Wikiplag包括以下子项目:
(W)Wikipedia Importer-清理Wikipedia文章并创建反向索引。
(P)抄袭查找器-用于检测潜在抄袭的算法。
(U)实用程序-项目之间共享的通用类。
(R)Rest-API:公开信息学检测算法为REST-API。
每个项目都有一个单独的自述文件,其根目录中有更多详细信息。
项目的依赖关系如下:
W-> {U}
P-> {U}
U-> {}
R-> {U,P}
其中“->”箭头表示“取决于”关系。
【文件预览】:
wikiplag-multi-master
----project()
--------build.properties(19B)
--------plugins.sbt(181B)
--------assembly.sbt(94B)
----utils()
--------src()
--------README.md(408B)
----wikipediaImporter()
--------src()
--------README.md(3KB)
----build.sbt(6KB)
----plagiarismFinder()
--------src()
--------README.md(2KB)
----README.md(818B)
----.gitignore(211B)
----restApi()
--------src()
--------README.md(3KB)
--------test_script()