wikiplag-multi:使用Spark,Hadoop和Apache Cassandra查找Wikipedia gia窃

时间:2021-04-30 05:58:03
【文件属性】:
文件名称:wikiplag-multi:使用Spark,Hadoop和Apache Cassandra查找Wikipedia gia窃
文件大小:122KB
文件格式:ZIP
更新时间:2021-04-30 05:58:03
Scala wikiplag-multi Wikiplag项目组织为sbt多项目项目。 该存储库包含wikiplag的“后端”。 该webapp是一个单独的项目,可以在找到。 Wikiplag包括以下子项目: (W)Wikipedia Importer-清理Wikipedia文章并创建反向索引。 (P)抄袭查找器-用于检测潜在抄袭的算法。 (U)实用程序-项目之间共享的通用类。 (R)Rest-API:公开信息学检测算法为REST-API。 每个项目都有一个单独的自述文件,其根目录中有更多详细信息。 项目的依赖关系如下: W-> {U} P-> {U} U-> {} R-> {U,P} 其中“->”箭头表示“取决于”关系。
【文件预览】:
wikiplag-multi-master
----project()
--------build.properties(19B)
--------plugins.sbt(181B)
--------assembly.sbt(94B)
----utils()
--------src()
--------README.md(408B)
----wikipediaImporter()
--------src()
--------README.md(3KB)
----build.sbt(6KB)
----plagiarismFinder()
--------src()
--------README.md(2KB)
----README.md(818B)
----.gitignore(211B)
----restApi()
--------src()
--------README.md(3KB)
--------test_script()

网友评论