Plagiarism-Detector:通过搜索文本文件之间的公共子字符串来检测可能的抄袭

时间:2024-06-25 13:51:07
【文件属性】:

文件名称:Plagiarism-Detector:通过搜索文本文件之间的公共子字符串来检测可能的抄袭

文件大小:11KB

文件格式:ZIP

更新时间:2024-06-25 13:51:07

Java

抄袭检测器 这个简单的程序使用哈希表实现的无序字典检测 Java 程序文件中可能的抄袭。 如果两个文件有一个很长的公共子串,这表明可能存在作弊。 注意事项 更改程序之间的空格会更改公共子字符串,但不会更改程序语义。 为了对间距问题不敏感,输入文件中的所有空格都被删除。 另一个问题是,通过更改变量名称,可以使具有相同语义的两个程序完全不同。 为了使程序对变量名更改不敏感,所有用户定义的标识符都替换为字符“#”。 这些操作的结果存储为令牌序列。 抄袭搜索 为了检测作弊,该程序将搜索长度为 l 标记的公共子序列(l 是作为命令行参数给出的用户指定参数)并输出匹配的子字符串,并恢复原始变量名称和间距。


【文件预览】:
Plagiarism-Detector-master
----Pair.java(299B)
----Dictionary.java(571B)
----HashDictionary.java(9KB)
----Entry.java(480B)
----StringHashCode.java(726B)
----keywords.txt(513B)
----DictionaryException.java(410B)
----CheatDetect.java(10KB)
----README.md(1KB)
----HashCode.java(171B)
----FileTokenRead.java(4KB)
----output.txt(172B)
----file1.java(55B)
----Token.java(526B)

网友评论