plagiarism_detection:使用TF-IDF和余弦相似度算法进行窃检测

时间:2024-05-24 09:08:42
【文件属性】:

文件名称:plagiarism_detection:使用TF-IDF和余弦相似度算法进行窃检测

文件大小:850KB

文件格式:ZIP

更新时间:2024-05-24 09:08:42

python3 plagiarism-checker plagiarism-detection Python

抄袭检测 使用TF-IDF和余弦相似度进行gi窃检测。 输入文本将与DB( document表)中存在的所有文档匹配,以获取最大相似度。 要求 Python 3.x,pip3,MySQL 怎么跑? 移至 ,创建虚拟环境,然后将其激活为 $ cd < project> $ virtualenv .environment $ source .environment/bin/activate 在settings.py下编辑配置。 即提供与DB和其他常量相关的配置/设置。 如果您使用的是PyCharm,则可以在run configuration下指定环境变量。 将项目添加为PYTHONPATH为 $ export PYTHONPATH= " $PYTHONPATH :. " # . corresponds to current directory(pr


【文件预览】:
plagiarism_detection-master
----settings.py(900B)
----service()
--------base.py(1KB)
--------plag_detector.py(2KB)
--------plag_dao.py(2KB)
--------__init__.py(65B)
----routes.py(442B)
----output()
--------get_docs.png(498KB)
--------Plag.postman_collection.json(3KB)
--------detect.png(246KB)
--------add_doc.png(241KB)
----app.py(2KB)
----model()
--------base.py(2KB)
--------document.py(1KB)
--------__init__.py(170B)
----controller()
--------base.py(983B)
--------document.py(2KB)
--------__init__.py(65B)
--------plag_detection.py(2KB)
----requirements.txt(454B)
----util()
--------constants()
--------injector.py(2KB)
--------response.py(4KB)
--------__init__.py(0B)
--------commons.py(1KB)
--------singleton.py(562B)
--------logger.py(335B)
--------error_handlers()
----README.md(4KB)
----tests()
--------plagiarism_detection_tests.py(3KB)
--------__init__.py(65B)
----mysql_connector.py(125B)
----.gitignore(939B)

网友评论