Plagiarism-Detector:在AWS上部署的简单抄袭检测器

时间:2024-04-15 21:55:54
【文件属性】:

文件名称:Plagiarism-Detector:在AWS上部署的简单抄袭检测器

文件大小:346KB

文件格式:ZIP

更新时间:2024-04-15 21:55:54

JupyterNotebook

gi窃-侦探 在AWS上部署的简单抄袭检测器。 这是一个学术项目,用于预测给定的答案文本是否是源文本的抄袭版本。 前两个笔记本1_Data_Exploration.ipynb和2_Plagiarism_Feature_Engineering.ipynb了一些简单的数据探索,然后进行了特征工程。 最后两本笔记本演示了两种不同的机器学习模型,用于将给定文本分类为抄袭或未抄袭。 3_Training_a_Model-Pytorch.ipynb使用定制的神经网络,使用Pytorch对模型的输出执行二进制分类。 另一个笔记本3_Training_a_Model.ipynb使用Scikit-Learn库中的线性SVM。 该项目假定您对Amazon SageMaker,Scikit学习,Pytorch和自然语言处理方法有所了解。 硬件要求 该项目旨在在Amazon Web Services(AWS)云


【文件预览】:
Plagiarism-Detector-main
----3_Training_a_Model.ipynb(39KB)
----2_Plagiarism_Feature_Engineering.ipynb(122KB)
----3_Training_a_Model-Pytorch.ipynb(73KB)
----problem_unittests.py(6KB)
----notebook_ims()
--------matrix_2.png(26KB)
--------matrix_3_match.png(24KB)
--------matrix_rules.png(60KB)
--------common_subseq_words.png(132KB)
--------matrix_1.png(34KB)
--------matrix_6_complete.png(24KB)
--------.gitkeep(1B)
----helpers.py(5KB)
----source_pytorch()
--------train.py(7KB)
--------predict.py(2KB)
--------model.py(2KB)
--------.gitkeep(1B)
----README.md(2KB)
----1_Data_Exploration.ipynb(9KB)

网友评论