文件名称:研究论文-基于SVM的抄袭检测方法研究.pdf
文件大小:468KB
文件格式:PDF
更新时间:2022-08-27 10:21:01
计算机技术与应用
针对抄袭检测,本研究提出了基于信息检索和支持向量机(SVM)的检测方法,其对应的子任务就是备选文档检索和基于SVM的详细比对.首先,用信息检索系统从参考文档集中检索出与可疑文档对应的源文档,组成备选文档集.然后,对于可疑文档和备选文档组成的文本对<可疑文档,备选文档>进行特征提取,将得到的特征值写成向量的形式,用这些特征向量训练支持向量机分类器.最后,将从测试集中提取的特征向量投入到分类器中进行分类,从而预测可疑文档是否包含抄袭.实验表明,提出的研究方法能对文档进行有效的抄袭检测,并取得了较好的效果,精确率和召回率有了相应的提升.