基于C#的文本相似度检测

时间:2013-04-24 03:16:08
【文件属性】:
文件名称:基于C#的文本相似度检测
文件大小:127KB
文件格式:RAR
更新时间:2013-04-24 03:16:08
C# 文档那个相似度检测 这是一个基于C#的反作弊系统,基于VSM空间向量模型,能对doc和txt文件进行相似度的检测,在VS2005和SQL Server 2005上实现
【文件预览】:
向量空间法(Vector Space Model ).doc
Felomeng.MoreEffectiveVSMSimilarity.sln
测试语料
----0017.txt(2KB)
----0010.txt(2KB)
----0024.txt(5KB)
----0020.txt(505B)
----0001.txt(5KB)
----0002.txt(5KB)
----0019.txt(758B)
----0016.txt(413B)
----0012.txt(3KB)
----0007.txt(680B)
----0013.txt(2KB)
----0015.txt(1KB)
----0008.txt(2KB)
----0023.txt(6KB)
----0018.txt(603B)
----0006.txt(2KB)
----0014.txt(2KB)
----0011.txt(1KB)
----0021.txt(3KB)
----0003.txt(3KB)
----0025.txt(4KB)
----0005.txt(287B)
----0022.txt(1019B)
----0009.txt(493B)
----0004.txt(4KB)
向量空间模型文档相似度计算实现(C#).doc
Felomeng.VSMSimilarity
----Form1.cs(19KB)
----bin()
--------Debug()
----obj()
--------Debug()
----Properties()
--------Resources.Designer.cs(3KB)
--------Settings.settings(249B)
--------Resources.resx(5KB)
--------Settings.Designer.cs(1KB)
--------AssemblyInfo.cs(1KB)
----Program.cs(503B)
----InAndOut.cs(1KB)
----Form1.Designer.cs(8KB)
----SVMModle.cs(5KB)
----Felomeng.VSMSimilarity.csproj(4KB)
----Form1.resx(6KB)
----app.config(77B)

网友评论

  • 运行出来了,还不错
  • 还没用过 不好评论
  • 还没研究出来,再试试
  • 运行出来了,还不错
  • 本来想参照一下算法,但是发现这个算法不是很好,而且很耗资源
  • 没运行出来,我再研究一下
  • 还是有用的
  • 呜呜呜,没运行出来。可能是个人原因。
  • 不错,很有借鉴作用
  • 还好吧,有点帮助,不过效率真的不高
  • 不用数据库么?。。。。
  • 只能说很一般,对比了下我写的算法,你的算法性能还是差了点,原以为会从你的算法里借鉴到更好的方法,...
  • 程序不错,就是算法效率很慢。。
  • 使用说明都没有,不好用。
  • 算法有比较好的说明,容易理解,效率一般
  • 没仔细看,但是运行出错啊
  • 不错很实用!具有借鉴意义
  • 很详细,有算法介绍,小巧实用
  • 不错,很有帮助
  • 不错,比较容易理解,但是效率一般
  • 一开始运行就卡死了
  • 很好,容易理解,谢谢!
  • 不错,有简单的算法说明。
  • 算法有比较好的说明,这个很好。
  • 感谢楼主额无私奉献精神!也是用的向量空间法。内容很详细,包括原理说明、测试代码、以及测试语料。
  • 很详细,有算法介绍文档。
  • 很详细,有算法介绍文档。下载描述中说有在SQL Server 2005上实现,我还真以为有通过SQL Server 2005来实现呢。 如果真能根数据库结合起来用,如:查询数据库中的文章内容跟待发文章的内容相似度大于某个值。可以这样操作就好了。
  • 用不了,运行就报错!
  • 不错,有简单的算法说明。