词袋的代码

时间:2016-01-30 17:25:20
【文件属性】:
文件名称:词袋的代码
文件大小:466KB
文件格式:ZIP
更新时间:2016-01-30 17:25:20
数据挖掘 词袋 BOW BOW模型即是bag of words,Bag-of-words模型是信息检索领域常用的文档表示方法。在信息检索中,BOW模型假定对于一个文档,忽略它的单词顺序和语法、句法等要素,将其仅仅看作是若干个词汇的集合,文档中每个单词的出现都是独立的,不依赖于其它单词是否出现。也就是说,文档中任意一个位置出现的任何单词,都不受该文档语意影响而独立选择的。
【文件预览】:
PG_SPBOW
----CompilePyramid.m(5KB)
----EuclideanDistance.m(1KB)
----do_normalize.m(875B)
----make_dir.m(220B)
----main.m(2KB)
----CalculateDictionary.m(4KB)
----images()
--------event_007.jpg(28KB)
--------event_001.jpg(51KB)
--------event_002.jpg(63KB)
--------event_006.jpg(38KB)
--------event_008.jpg(38KB)
--------event_009.jpg(28KB)
--------event_011.jpg(18KB)
--------event_004.jpg(52KB)
--------event_005.jpg(39KB)
--------event_010.jpg(53KB)
--------event_003.jpg(48KB)
----make_directory_structure.m(503B)
----normalize_sift.m(647B)
----load_image.m(151B)
----GenerateSiftDescriptors.m(3KB)
----data()
----find_sift_grid.m(4KB)
----readme.txt(894B)
----num2string.m(324B)
----do_assignment.m(3KB)

网友评论

  • 不如直接用weka的StringToWordVector获得词向量。
  • 资源应该详细说明
  • 代码是Matlab的,看不懂
  • 对学习有点帮助
  • 分类在JAVA中,代码是Matlab的