BoW(Bag of Words)词袋模型.zip下载

【文件属性】：

文件名称：BoW(Bag of Words)词袋模型.zip

文件大小：117.35MB

文件格式：ZIP

更新时间：2022-11-25 06:25:21

bow python

本demo实现的是基于bow原理对图片进行分类，并实现对选取得测试集进行查找 BoW(Bag of Words)词袋模型最初被用在文本分类中，将文档表示成特征矢量。它的基本思想是假定对于一个文本，忽略其词序和语法、句法，仅仅将其看做是一些词汇的集合，而文本中的每个词汇都是独立的。简单说就是讲每篇文档都看成一个袋子（因为里面装的都是词汇，所以称为词袋，Bag of words即因此而来），然后看这个袋子里装的都是些什么词汇，将其分类。如果文档中猪、马、牛、羊、山谷、土地、拖拉机这样的词汇多些，而银行、大厦、汽车、公园这样的词汇少些，我们就倾向于判断它是一篇描绘乡村的文档，而不是描述城镇的。 serachFeatures.py中，前面主要是一些通过parse使得可以在敲命令行的时候可以向里面传递参数，后面就是提取SIFT特征，然后聚类，计算TF和IDF，得到单词直方图后再做一下L2归一化。一般在一幅图像中提取的到SIFT特征点是非常多的，而如果图像库很大的话，SIFT特征点会非常非常的多，直接聚类是非常困难的(内存不够，计算速度非常慢)，所以，为了解决这个问题，可以以牺牲检索精度为代价，在聚类的时候先对SIFT做降采样处理。最后对一些在在线查询时会用到的变量保存下来。对于某个图像库，我们可以在命令行里通过下面命令生成BoF。 query.py只能每次查找一张图片，并返回与之匹配度（递减）最接近的6张图片

立即下载

秒客网

BoW(Bag of Words)词袋模型.zip

网友评论

相关文章