Opencv 字符识别-分类器(SVM,KNearest,RTrees,Boost,MLP)

时间:2022-09-09 07:28:09

Opencv提供了几种分类器,例程里通过字符识别来进行说明的

1、支持向量机(SVM):给定训练样本,支持向量机建立一个超平面作为决策平面,使得正例和反例之间的隔离边缘被最大化。

函数原型:训练原型 cv2.SVM.train(trainData, responses[, varIdx[, sampleIdx[, params]]])

                   其中 trainData 为训练数据,responses为对应数据的标识,

2、K近邻(Knearest):K近邻是移动惰性学习法,当给定大量数据集时,该算法是计算密集的。最近邻方法是基于类比学习,即通过将给定的检验元组与和它相似的训练元组进行比较来学习。训练元组用n个属性来表示。当给定位置元组时,K近邻找出最接近未知元组的k个训练元组,未知元组被分配到k个最近邻中最多的类。

函数原型:cv2.KNearest.train(trainData, responses[, sampleIdx[, isRegression[, maxK[, updateBase]]]])

                   其中,trainData为训练数据,responses为对应的数据标识,isRegression表示回归运算还是训练,maxK为最大邻居数

3、随机树(RTrees):个体决策树的每个节点使用随机选择属性决定划分,每一棵树依赖于独立的抽样,并与森林中所有的树具有相同的分布的随即向量的值。分类时,每棵树都投票并且返回得票最多的类。

函数原型:cv2.RTrees.train(trainData, tflag, responses[, varIdx[, sampleIdx[, varType[, missingDataMask[, params]]]]])

                   其中trainData为训练数据,responses为对应的数据标识,tflag表示特征向量是行还是列表示,responses为表示对应数据标识

4、提升(Boost):权重赋予每个训练元组。迭代的学习k个分类器,学习到分类器Mi后,更新权重,使得其后的分类器Mi+1更关注误分类的训练元组。Adaboost是一种流行的提升算法。给定数据集D,它包含d个类标记的元组。开始对每个训练元组赋予相等的权重1/d。为组合分类器产生k个基分类器。在第i轮,从D中元组进行抽样,形成大小为d的训练集Di。使用有放回抽样--同一个元组可能被选中多次。每个元组被选中的机会由它的权重决定。从训练集Di导出分类器Mi。然后使用Di作为检验集计算Mi的误差。如果元组不正确的分类,则它的权重增加。如果元组正确的分类,则它的权重减少。权重越高越可能错误地分类。使用这些权重为下一轮分类器产生训练样本。

函数原型:cv2.Boost.train(trainData, tflag, responses[, varIdx[, sampleIdx[, varType[, missingDataMask[, params[, update]]]]]])

5、多层感知(MLP):多层感知器用于解决单层神经网络不能解决非线性分类问题而提出的,训练多层感知器的流行方法是反向传播,通过多层感知能够通过多个输入产生单一的输出达到分类的结果。

函数原型:cv2.ANN_MLP.train(inputs, outputs, sampleWeights[, sampleIdx[, params[, flags]]])

 

程序及注释:

[python] view plain copy
  1. #decoding:utf-8  
  2. import numpy as np  
  3. import cv2  
  4.   
  5. def load_base(fn):  
  6.     a = np.loadtxt(fn, np.float32, delimiter=',', converters={ 0 : lambda ch : ord(ch)-ord('A') })#导入的字母特征数据,并将字母转化为数字类别  
  7.     samples, responses = a[:,1:], a[:,0]#将类别给responses,特征给samples  
  8.     return samples, responses  
  9.   
  10. class LetterStatModel(object):  
  11.     class_n = 26  
  12.     train_ratio = 0.5  
  13.   
  14.     def load(self, fn):  
  15.         self.model.load(fn)  
  16.     def save(self, fn):  
  17.         self.model.save(fn)  
  18.       
  19.     def unroll_samples(self, samples):  
  20.         sample_n, var_n = samples.shape#获取特征维数和特征个数  
  21.         new_samples = np.zeros((sample_n * self.class_n, var_n+1), np.float32)  
  22.         new_samples[:,:-1] = np.repeat(samples, self.class_n, axis=0)  
  23.         new_samples[:,-1] = np.tile(np.arange(self.class_n), sample_n)  
  24.         return new_samples  
  25.       
  26.     def unroll_responses(self, responses):  
  27.         sample_n = len(responses)  
  28.         new_responses = np.zeros(sample_n*self.class_n, np.int32)  
  29.         resp_idx = np.int32( responses + np.arange(sample_n)*self.class_n )  
  30.         new_responses[resp_idx] = 1  
  31.         return new_responses  
  32.   
  33. class RTrees(LetterStatModel):  
  34.     def __init__(self):  
  35.         self.model = cv2.RTrees()  
  36.   
  37.     def train(self, samples, responses):  
  38.         sample_n, var_n = samples.shape  
  39.         var_types = np.array([cv2.CV_VAR_NUMERICAL] * var_n + [cv2.CV_VAR_CATEGORICAL], np.uint8)  
  40.         #CvRTParams(10,10,0,false,15,0,true,4,100,0.01f,CV_TERMCRIT_ITER));  
  41.         params = dict(max_depth=10 )  
  42.         self.model.train(samples, cv2.CV_ROW_SAMPLE, responses, varType = var_types, params = params)  
  43.   
  44.     def predict(self, samples):  
  45.         return np.float32( [self.model.predict(s) for s in samples] )  
  46.           
  47.   
  48. class KNearest(LetterStatModel):  
  49.     def __init__(self):  
  50.         self.model = cv2.KNearest()  
  51.   
  52.     def train(self, samples, responses):  
  53.         self.model.train(samples, responses)  
  54.   
  55.     def predict(self, samples):  
  56.         retval, results, neigh_resp, dists = self.model.find_nearest(samples, k = 10)  
  57.         return results.ravel()  
  58.   
  59.   
  60. class Boost(LetterStatModel):  
  61.     def __init__(self):  
  62.         self.model = cv2.Boost()  
  63.       
  64.     def train(self, samples, responses):  
  65.         sample_n, var_n = samples.shape  
  66.         new_samples = self.unroll_samples(samples)  
  67.         new_responses = self.unroll_responses(responses)  
  68.         var_types = np.array([cv2.CV_VAR_NUMERICAL] * var_n + [cv2.CV_VAR_CATEGORICAL, cv2.CV_VAR_CATEGORICAL], np.uint8)  
  69.         #CvBoostParams(CvBoost::REAL, 100, 0.95, 5, false, 0 )  
  70.         params = dict(max_depth=5#, use_surrogates=False)  
  71.         self.model.train(new_samples, cv2.CV_ROW_SAMPLE, new_responses, varType = var_types, params=params)  
  72.   
  73.     def predict(self, samples):  
  74.         new_samples = self.unroll_samples(samples)  
  75.         pred = np.array( [self.model.predict(s, returnSum = Truefor s in new_samples] )  
  76.         pred = pred.reshape(-1self.class_n).argmax(1)  
  77.         return pred  
  78.   
  79.   
  80. class SVM(LetterStatModel):  
  81.     train_ratio = 0.1  
  82.     def __init__(self):  
  83.         self.model = cv2.SVM()  
  84.   
  85.     def train(self, samples, responses):  
  86.         params = dict( kernel_type = cv2.SVM_LINEAR,   
  87.                        svm_type = cv2.SVM_C_SVC,  
  88.                        C = 1 )  
  89.         self.model.train(samples, responses, params = params)  
  90.   
  91.     def predict(self, samples):  
  92.         return np.float32( [self.model.predict(s) for s in samples] )  
  93.   
  94.   
  95. class MLP(LetterStatModel):  
  96.     def __init__(self):  
  97.         self.model = cv2.ANN_MLP()  
  98.   
  99.     def train(self, samples, responses):  
  100.         sample_n, var_n = samples.shape  
  101.         new_responses = self.unroll_responses(responses).reshape(-1self.class_n)  
  102.   
  103.         layer_sizes = np.int32([var_n, 100100self.class_n])  
  104.         self.model.create(layer_sizes)  
  105.           
  106.         # CvANN_MLP_TrainParams::BACKPROP,0.001  
  107.         params = dict( term_crit = (cv2.TERM_CRITERIA_COUNT, 3000.01),  
  108.                        train_method = cv2.ANN_MLP_TRAIN_PARAMS_BACKPROP,   
  109.                        bp_dw_scale = 0.001,  
  110.                        bp_moment_scale = 0.0 )  
  111.         self.model.train(samples, np.float32(new_responses), None, params = params)  
  112.   
  113.     def predict(self, samples):  
  114.         ret, resp = self.model.predict(samples)  
  115.         return resp.argmax(-1)  
  116.   
  117.   
  118. if __name__ == '__main__':  
  119.     import getopt  
  120.     import sys  
  121.   
  122.     models = [RTrees, KNearest, Boost, SVM, MLP] # NBayes  
  123.     models = dict( [(cls.__name__.lower(), clsfor cls in models] )#将名字之母字母转为小写  
  124.   
  125.     print 'USAGE: letter_recog.py [--model <model>] [--data <data fn>] [--load <model fn>] [--save <model fn>]'  
  126.     print 'Models: '', '.join(models)  
  127.     print  
  128.       
  129.     args, dummy = getopt.getopt(sys.argv[1:], '', ['model=''data=''load=''save='])  
  130.     args = dict(args)  
  131.     args.setdefault('--model''boost')  
  132.     args.setdefault('--data''../letter-recognition.data')  
  133.   
  134.     print 'loading data %s ...' % args['--data']  
  135.     samples, responses = load_base(args['--data'])  
  136.     Model = models[args['--model']]  
  137.     model = Model()  
  138.   
  139.     train_n = int(len(samples)*model.train_ratio)#获取训练数据的数目  
  140.     if '--load' in args:  
  141.         fn = args['--load']  
  142.         print 'loading model from %s ...' % fn  
  143.         model.load(fn)  
  144.     else:  
  145.         print 'training %s ...' % Model.__name__  
  146.         model.train(samples[:train_n], responses[:train_n])  
  147.   
  148.     print 'testing...'  
  149.     train_rate = np.mean(model.predict(samples[:train_n]) == responses[:train_n])#前一半进行训练,并得到训练准确率  
  150.     test_rate  = np.mean(model.predict(samples[train_n:]) == responses[train_n:])#后一半进行测试,并得到测试准确率  
  151.   
  152.     print 'train rate: %f  test rate: %f' % (train_rate*100, test_rate*100)  
  153.   
  154.     if '--save' in args:  
  155.         fn = args['--save']  
  156.         print 'saving model to %s ...' % fn  
  157.         model.save(fn)  
  158.     cv2.destroyAllWindows()               
Opencv 字符识别-分类器(SVM,KNearest,RTrees,Boost,MLP)


 

转自:http://blog.csdn.net/gjy095/article/details/9243153