在本文中,稀疏表示的原理不再具体讲解,有需要的同学请自行百度。
本文采用OMP算法来求解稀疏系数。首先随机生成字典数据和待测试数据
字典数据:
dic =[
6, 7, 9, 9, 7, 0, 6, 3, 6, 9;
1, 8, 7, 8, 5, 3, 8, 1, 7, 3;
3, 3, 5, 4, 8, 2, 6, 1, 2, 2;
6, 1, 0, 7, 3, 5, 0, 6, 3, 3;
7, 5, 0, 5, 3, 0, 2, 7, 1, 7];
这是一个5*10的矩阵,行数代表维度,列数代表样本数。列数在字典中也叫字典原子,此处有10个原子,原子数大于维数,符合过完备要求。
信号数据:
signal=[ 9; 8; 8; 3; 9];
为了简便,只模拟了一个信号数据,是一个5*1的矩阵,如果有多个数据,则应该是5*n的矩阵。求解的时候,可用循环求解。
一、在matlab中实现稀疏表示,求解稀疏系数
clc;close all;clear all;
dic =[
, , , , , , , , , ;
, , , , , , , , , ;
, , , , , , , , , ;
, , , , , , , , , ;
, , , , , , , , , ]; %字典
signal=[ ; ; ; ; ]; %原始信号
dic=dic*diag(./sqrt(sum(dic.^))); %字典原子单位化,即每列的norm为1
signal=signal/norm(signal); %信号单位化
[A,res]=OMP(dic,signal,); %稀疏度设定为6,即非零元素最多为6个
A %输出系数
res %输出残差
epsilon=norm(signal-dic*A) %验证残差 ||Y-Dx||
其中OMP算法:
%OMP计算稀疏系数
function [A,res]=OMP(D,X,L)
% 输入参数:
% D - 过完备字典,注意:必须字典的各列必须经过了规范化
% X - 信号
% L - 稀疏度,系数中非零元个数的最大值
% 输出参数:
% A - 当前信号的系数
% res - 残差 %%
residual=X; %初始化残差
indx=zeros(L,1);
for i=1:L,
proj=D'*residual;%D转置与residual相乘,得到与residual与D每一列的内积值
[~,pos]=max(abs(proj));%找到内积最大值的位置
pos=pos(1);%若最大值不止一个,取第一个
indx(i)=pos;%将这个位置存入索引集的第j个值
a=pinv(D(:,indx(1:i)))*X;%indx(1:j)表示第一列前j个元素
residual=X-D(:,indx(1:i))*a;
res=norm(residual);
if res< 1e-6
break;
end
end
A=zeros(size(D,2),1);
A(indx(indx~=0))=a;
end
结果:
A = 0.1450
0.9391 0.4210
0.1049 -0.5503 res = 3.1402e-16 epsilon = 3.1402e-16
从系数中可以看出,从10个原子共选出了5个原子进行表示,最后的残差非常小,说明稀疏表示的结果和原数据非常接近。
二、在opencv2中实现稀疏表示
void getData(Mat &data, Mat &signal);
int main(int argc, char* argv[])
{
Mat dic, signal;
getData(dic, signal); //获取模拟数据
Mat temp(, dic.cols, CV_32F); //用一个矩阵保存每个原子的模长
for (int i = ; i<dic.cols; i++)
{
temp.col(i) = norm(dic.col(i)); //每个原子的模长
}
divide(dic, repeat(temp, dic.rows, ), dic); //字典原子单位化
signal = signal / norm(signal); //信号单位化
Mat A=src.OMP(dic, signal, ); //调用OPM求解
float res =(float)norm(signal - dic*A); //计算残差
cout << "系数:" <<endl<< A << endl;
cout<<endl<<"残差:"<< endl<<res << endl; //输出残差
waitKey();
return ;
}
void getData(Mat &dic, Mat &signal)
{
dic = (Mat_<float>(, ) <<
, , , , , , , , , ,
, , , , , , , , , ,
, , , , , , , , , ,
, , , , , , , , , ,
, , , , , , , , , );
signal = (Mat_<float>(, ) << , , , , );
}
其中,OMP函数为:
Mat SRC::OMP(Mat& dic, Mat& signal,int sparsity) {
if (signal.cols>)
{
cout << "wrong signal" << endl;
exit(-);
}
vector<int> selectedAtomOrder; //保存所有选出的字典原子序号
Mat coef(dic.cols, , CV_32F, Scalar::all()); //需要返回的系数
Mat residual = signal.clone(); //初始化残差
Mat indx(, , CV_32F);//初始化临时系数
Mat phi; //保存已选出的原子向量
float max_coefficient;
unsigned int atomOrder; //每次所选择的原子的序号 for (;;)
{
max_coefficient = ;
//取出内积最大列
for (int i = ; i <dic.cols; i++)
{
float coefficient = (float)dic.col(i).dot(residual); if (abs(coefficient) > abs(max_coefficient))
{
max_coefficient = coefficient;
atomOrder = i;
}
}
selectedAtomOrder.push_back(atomOrder); //添加选出的原子序号
Mat& temp_atom = dic.col(atomOrder); //取出该原子
if (phi.cols == )
phi = temp_atom;
else
hconcat(phi, temp_atom, phi); //将新原子合并到原子集合中(都是列向量) indx.push_back(0.0f); //对系数矩阵新加一项
solve(phi, signal, indx, DECOMP_SVD); //求解最小二乘问题
residual = signal - phi*indx; //更新残差
float res_norm = (float)norm(residual);
if (indx.rows >= sparsity || res_norm <= 1e-) //如果残差小于阈值或达到要求的稀疏度,就返回
{
for (int k = ; k < selectedAtomOrder.size(); k++)
{
coef.row(selectedAtomOrder[k]).setTo(indx.row(k)); //得到最终的系数
}
return coef;
}
}
}
最终输出结果为:
系数:
[0.14503297;
0.9391216;
;
;
0.42096639;
0.1048916;
;
;
-0.55029994;
] 残差:
1.70999e-007
看以看出,opencv得到的系数和matlab得到的系数基本是一样,只是小数点后保留的位数区别。因为小数位数不相同,所以最后残差有点不同,但不影响最终结果,我们只需要系数相同即可。