OpenCV2马拉松第22圈——Hough变换直线检測原理与实现

时间:2022-12-20 21:03:30
计算机视觉讨论群162501053

收入囊中
  • Hough变换
  • 概率Hough变换
  • 自己实现Hough变换直线检測

葵花宝典
先看一下我实现的效果图
OpenCV2马拉松第22圈——Hough变换直线检測原理与实现

以下,我们进入Hough变换的原理解说。
OpenCV2马拉松第22圈——Hough变换直线检測原理与实现
看上图,我们知道,经过一点(x0,y0)的直线能够表示成y0 = mox + b0
反过来看方程,b = –x0m + y0
,于是我们从原来的坐标系转移到了Hough空间,m是横坐标,b是纵坐标

OpenCV2马拉松第22圈——Hough变换直线检測原理与实现
刚才提到,经过(x0,y0)的直线具有的特征是b = –x0m
+ y0,在Hough空间下也是一条直线,
那么经过(x1,y1)的直线具有的特征是b = -x1m + y1,在Hough空间下是还有一条直线。
两条直线的相交点的(m,b)就是经过(x0,y0)(x1,y1)的直线,这个应该能够理解吧。
于是就有了一个简单的想法,对于每个点,在Hough空间中都画出一条直线,对于每条直线经过的点,都填充在例如以下的 Hough空间中,看哪交点多,就能确定。我们用一个二维数组表示Hough空间,例如以下。最后就变成数哪些格子的值比較高。
OpenCV2马拉松第22圈——Hough变换直线检測原理与实现
可是,用m和b有局限性。由于m是能够取到无穷大的,所以这个特征仅仅在理论上可行...实际上我们不可能申请一个无限大的二维数组。

自然而然,我们想到了极坐标,在极坐标下,就没有这个限制了。
OpenCV2马拉松第22圈——Hough变换直线检測原理与实现在极坐标下,我们的直线能够写成:OpenCV2马拉松第22圈——Hough变换直线检測原理与实现
也就是:OpenCV2马拉松第22圈——Hough变换直线检測原理与实现
经过点(x0,y0)的直线:OpenCV2马拉松第22圈——Hough变换直线检測原理与实现
当x0 = 8, y0 = 6,我们有这种图
OpenCV2马拉松第22圈——Hough变换直线检測原理与实现我们在以下仅仅考虑OpenCV2马拉松第22圈——Hough变换直线检測原理与实现 而且 OpenCV2马拉松第22圈——Hough变换直线检測原理与实现.

我们还有2个点,OpenCV2马拉松第22圈——Hough变换直线检測原理与实现OpenCV2马拉松第22圈——Hough变换直线检測原理与实现 
     OpenCV2马拉松第22圈——Hough变换直线检測原理与实现OpenCV2马拉松第22圈——Hough变换直线检測原理与实现,就能够绘制出以下的图形
OpenCV2马拉松第22圈——Hough变换直线检測原理与实现这3条直线相交于OpenCV2马拉松第22圈——Hough变换直线检測原理与实现,
也就是说 (OpenCV2马拉松第22圈——Hough变换直线检測原理与实现)
OpenCV2马拉松第22圈——Hough变换直线检測原理与实现 是这3个点 OpenCV2马拉松第22圈——Hough变换直线检測原理与实现OpenCV2马拉松第22圈——Hough变换直线检測原理与实现  OpenCV2马拉松第22圈——Hough变换直线检測原理与实现共同经过的直线!

因此,我们有了算法雏形                                       OpenCV2马拉松第22圈——Hough变换直线检測原理与实现

• 初始化H( Hough空间的二维数组)全为0
• 遍历图片的 (x,y) 
For θ = 0 to 360

      ρ = xcos θ + y sin θ

      H(θ, ρ) = H(θ,ρ) + 1

    end

end
• Find the value(s) of (θ, ρ)where H(θ, ρ)is a local maximum
• Thedetected line in the image is given by  ρ = xcos θ + y sin θ

看以下的图片,当都一条直线时,Hough空间的某个区域就会非常亮,取局部极大值就能够

OpenCV2马拉松第22圈——Hough变换直线检測原理与实现

一张更复杂的图片
OpenCV2马拉松第22圈——Hough变换直线检測原理与实现


初识API
C++: void HoughLines(InputArray image,
OutputArray lines, double rho, double theta, int threshold, double srn=0, double stn=0 )
 
  • image – 8-bit,单通道二值图(有可能被函数改变)
  • lines – 输出vector,是 OpenCV2马拉松第22圈——Hough变换直线检測原理与实现 的vector. OpenCV2马拉松第22圈——Hough变换直线检測原理与实现 是距离原点距离OpenCV2马拉松第22圈——Hough变换直线检測原理与实现 (图片左上角[0,0]处). OpenCV2马拉松第22圈——Hough变换直线检測原理与实现 
    OpenCV2马拉松第22圈——Hough变换直线检測原理与实现 ).
  • rho – 累加器的半径resolution
  • theta – 累加器的theta resulution
  • threshold – 返回Hough空间中 ( OpenCV2马拉松第22圈——Hough变换直线检測原理与实现 ).的点
  • srn – For the multi-scale Hough transform, it is a divisor for the distance resolution rho .
    The coarse accumulator distance resolution is rho and the accurate accumulator resolution is rho/srn .
    If both srn=0 and stn=0 ,
    the classical Hough transform is used. Otherwise, both these parameters should be positive.
  • stn – For the multi-scale Hough transform, it is a divisor for the distance resolution theta.
C++: void HoughLinesP(InputArray image,
OutputArray lines, double rho, double theta, int threshold, double minLineLength=0, doublemaxLineGap=0 )
 
  • image –8-bit,单通道二值图(有可能被函数改变)
  • lines – 输出向量是4-element vector OpenCV2马拉松第22圈——Hough变换直线检測原理与实现 ,
     OpenCV2马拉松第22圈——Hough变换直线检測原理与实现 是起点 OpenCV2马拉松第22圈——Hough变换直线检測原理与实现 是终点
  • rho – Distance resolution of the accumulator in pixels.
  • theta – Angle resolution of the accumulator in radians.
  • threshold – Accumulator threshold parameter. Only those lines are returned that get enough votes ( OpenCV2马拉松第22圈——Hough变换直线检測原理与实现 ).
  • minLineLength – 最小长度,小于这个值不被觉得是线段
  • maxLineGap – 两个点之间最大的gap,当小于这个值两个点就被觉得是同一线段的点

荷枪实弹
还是先贴出官方sample
#include <cv.h>
#include <highgui.h>
#include <math.h> using namespace cv; int main(int argc, char** argv)
{
Mat src, dst, color_dst;
if( argc != 2 || !(src=imread(argv[1], 0)).data)
return -1; Canny( src, dst, 50, 200, 3 );
cvtColor( dst, color_dst, CV_GRAY2BGR ); #if 0
vector<Vec2f> lines;
HoughLines( dst, lines, 1, CV_PI/180, 100 ); for( size_t i = 0; i < lines.size(); i++ )
{
float rho = lines[i][0];
float theta = lines[i][1];
double a = cos(theta), b = sin(theta);
double x0 = a*rho, y0 = b*rho;
Point pt1(cvRound(x0 + 1000*(-b)),
cvRound(y0 + 1000*(a)));
Point pt2(cvRound(x0 - 1000*(-b)),
cvRound(y0 - 1000*(a)));
line( color_dst, pt1, pt2, Scalar(0,0,255), 3, 8 );
}
#else
vector<Vec4i> lines;
HoughLinesP( dst, lines, 1, CV_PI/180, 80, 30, 10 );
for( size_t i = 0; i < lines.size(); i++ )
{
line( color_dst, Point(lines[i][0], lines[i][1]),
Point(lines[i][2], lines[i][3]), Scalar(0,0,255), 3, 8 );
}
#endif
namedWindow( "Source", 1 );
imshow( "Source", src ); namedWindow( "Detected Lines", 1 );
imshow( "Detected Lines", color_dst ); waitKey(0);
return 0;
}

假如我们想检測直线,就能够用第一个API,由于这个API返回的是直线的两个參数

假设想检測图片中的线段,就用第二个API,由于这个 API返回的是起点和终点

以下看下我自己的实现,首先是弧度及结构体的定义
const double pi = 3.1415926f;
const double RADIAN = 180.0/pi; struct line
{
int theta;
int r;
};

接下来是变换到Hough空间,填充二维数组

vector<struct line> houghLine(Mat &img, int threshold)
{
vector<struct line> lines;
int diagonal = floor(sqrt(img.rows*img.rows + img.cols*img.cols));
vector< vector<int> >p(360 ,vector<int>(diagonal)); for( int j = 0; j < img.rows ; j++ ) {
for( int i = 0; i < img.cols; i++ ) {
if( img.at<unsigned char>(j,i) > 0)
{
for(int theta = 0;theta < 360;theta++)
{
int r = floor(i*cos(theta/RADIAN) + j*sin(theta/RADIAN));
if(r < 0)
continue;
p[theta][r]++;
}
}
}
} //get local maximum
for( int theta = 0;theta < 360;theta++)
{
for( int r = 0;r < diagonal;r++)
{
int thetaLeft = max(0,theta-1);
int thetaRight = min(359,theta+1);
int rLeft = max(0,r-1);
int rRight = min(diagonal-1,r+1);
int tmp = p[theta][r];
if( tmp > threshold
&& tmp > p[thetaLeft][rLeft] && tmp > p[thetaLeft][r] && tmp > p[thetaLeft][rRight]
&& tmp > p[theta][rLeft] && tmp > p[theta][rRight]
&& tmp > p[thetaRight][rLeft] && tmp > p[thetaRight][r] && tmp > p[thetaRight][rRight])
{
struct line newline;
newline.theta = theta;
newline.r = r;
lines.push_back(newline);
}
}
} return lines;
}

最后是画直线的函数

void drawLines(Mat &img, const vector<struct line> &lines)
{
for(int i = 0;i < lines.size();i++)
{
vector<Point> points;
int theta = lines[i].theta;
int r = lines[i].r; double ct = cos(theta/RADIAN);
double st = sin(theta/RADIAN); //r = x*ct + y*st
//left
int y = int(r/st);
if(y >= 0 && y < img.rows){
Point p(0, y);
points.push_back(p);
}
//right
y = int((r-ct*(img.cols-1))/st);
if(y >= 0 && y < img.rows){
Point p(img.cols-1, y);
points.push_back(p);
}
//top
int x = int(r/ct);
if(x >= 0 && x < img.cols){
Point p(x, 0);
points.push_back(p);
}
//down
x = int((r-st*(img.rows-1))/ct);
if(x >= 0 && x < img.cols){
Point p(x, img.rows-1);
points.push_back(p);
} cv::line( img, points[0], points[1], Scalar(0,0,255), 1, CV_AA);
}
}

完整代码

#include "opencv2/imgproc/imgproc.hpp"
#include "opencv2/highgui/highgui.hpp"
#include <iostream>
#include <vector>
#include <cmath>
using namespace cv;
using namespace std; const double pi = 3.1415926f;
const double RADIAN = 180.0/pi; struct line
{
int theta;
int r;
}; /*
* r = xcos(theta) + ysin(theta)
*/
vector<struct line> houghLine(Mat &img, int threshold)
{
vector<struct line> lines;
int diagonal = floor(sqrt(img.rows*img.rows + img.cols*img.cols));
vector< vector<int> >p(360 ,vector<int>(diagonal)); for( int j = 0; j < img.rows ; j++ ) {
for( int i = 0; i < img.cols; i++ ) {
if( img.at<unsigned char>(j,i) > 0)
{
for(int theta = 0;theta < 360;theta++)
{
int r = floor(i*cos(theta/RADIAN) + j*sin(theta/RADIAN));
if(r < 0)
continue;
p[theta][r]++;
}
}
}
} //get local maximum
for( int theta = 0;theta < 360;theta++)
{
for( int r = 0;r < diagonal;r++)
{
int thetaLeft = max(0,theta-1);
int thetaRight = min(359,theta+1);
int rLeft = max(0,r-1);
int rRight = min(diagonal-1,r+1);
int tmp = p[theta][r];
if( tmp > threshold
&& tmp > p[thetaLeft][rLeft] && tmp > p[thetaLeft][r] && tmp > p[thetaLeft][rRight]
&& tmp > p[theta][rLeft] && tmp > p[theta][rRight]
&& tmp > p[thetaRight][rLeft] && tmp > p[thetaRight][r] && tmp > p[thetaRight][rRight])
{
struct line newline;
newline.theta = theta;
newline.r = r;
lines.push_back(newline);
}
}
} return lines;
} void drawLines(Mat &img, const vector<struct line> &lines)
{
for(int i = 0;i < lines.size();i++)
{
vector<Point> points;
int theta = lines[i].theta;
int r = lines[i].r; double ct = cos(theta/RADIAN);
double st = sin(theta/RADIAN); //r = x*ct + y*st
//left
int y = int(r/st);
if(y >= 0 && y < img.rows){
Point p(0, y);
points.push_back(p);
}
//right
y = int((r-ct*(img.cols-1))/st);
if(y >= 0 && y < img.rows){
Point p(img.cols-1, y);
points.push_back(p);
}
//top
int x = int(r/ct);
if(x >= 0 && x < img.cols){
Point p(x, 0);
points.push_back(p);
}
//down
x = int((r-st*(img.rows-1))/ct);
if(x >= 0 && x < img.cols){
Point p(x, img.rows-1);
points.push_back(p);
} cv::line( img, points[0], points[1], Scalar(0,0,255), 1, CV_AA);
}
} int main( int, char** argv )
{
Mat src,src_gray,edge;
src = imread( argv[1] );
cvtColor( src, src_gray, CV_BGR2GRAY ); blur( src_gray, src_gray, Size(3,3) );
Canny( src_gray, edge, 50, 200);
vector<struct line> lines = houghLine(edge, 90);
drawLines(src, lines); namedWindow("result", 1);
imshow("result", src);
waitKey(); return 0;
}


举一反三

概率Hough变换在基本算法上添加了比較少的改动。之前是逐行扫描,如今则是随机选点。每当累加器的一个条目达到指定的最小值,就沿这条直线的方向扫描,并且将通过它的全部点删除(即使它们还没有參与投票)。并且该扫描还确定被接受的线段的长度。为此,该算法定义了两个附加參数。一个是被接受线段的最小长度,而还有一个是被同意以形成连续的段的最大距离。这个附加步骤添加了算法的复杂性,可是复杂性带来的效率损失被较少的点会參与投票过程补偿。

我们再来看一看其它形状在二维 Hough空间的样子
OpenCV2马拉松第22圈——Hough变换直线检測原理与实现
OpenCV2马拉松第22圈——Hough变换直线检測原理与实现

我们再考虑一下噪声的影响

OpenCV2马拉松第22圈——Hough变换直线检測原理与实现
噪声使得峰值定位非常难

OpenCV2马拉松第22圈——Hough变换直线检測原理与实现噪声程度越厉害,结果越不准确

解决噪声问题的算法:
OpenCV2马拉松第22圈——Hough变换直线检測原理与实现
这个算法也不复杂,对于一个点,我们曾经要遍历[0,360]的角度,可是如今,这个角度就直接被我们取出来了,速度也有非常大的提升,非常不错的算法。

OpenCV2马拉松第22圈——Hough变换直线检測原理与实现的更多相关文章

  1. openCV2马拉松第19圈——Harris角点检測(自己实现)

    计算机视觉讨论群162501053 转载请注明:http://blog.csdn.net/abcd1992719g/article/details/26824529 收入囊中 使用OpenCV的con ...

  2. OpenCV2马拉松第15圈——边缘检測&lpar;Laplace算子,LOG算子&rpar;

    收入囊中 拉普拉斯算子 LOG算子(高斯拉普拉斯算子) OpenCV Laplacian函数 构建自己的拉普拉斯算子 利用拉普拉斯算子进行图像的锐化 葵花宝典 在OpenCV2马拉松第14圈--边缘检 ...

  3. OpenCV2马拉松第17圈——边缘检測&lpar;Canny边缘检測&rpar;

    计算机视觉讨论群162501053 转载请注明:http://blog.csdn.net/abcd1992719g 收入囊中 利用OpenCV Canny函数进行边缘检測 掌握Canny算法基本理论 ...

  4. OpenCV2马拉松第14圈——边缘检測&lpar;Sobel&comma;prewitt&comma;roberts&rpar;

    收入囊中 差分在边缘检測的角色 Sobel算子 OpenCV sobel函数 OpenCV Scharr函数 prewitt算子 Roberts算子 葵花宝典 差分在边缘检測究竟有什么用呢?先看以下的 ...

  5. OpenCV2马拉松第25圈——直线拟合与RANSAC算法

    计算机视觉讨论群162501053 转载请注明:http://blog.csdn.net/abcd1992719g/article/details/28118095 收入囊中 最小二乘法(least ...

  6. OpenCV2马拉松第5圈——线性滤波

    收入囊中 这里的非常多内容事实上在我的Computer Vision: Algorithms and ApplicationsのImage processing中都有讲过 相关和卷积工作原理 边界处理 ...

  7. openCV2马拉松第18圈——坐标变换

    计算机视觉讨论群162501053 转载请注明:http://blog.csdn.net/abcd1992719g 收入囊中 仿射变换 坐标映射 利用坐标映射做一些效果,例如以下 watermark/ ...

  8. OpenCV2马拉松第9圈——再谈对照度&lpar;对照度拉伸,直方图均衡化&rpar;

    收入囊中 lookup table 对照度拉伸 直方图均衡化 葵花宝典 lookup table是什么东西呢? 举个样例,假设你想把图像颠倒一下,f[i] = 255-f[i],你会怎么做? for( ...

  9. OpenCV2马拉松第2圈——读写图片

    收入囊中 用imread读取图片 用nameWindow和imshow展示图片 cvtColor彩色图像灰度化 imwrite写图像 Luv色彩空间转换 初识API 图像读取接口 image = im ...

随机推荐

  1. iOScollectionView广告无限滚动&lpar;Swift实现&rpar;

    今天公司里的实习生跑过来问我一般App上广告的无限滚动是怎么实现的,刚好很久没写博客了,就决定写下了,尽量帮助那些处于刚学iOS的程序猿. 做一个小demo,大概实现效果如下图所示: 基本实现思路: ...

  2. 算法(第4版)-1&period;3&period;1 API

    总结:本小节介绍了泛型.自动装箱.迭代.Bag.Queue.Stack以及一个栈用例的经典例子--算术表达式求值. 重点: 1. 集合类的抽象数据类型的一个关键特性是我们应该可以用它们储存任意类型的数 ...

  3. 【Heritrix基础教程之1】在Eclipse中配置Heritrix

    一.新建项目并将Heritrix源代码导入 1.下载heritrix-1.14.4-src.zip和heritrix-1.14.4.zip两个压缩包,并解压,以后分别简称SRC包和ZIP包: 2.在E ...

  4. bzoj1864 &lbrack;Zjoi2006&rsqb;三色二叉树

    Description Input 仅有一行,不超过500000个字符,表示一个二叉树序列. Output 输出文件也只有一行,包含两个数,依次表示最多和最少有多少个点能够被染成绿色. Sample ...

  5. PHP草根论之设计模式-訪问者模式

    关于模式本身的概念,请參考网上其他文章 此处仅仅讨论在PHP实际开发过程中的应用 此模式适用范围极为受限,适用情景: 1.适用于项目维护过程,不适用于项目开发过程 2.新增需求,要求为一个/多个类添加 ...

  6. git学习02 - log查看&amp&semi;版本回退

    1.查看更新记录 git log /  git log --pretty=oneline D:\learn\git_test>git log commit a915e7b12076673d778 ...

  7. java第一天 数据类型、变量的命名、类型的转换

    数据类型 /* 数据类型:Java是一种强类型语言,针对每一种数据都给出了明确的数据类型 数据类型分类: A:基本数据类型 B:引用数据类型(类,接口,数组) 基本数据类型:4类8种 A:整数 字节 ...

  8. 初窥scrapy爬虫

    2017-10-30  21:49:55 前言: 初步使用scrapy爬虫框架,爬取各个网站信息 系统环境: 64位win10系统,装有64位python3.6,IDE为pycharm,使用cmd命令 ...

  9. iOS UI-表格控制器(UITableView)-基本使用

    tableView的常见属性 cell的常见属性 一.一般情况 #import "ViewController.h" @interface ViewController ()&lt ...

  10. Educational Codeforces Round 59

    B. Digital root 题意: 题目定义了x的digital root是S(x).S(5)=5,S(38)=S(3+8=11)=S(1+1+2)=2. 有n个询问,每次询问给出ki和xi,要你 ...