摘要:本文主要介绍了机器视觉中采集卡及视频信号的基础知识和基本原理以及与图像采集卡相关技术名词,并详细介绍了为机器视觉系统选择采集卡时要考虑的重点。
1. 视频基础
成像产品可以帮助你采样和分析以视频信号为载体的视频信息。电子采样通过工作在主机平台内的(如PC机)采集卡这种视频捕捉设备来完成。采集卡把由视频信号源提供的图像转换为数据阵列,该数据阵列可被数字化存贮、处理、增强,然后被分析或显示在视频监视器上。
当对视频信号进行电子采样时(通常称之为图像获取),我们首先应该知道我们在使用的是哪种视频信号。这部分内容介绍了一些有关视频信号的基本知识。
1.1 信号种类与视频格式
视频信号有多种信号源,包括:视频相机、可携式摄像机、录像机、电视广播、X射线设备、扫描电子显微镜、CT扫描器等等。这些信号源或者提供复合视频信号(信号中包含视频数据和时钟信息)或非标准视频信号(其视频和时钟可以有多种不同的格式)。
标准复合视频信号有以下几种制式:
1.1.1 RS-170
用于北美和日本。这种黑白复合视频信号的空间分辨率为640*480,RS-170工作在60Hz,即30FPS。
1.1.2 NTSC/RS-330
用于北美和日本。这种视频信号除了增加了色彩信息,其它方面和RS-170一致。此信号类型于20世纪50年代被国家电视系统委员会(NTSC)制定标准。
1.1.3 CCIR
此复合信号最先用于北欧,根据一个国际标准组织-国际射线顾问委员会(CCIR)而命名。此黑白视频信号的空间分辨率为768*576,工作于50Hz,即25FPS。
1.1.4 PAL
用于北欧。这种视频信号除了增加了色彩信息,其它方面和CCIR一致。PAL是其应用的一种技术Phase Alteration Line的缩写。
1.1.5 SECAM
用于法国、俄罗斯等。其参数与PAL一致。
非标准视频信号没有固定的空间分辨率、信号时钟以及信号特征。只有查阅信号源所提供的技术文档才能确定这些参数。
1.2 空间分辨率
空间分辨率定义了一幅图像的行与列的元素数。行定义了图像的长度,由线数来描述;列定义了图像的宽度,由像素数来描述。对于标准的RS-170/NTSC图像,其空间分辨率为640*480;对于标准的CCIR/PAL图像,其空间分辨率为768*576。见图1。
根据信号源或所用相机的不同,其空间分辨率可以从256 x 256 到4096 x 4096甚至更高。由于空间分辨率直接影响着图像的大小,大多应用只使用符合要求的分辨率。快速的图像传输和处理对于工业检测应用来说非常重要,其图像的空间分辨率通常为512*512。对于需要更高空间分辨率的应用,如高精度的标定和测量,经常会使用1024*1024或更高的分辨率。
1.3 宽高比
宽高比是指单个像素的宽度与高度之比。通常我们都需要宽高比为1:1,即像素的宽、高相等。一些输入信号源或相机和采集卡并不能产生或把视频数据转化为方形像素。这样经常会致使图像成为胚珠形或矩形。
宽高比对某些处理过程很重要,如当你试图通过以一个区域内的像素个数来确定其面积。如果宽高比不是1:1,你必须在图像处理中加以补尝或软件校正。
1.4 亮度分辨率
当视频数据被产生或转化时,还必须确定其亮度分辨率(有时也称为数字深度分辨率)。亮度分辨率定义了一幅图像中颜色的个数或梯度。这些梯度主要指灰度级(对于单色图像)或颜色的个数(对于彩色图像)。对于一幅标准的RS-170图像,其亮度分辨率为8bits或256灰度级(其术语通常为640*480*8)。常用的分辨率为8bits(256灰度级)、10bits(1024灰度级)、16bits(65536灰度级)或更高。图像的数据量会随着亮度分辨率增加。如:一幅标准的RS-170图像大约为307KB,而相同空间分辨率的一幅16bit的图像约为614KB,而24bit时约为922KB。
1.5 隔行与非隔行格式
视频信号中包含数行像素。水平同步脉冲把行与行之间分开。所有复合视频信号源,包括RS-170/NTSC、CCIR/PAL和非标准的信号源以隔行方式传送数据。隔行是指以两个称为“场”的独立部分来传送视频数据。奇数行的场先被传送,然后是偶数行。包含奇数场与偶数场的完整图像称为帧。
每场被顺序显示时我们会感觉每帧是以正常速度的两倍来显示的,场同步确定了什么时候一场结束什么时候一场开始。
在显示某些类型的图像时,如图形或细线时,隔行格式会导致图像闪烁。
一些非标准视频信号源以非隔行格式传送数据。这种过程有时被称为逐行扫描。非隔行格式是以一场来传送视频信号中所有行(奇数与偶数行)。
注意当被观察的物体运动时,通常选用逐行扫描会更加适合。因为隔行格式通常由于两场不能对齐会引起模糊或频率混淆。
1.6 帧频
帧频是指传送或显示帧的速度,通常以FPS(每秒帧数)来表示。RS170/NTSC图像通常为30fps,CCIR/PAL通常为25fps。帧频低于此数时会产生如同老式电影中所看到的跳动的效果。
2. 采集卡基本原理
采集卡有多种种类、规格。但尽管其设计和特性不同,大多数采集卡的基本原理相同。在此以基于PCI总线的模拟图像采集卡为例说明。
近年来,数字视频产品取得了显著发展。数字视频产品通常需要对动态图像进行实时采集和处理,因此产品性能受图像采集卡的性能影响很大。由于早期图像采集卡以帧存为核心,处理图像时需读写帧存,对于动态画面还需“冻结”图像,同时由于数据传输速率的限制,因此图像处理速度缓慢。90年代初,INTEL公司提出了PCI(Peripheral Component Interconnect)局部总线规范。PCI总线数据传宽度为32/64位,允许系统设备直接或间接连接其上,设备间可通过局部总线完成数据的快速传送,从而较好地解决了数据传输的瓶颈问题。
由于PCI总线的高速度,使A/D转换以后的数字视频信号只需经过一个简单的缓存器即可直接存到计算机内存,供计算机进行图像处理也可将采集到内存的图像信号传送到计算机显示卡显示;甚至可将`A/D输出的数字视频信号经PCI总线直接送到显示卡,在计算机终端上实时显示活动图像。基于PCI总线的图像采集系统框图如下图1所示。图中的缓存(数据锁存器)代替了帧存储器,这个缓存是一片容量小、控制简单的先进先出(FIFO)存储器,起到图像卡向PCI总线传送视频数据时的速度匹配作用。将图像卡插在计算机的PCI插槽中,与计算机内存、CPU、显示卡等之间形成调整数据传送。
由于PCI总线的上述优点,许多图像板卡公司陆续推出了基于PCI总线的图像采集卡。
3. 与图像采集卡相关技术名词
3.1 DMA
DMA( Direct Memory Access)是一种总线控制方式,它可取代CPU对总线的控制,在数据传输时根据数据源和目的的逻辑地址和物理地址映射关系,完成对数据的存取,这样可以大大减轻数据传输时CPU的负担。
3.2 Scatter/Gather Table
Scatter/Gather Table实际上就是一张供DMA传输时逻辑地址与物理地址的动态映射表。根据不同的板卡设计,这张表可直接位于采集卡的某个buffer模块内,称为硬件式的Scatter/Gather,它在PCI传输时的最高速度可达120M/s;此表也可位于主机的某段内存中,称为软件式的Scatter/Gather,传输的最高速度一般为80M/s。大部会PC系列采集卡都属于硬件式的Scatter/Gather。
3.3 LUT(Look-Up Table)
对于图像采集卡来说,LUT(Look-Up Table)实际上就是一张像素灰度值的映射表,它将实际采样到的像素灰度值经过一定的变换如阈值、反转、二值化、对比度调整、线性变换等,变成了另外一个与之对应的灰度值,如右图为一个8位的对应表。这样可以起到突出图像的有用信息,增强图像的光对比度的作用。很多PC系列卡具有8/10/12/16甚到32位的LUT,具体在LUT里进行什么样的变换是由软件来定义的。如下图2所示。
3.4 Planar Convertor
Planar Convertor能从以4位表示的彩色象素值中将R、G、B分量提取出来,然后在PCI传输时分别送到主机内存中三个独立的Buffer中,这样可以方便在后续的处理中对彩色信息的存取。在有些采集卡(如PC2Vision)中,它也可用于在三个黑白相机同步采集时将它们各自的象素值存于主机中三个独立的Buffer中。 如下图3所示。
3.5 Decimation
Decimation实际上是对原始图像进行子采样,如每隔2、4、8、16行(列)取一行(列)组成新的图像。Decimation可以大大减小原始图像的数据量,同时也降低了分辨率,有点类似于相机的Binning。如下图4所示。
3.6 PWG
PWG (Programmable Window Generator)指在获取的相机原始图像上开一个感趣的窗口,每次只存储和显示该窗口的内容,这样也可以在一定程度上减少数据量,但不会降低分辨率。
一般采集卡都有专门的寄存器存放有关窗口大小、起始点和终了点坐标的有关数据,这些数据都可通过软件设置。PC系列卡的窗口可在很大范围内变化,如PC-DIG最大可达64K*64K,最小可为1×1。如下图5所示。
3.7 Resequencing
Resequencing可以认为是一种对多通道或不同数据扫描方式的相机所输出数据的重组能力,即将来自CCD靶面不同区域或象素点的数据重新组合成一幅完整的图像。
3.8 Non-destructive overlay
overlay是指在视频数据显示窗口上覆盖的图形(如弹出式菜单,对话框等)或字符等非视频数据。Non-destructive overlay,即 “非破坏性覆盖”是相对于“破坏性覆盖”来说的,“破坏性覆盖”指显示窗口中的视频信息和覆盖信息被存放于显存中的同一段存储空间内,而“非破坏性覆盖”指视频信息与覆盖信息分别存放于显存中两段不同的存储空间中,显示窗口中所显示的信息是这两段地址空间中所存数据的迭加。如果采用“破坏性覆盖”,显存中的覆盖信息是靠CPU来刷新的,这样既占CPU时间又会在实时显示时由于不同步而带来闪烁,如果采用“非破坏性覆盖”则可消除这些不利因素。
3.9 PLL、XTAL和VScan
PLL、XTAL和VScan此为模拟采集卡的三种不同工作模式:
3.9.1 PLL(Phase Lock Loop)模式:相机向采集卡提供A/D转换的时钟信号,此时钟信号来自于相机输出的Video信号,HS和VS同步信号可以有三种来源:composite video, composite sync, separate sync;
3.9.2 XTAL模式:图像采集卡给相机提供时钟信号以及HD/VD信号,并用提供的时钟信号作为A/D转换的时钟,但同步信号仍可用相机输出的HS/VS;
3.9.3 VScan模式:由相机向分别卡提供Pixel Clock信号、HS和VS信号。
4. 选择采集卡要考虑的重点
4.1 接口制式,数据格式
接口制式包括数字(Camera Link、LVDS/RS422)、模拟(PAL、NTSC、CCIR、RS170/EIA、非标准模拟制式)一定与视觉系统所选用相机一致。如选用数字制式还必须考虑相机的数字位数。
4.2 模拟采集卡要考虑数字化精度
模拟采集卡的数字化精度主要包括两个方面即
4.2.1像素抖动Pixel Jitter
像素抖动是由图像采集卡的A/D转换器的采样时钟的误差产生的像元位置上的微小的错误从而导致对距离测量的错误。如图6所示。
4.2灰度噪音Grey-Scale Noise
图像采集卡的数字化转换的过程包括对模拟视频信号的放大和对其亮度(灰度值)进行测量。在此过程中会有一定的噪声和动态波动由图像采集卡的电路产生。
如像素抖动一样,灰度噪声将导致对距离测量的错误。典型的灰度噪声为0.7个灰度单元,表示为0.7LSB。
4.3 数字采集卡要考虑数据率大小
计算数字采集卡的数据率是否满足系统的要求可按下列公式计算:
Data Rate(Grabber)>1.2 * Data Rate(Camera)
Data Rate(Camera)=R * f * d / 8
式中Data Rate(Grabber)为采集卡的数据率,Data Rate(Camera)为相机的数据率,R为相机的分辨率,f为相机的帧频,d为相机的数字深度(或称灰度级)。
4.4 Memory大小, PCI总线的传输速率
PCI总线可支持BUS Master设备以132MB/s突发速率传输数据。而其平均持续数据传输率一般在50-90MB/s。
来自相机的数据总是以一个固定的速率传输的。如果PCI总线可以维持大于视频数据率的平均持续数据传输率,问题看起来就解决了。然而实际上并不是这么简单,PCI总线设备只能以突发的方式向总线传输数据。图像采集卡必须将每一突发之间的连续的图像数据保存起来。解决的方法就是采用On-board Memory。有些厂家出于经济方面的考虑去除了Memory而采用数据缓存队列(FIFO),FIFO的大小一般以足以保存一行图像数据为限。然而,当图像数据的速率大于PCI的持续数据传输率时FIFO就不起作用了。
4.5 相机控制信号及外触发信号
使图像采集卡的时序电路与外部视频信号的时序电路同步,需要采用锁相环电路或数字时钟同步电路。
外触发:由外部事件启动采集的过程。
同步触发:不改变相机与板卡之间的同步关系,采集从下一个场有效信号开始。
异步触发:改变相机与板卡的同步关系,采集从相机复位后的第一个场有效信号开始。
当视觉系统要对运动中目标进行检测时,相机和采集卡必须要具备异步触发的功能。
4.6 硬件系统的可靠性
硬件的可靠性在生产系统中是十分重要的,由设备故障而停产造成的损失远远大于设备本身。很多板卡厂家并没有标明如平均无故障时间等可靠性指标。
这里有两个经验性的技巧用以评估不同板卡的可靠性,板上的器件的数量和功耗。
试着去选择具有更低功耗的采集卡。在其它条件都同等的情况下一块复杂具有更多器件的卡会比器件较少的卡耗散更多的热量。好的设计会采用更多的ASIC(Application-specific integrated circuits)和可编程器件以减少电子器件的数量,而达到更高的功能。你还可以选择具有更少的无用功能的卡以减少不必要的麻烦。
过压保护是可靠性的一个重要指标。接近高压会在视频电缆产生很强的电涌,在视频输入端和I/O口加过压保护电路可保护采集卡不会被工业环境电磁干扰会产生的高压击穿。
4.7 支持软件的功能
大多采集卡的厂商多是把其采集卡和其专用图像处理软件捆绑销售的,因此在选择采集卡的同时还必须考虑此视觉系统要选用的软件与采集卡是否兼容。如Dalsa Coreco公司的图像处理软件WIT、Sapera、MVTools等只能在其Bandit系统、PC系列、X64系列、Viper系列等采集卡上使用,而Cognex公司的Vision Pro只能在其8100、8500系列采集卡上运行。
5.结束语
随着机器视觉技术的不断发展,采集卡的技术也在不断加强,功能也在不断更新。如何选择适合视觉系统的采集卡对于一个视觉系统能否正常运行将起到很关键的作用。
文章来源 http://www.nj-video.com/news/html/?435.html
更多关于机器视觉的精彩文章请登录 http://www.nj-video.com