一、前言
最近听了邹耀斌老师的数字图像处理新技术的专题课程,觉得数字图像处理真是一个比较新鲜的玩意,虽然这个学科早就出现了,而且一度发展不错,但是对于我来说可能真的是第一次具体去接触了解。不久之前我的一个电气学院的朋友和我说他在学习机器视觉,其实开始他给我谈论这个东西时,我不太清楚这个具体是什么。后来查找相关资料我才了解到计算机视觉,图像处理,图像分析,机器人视觉和机器视觉是彼此紧密关联的学科。之前在我看来这些学科好像没什么区别,我甚至不太清楚他们具体的分类方法,但是这并不影响我对它的好奇,因为这些学科真的给我们的生活带来了数不尽的变化,也真的算的上是过硬的科技结晶。所以我想用这一篇文章来浅谈计算机视觉。
二、理解计算机视觉
1、科学解释
我上面为什么说这些都是很紧密的学科呢?我查找资料看到*的对计算机视觉的解释是:计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和计算机代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图像处理,用计算机处理成为更适合人眼观察或传送给仪器检测的图像。
2、举例说明
这个解释我的理解是,举个生活中的小例子,马路上的摄像机,拍摄到了违规车辆,使用识别机器视觉,然后交给计算机处理拍摄到的图像,经过处理后的图像就成为违规判罚的最好证据。当然,这只是我对*词条的解释的形象化理解,计算机视觉的应用远不止这些。
3、*
通俗的来讲,计算机视觉也可以看作是研究如何使人工系统从图像或多维数据中“感知”的科学。另外,作为工程学来讲:计算机视觉寻求基于相关理论与模型来建立计算机视觉系统。这类系统的组成部分包括:过程控制(例如工业机器人和无人驾驶汽车);事件监控(例如图像监测);信息组织(例如图像数据库和图像序列的索引建立);物体与环境建模(例如工业检查,医学图像分析和拓扑建模);交感互动(例如人机互动的输入设备)。计算机视觉同样可以被看作是生物视觉的一个补充。
4、个人理解
在生物视觉领域中,人类和各种动物的视觉都得到了研究,从而建立了这些视觉系统感知信息过程中所使用的物理模型。另一方面,在计算机视觉中,靠软件和硬件实现的人工智能系统得到了研究与描述。生物视觉与计算机视觉进行的学科间交流为彼此都带来了巨大价值。说实话,这让我想到了一句话,当前的计算机相对于人来说还是比较迟钝的,它只能完成特定的工作,超越本身能力之外的事情计算机可能根本无法完成的好。所以计算机视觉相对于生物视觉来讲,在处理的优化上是欠缺的,但是在相同劳动的重复上却是人类无法匹及的。所以才有了生物视觉与计算机视觉进行的学科间交流为彼此都带来了巨大价值的结论。
三、其他科学领域的推动作用
1、生物视觉
既然谈到了生物视觉,很多人估计并不知道作为人类的自己是如何感知这个世界的。其实,从神经学上来讲,人类拥有大脑皮层这个万能的“转换器”,它将我们的视觉神经捕捉到的信号转换为真实的形象。这个“转换器”可简化理解为四个区域,生物学家将它们分别称为V1、V2、V4和IT区。V1区的神经元,只针对整个视觉区域中很小的一部分做出反应。眼睛每扫视一次,这部分神经元的活动就可能发生快速变化。奥秘出现在大脑皮层顶层的IT区,生物学家发现,物体在视野的任何地方出现,某些神经元会一直处于固定的活跃状态中。也就是说,人类的视觉辨识是从视网膜到IT区,神经系统从能识别细微特征,到逐渐变为能识别目标。如果计算机视觉也可以拥有一个“转换器”,那么计算机识别的效率将大为提高,人眼视觉神经的运作为计算机视觉技术的突破提供了启迪。
2、物理学
除此之外,物理是与计算机视觉有着重要联系的另一领域。计算机视觉关注的目标在于充分理解电磁波—主要是可见光与红外线部分—遇到物体表面被反射所形成的图像,而这一过程便是基于光学物理和固态物理,一些尖端的图像感知系统甚至会应用到量子力学理论,来解析影像所表示的真实世界。同时,物理学中的很多测量难题也可以通过计算机视觉得到解决,例如流体运动。
3、信号处理
计算机视觉的另一个相关领域是信号处理。很多有关单元变量信号的处理方法,尤其对是时变信号的处理,都可以很自然的被扩展为计算机视觉中对二元变量信号或者多元变量信号的处理方法。但由于图像数据的特有属性,很多计算机视觉中发展起来的方法,在单元信号的处理方法中却找不到对应版本。这类方法的一个主要特征,便是他们的非线性以及图像信息的多维性,以上二点作为计算机视觉的一部分,在信号处理学中形成了一个特殊的研究方向。
4、我的联想
当然,远远不止上面这这些介绍到的领域,计算机视觉中的很多问题,其理论基础还可能会涉及到统计学,最优化理论以及几何学。所以目前计算机视觉就不是单单的一类学科的知识了,这个技术领域的研究已经进入了全新的阶段,或许这才是真正的科技。之前我拜读过吴军博士的《浪潮之巅》,很是触动,谈论到导致摩托罗拉最终破产的“铱星计划”时(当然,真正导致这个巨人走向衰退的是它落后的商业模式和营销策略),他讲到自己触动很大,他认为只有这些才是真正的technology。这也就是我对计算机视觉技术的欣赏的原因之一吧,因为这项技术未来的发展涉及到的学科之多,应用领域之广泛远远不在我们的想象之内。虽然它的核心是计算机技术,但是未来它会运用到人工智能,航空航天,甚至随着下一次的技术浪潮跨入互联网+或者物联网时代。
四、计算机视觉技术对其他领域(例如人工智能)的推动
1、机器人领域
不知道大家有没有看过《星际穿越》这部“硬科幻”电影,但是我今天想要谈论的不是这部电影超越天际的想象或者对科学的畅想,我想要说的只是这里面的一个机器人。在这部电影中的Tars是一个聪明可爱、幽默风趣的智能机器人,科幻电影就是如此,用一切尽可能的想象创造一个全新的存在于未来的世界,让人们如痴如醉流连忘返。但是回到现实,人工智能的发展却是要慢的多,要研发出一个像Tars一样能看得懂周围世界、听得懂人类语言、并和人类进行流畅对话的智能机器人,我们要走的路还有很长。我们不能单单的去盼望着人工智能的进步,人工智能是一门很大的学科,自然语言识别,计算机视觉,自我学习能力都是需要攻克的难点。未来,当人类的听觉,视觉,触觉,记忆和学习甚至嗅觉都能被应用在人工智能的时候,也许这个世界就是真的进入智能时代了。
2、智能驾驶领域
邹老师谈到欧洲的科学家们有一项计划,是一项想要让车辆在大雾天气仍然可以*行使在马路的计划。在能见度很低的情况下,靠视觉感知世界的人类会显得举步维艰。但是计算机不会,虽然第一时间获取到的视图是模糊的,但是图像处理可以将图像还原到尽可能清晰的画面,然后反馈给司机,这也是推动自动驾驶向前挺进的里程碑式创举。但是或许这些都还是需要生物学物理学等等其他门类的学科的进步来作为推手促进计算机视觉技术的进步。
五、生物视觉VS计算机视觉
目前已经有那么多的公司或者机构正在发展这项技术,不管出于什么样的目的,我相信这些对于计算机视觉的发展都是大有裨益的。比如微软的研究机构喜欢拿狗来做测试,普通人在一个品种的几只狗中第一眼根本分别不出它们的任何区别,但是计算机可以,不仅如此,单单在人脸的识别上计算机的效率和正确率都在人类之上,但是人类的优势在于可以借助于人体的高低胖瘦这些附加特性来增强视觉神经处理图像结果的正确性。但是计算机视觉不会有人眼的疲劳,而且有着比人眼更高的分辨精度和速度,借助红外线、紫外线、X射线,超声波等高新探测技术,在探测不可视物体和高危险场景时,更具有其突出的优点,计算机视觉如今被应用在各项行业,简单的比如人脸识别,复杂的比如门禁系统等等。当然,在工业,农业,服务业,医学等各方面也会日渐发挥举足轻重的作用。其实我们离它并不遥远,它正在一点点的改变我们的生活。未来在大数据,计算机算法的进步下,我相信计算机视觉的研究会跨入崭新的阶段。
六、个人感悟
其实,说实话,计算机新技术专题的课程虽然只有四节课,但是达到的效果是很好的。这一段时间我看到的是大家都开始谈论这些技术方面的知识和新闻了。真真正正的开始对自己喜欢的课题感兴趣了,开始对技术产生了探究的精神。这当然要感谢给我们上课的三名老师的耐心教导,引导我们进入了一个全新的计算机知识界。本文前言声明了计算机视觉是自己的很感兴趣的方向,因为它实实在在的通过各个方面的广泛应用时时刻刻的在改变我们生活,未来的前景也是很吸引人的。对于计算机科学与技术专业的我们,如果对硬件感兴趣完全可以投身这项技术的研究中去,哪怕不做研究搞搞应用也是很好的。
参考文献:
【1】计算机视觉-*
【2】威尔士柯基犬,计算机视觉,深度学习
http://msra.cn/zh-cn/news/features/msr-adam-20140718.aspx
【3】计算机视觉-让机器看懂这个冰冷的世界
http://www.msra.cn/zh-cn/news/features/computer-vision-20150210.aspx
【4】期刊:机器视觉管家技术的现状以及展望
以上所有资料均为本文参考对象。