Linux下基于GTK人脸识别界面设计
1.人脸识别简介
人脸识别,是基于人的脸部特征信息进行身份识别的一种生物识别技术。用摄像机或摄像头采集含有人脸的图像或视频流,并自动在图像中检测和跟踪人脸,进而对检测到的人脸进行脸部识别的一系列相关技术,通常也叫做人像识别、面部识别。
人脸识别系统的研究始于20世纪60年代,80年代后随着计算机技术和光学成像技术的发展得到提高,而真正进入初级的应用阶段则在90年后期,并且以美国、德国和日本的技术实现为主;人脸识别系统成功的关键在于是否拥有尖端的核心算法,并使识别结果具有实用化的识别率和识别速度;“人脸识别系统”集成了人工智能、机器识别、机器学习、模型理论、专家系统、视频图像处理等多种专业技术,同时需结合中间值处理的理论与实现,是生物特征识别的最新应用,其核心技术的实现,展现了弱人工智能向强人工智能的转化。
AI人脸识别是一种依据人的面部特征(如统计或几何特征等),自动进行身份识别的一种生物识别技术,又称为面像识别、人像识别、相貌识别、面孔识别、面部识别等。
2.百度AI人脸识别
人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。
人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能从诞生以来,理论和技术日益成熟,应用领域也不断扩大,可以设想,未来人工智能带来的科技产品,将会是人类智慧的“容器”。人工智能可以对人的意识、思维的信息过程的模拟。人工智能不是人的智能,但能像人那样思考、也可能超过人的智能。
百度人脸识别技术可做到1:N的高精度识别,这个技术壁垒可让百度在景区、大企业、写字楼的人脸闸机领域获得独特的技术优势。
如今,随着人脸识别技术在各行各业的推广和普及,应用场景变的复杂多样,黑产攻击手段同样也愈发诡诈。为此,百度人脸实名认证解决方案加入合成图检测能力,深度识别图片中的伪造痕迹,让PS图片、Deepfake等合成图攻击无所遁形;推出大数据风控能力,基于百度海量大数据设备因子对SDK端的设备环境进行风险判断和拦截;同时配合安全加密能力,在SDK端对人脸信息进行加密,云端接口进行解密,防止黑产在信息上传云端的过程中伪造替换。
- 功能简介:
- 支持两张人脸图片相似度对比:比对两张图片中人脸的相似度,并返回相似度分值。
- 多种图片类型:支持生活照、证件照、身份证芯片照、带网纹照四种类型的人脸对比。
- 活体检测控制:基于图片中的破绽分析,判断其中的人脸是否为二次翻拍(举例:如用户A用手机拍摄了一张包含人脸的图片一,用户B翻拍了图片一得到了图片二,并用图片二伪造成用户A去进行识别操作,这种情况普遍发生在金融开户、实名认证等环节。)。
- 质量检测控制:分析图片的中人脸的模糊度、角度、光照强度等特征,判断图片质量。
- 基于图片的活体检测:基于单张图片,判断图片中的人脸是否为二次翻拍(举例:如用户A用手机拍摄了一张包含人脸的图片一,用户B翻拍了图片一得到了图片二,并用图片二伪造成用户A去进行识别操作,这种情况普遍发生在金融开户、实名认证等环节)以及是否为合成图攻击。此能力可用于H5场景下的一些人脸采集场景中,增加人脸注册的安全性和真实性。
3.应用场合
3.1 人脸闸机
本地版活体检测(本地活体):通过让用户做出指定脸部交互动作,识别当前操作者是否为活体,此功能可离线使用,可设定指定动作是否使用及应用顺序。可有效抵御高清图片、3D建模、视频等攻击。
在线版活体检测(在线活体):基于本地版有交互活体检测输出的质量合格的图片,请求在线活体检测接口,可以进一步判断用户上传的图片是否为活体,进一步抵御高精度视频、高精度建模等攻击。此接口建议与本地版活体检测结合使用,且输入的照片一定为二次采集图片(即限于产品前端拍照所得,不可为相册图片)。
人脸质量检测:判断视频流中的图片帧中,哪些图片质量较佳,即人脸图像特征清晰(满足角度、姿态、光照、模糊度等校验)。
人脸识别:人脸识别技术的泛称,通常指识别图片或视频中的人脸,提取人脸特征值,用于进一步的人脸对比、搜索等业务操作。
3.2 人脸考勤
相比于传统的打卡考勤、指纹考勤,人脸考勤有众多优势:
(1)防作弊能力强:提供在线、离线两种活体检测方案,有效抵御视频、翻拍、3D模型等活体作弊手段。
(2)支持多人同时考勤:智能摄像机支持同时捕捉视频流中出现的多张人脸,实现多人同时考勤,提高考勤效率。
(3)快速响应:500毫秒快速识别比对,2秒内完成人脸捕捉、考勤全过程。
3.3 人脸口罩检测与识别
为保障及推动快速复工复产复学,百度智能云上线口罩佩戴检测模型,同时优化戴口罩面部被大面积遮挡下的人脸识别算法。目前,口罩检测能力已覆盖全产品形态,即日起面向大众开放使用,助力疫情防控,保障复工复产复学的有序开展。
人脸口罩检测与识别能力主要有两方面,即口罩检测和戴口罩人脸识别 。
口罩检测:用于对用户是否佩戴口罩这一属性进行判断和分类。该能力适用于需要通过是否佩戴口罩这个属性来对人群进行分类管控的应用场景,如:机场、车站、医院、商超等大型公共场所。
戴口罩人脸识别:用于戴口罩情况下的人脸识别,即用户不需要摘掉口罩就可以完成人脸检测、活体检测、特征抽取和比对,从而实现身份验证。该能力适用于各类公司、小区、写字楼的门禁闸机和公司的考勤机等应用场景。
4.开发环境及运行效果
硬件平台:Ubuntu18.04、USB免驱摄像头
UI界面:GTK+_2.0
开发语言:C/C++
5.GTK简介
GTK(GIMP Toolkit)是一套源码以LGPL许可协议分发、跨平台的图形工具包。最初是为GIMP写的,已成为一个功能强大、设计灵活的一个通用图形库,是GNU/Linux下开发图形界面的应用程序的主流开发工具之一。当然,GTK也是支持跨平台的,支持Unix类的系统、Windows,甚至手机平台。
GTK是使用C语言写的,所以其原生API都是面向C的,同时GTK的一大特点是,在C语言层面实现了面向对象的特性。GTK是完全免费的,而且基于LGPL协议,这可以保证私有软件通过链接使用GTK可以不把软件源代码开放,对商业应用较友好,这跟GPL协议是不一样的。也正是LGPL协议,使得早些年Gnome(基于GTK编写)风头胜过KDE(基于QT编写)。
6.开发流程
6.1 GTK初始化和摄像头初始化
初始化GTK,创建窗口,初始化摄像头设备,检测摄像头设备是否正常。
在定时器中等待摄像头启动成功,完成人脸识别UI界面配置。
- 等待摄像头启动界面
- 摄像头启动成功界面
6.2 人脸识别和人脸注册
将摄像头采集的图像进行Base64编码,然后调用百度AI接口进行人脸注册和人脸比对。
1.百度智能云接口及简介 https://cloud.baidu.com/product/face
- AI人脸识别接口技术文档
6.3 base64格式编码
Base64是网络上最常见的用于传输8Bit字节码的编码方式之一,Base64就是一种基于64个可打印字符来表示二进制数据的方法。可查看RFC2045~RFC2049,上面有MIME的详细规范。
Base64编码是从二进制到字符的过程,可用于在HTTP环境下传递较长的标识信息。采用Base64编码具有不可读性,需要解码后才能阅读。
Base64由于以上优点被广泛应用于计算机的各个领域,然而由于输出内容中包括两个以上“符号类”字符(+, /, =),不同的应用场景又分别研制了Base64的各种“变种”。为统一和规范化Base64的输出,Base62x被视为无符号化的改进版本。
Base64要求把每三个8Bit的字节转换为四个6Bit的字节(38 = 46 = 24),然后把6Bit再添两位高位0,组成四个8Bit的字节,也就是说,转换后的字符串理论上将要比原来的长1/3。
6.3.1 base64编码示例
6.3.2 base64解码示例
6.4 CJSON格式数据解析
JSON(JavaScript Object Notation, JS对象简谱)是一种轻量级的数据交换格式。它基于 ECMAScript(European Computer Manufacturers Association, 欧洲计算机协会制定的js规范)的一个子集,采用完全独立于编程语言的文本格式来存储和表示数据。简洁和清晰的层次结构使得 JSON 成为理想的数据交换语言。 易于人阅读和编写,同时也易于机器解析和生成,并有效地提升网络传输效率。
JSON是一个标记符的序列。这套标记符包含六个构造字符、字符串、数字和三个字面名。
JSON是一个序列化的对象或数组。
- JSON格式数据解析示例