人工智能 · 2024年3月4日 0

深度学习助推人脸识别发展,商汤、旷视、微美AI视觉科技智能化

21世纪,计算机科学的取得了飞跃式发展,人工智能技术是继物联网、云计算、大数据之后又一个里程碑式的发展阶段,目前人工智能已经被应用到计算机科学的各个领域如语言识别、图像识别、自然语言处理和专家系统等。人脸识别具有开放性、主动性、稳定性等特点,具有广泛的应用前景,因此越来越受到专家学者的重视。

人脸识别问题宏观上分为两类:1. 人脸验证(又叫人脸比对)2. 人脸识别。人脸验证做的是 1 比 1 的比对,即判断两张图片里的人是否为同一人。最常见的应用场景便是人脸解锁,终端设备(如手机)只需将用户事先注册的照片与临场采集的照片做对比,判断是否为同一人,即可完成身份验证。

人脸识别做的是 1 比 N 的比对,即判断系统当前见到的人,为事先见过的众多人中的哪一个。比如疑犯追踪,小区门禁,会场签到,以及新零售概念里的客户识别。这些应用场景的共同特点是:人脸识别系统都事先存储了大量的不同人脸和身份信息,系统运行时需要将见到的人脸与之前存储的大量人脸做比对,找出匹配的人脸。

人脸识别是一个历史悠久的任务,从20世纪50年代开始,研究人员已经开始关注人脸识别这个领域。从最早基于人脸几何结构特征,到基于建模方法,局部特征描述子(Gabor, LBP),目前主流的方法是基于深度学习的方法。

在过去几年,手机的人脸识别令大众印象颇深,回顾手机解锁方式进化史,它经历了密码解锁到指纹识别,再到3D人脸识别的转变过程,这一转变同时也潜移默化地改变了人们的生活方式。近期,作为国内视觉AI领域的代表企业,商汤科技、旷视科技、WiMi微美全息等企业,纷纷在人脸识别这个分支上大展拳脚,整个体验更加科技化、智能化。

商汤科技“3D人脸识别智能门锁解决方案”基于商汤科技SenseID智能人脸识别模组,整合了算法、3D仿生双目红外摄像头,SoC计算芯片等软硬件于一体,将商汤科技领先的3D人脸识别技术,带给最终用户,带来便捷、安全、高效的入户体验,并帮助门锁企业在整锁或整门产品的开发中降低成本,缩短周期。

从模组的工作逻辑上看,其首先在人脸信息的录入时即采用3D方式,从上中下左右5个维度记录人脸信息,并进行特征提取生成签名。在进行“刷脸”时,系统会在有效的距离内,对当前人脸与已录入的人脸进行比对验证,并同时完成3D活体检测,通过则进行解锁操作,反之则拒绝开锁。

得益于算法的优化与硬件之间的完美协作,商汤SenseID智能人脸识别模组的识别准确率可以达到超越人眼的程度。并且在速度方面,从上电到解锁完成,全流程只需要1.4秒,基本可以做到难以察觉的无感通行。

旷视科技人脸识别平台上的开发者已超过十万,而在2011年10月公司成立之初由清华大学姚期智计算机科学实验班的印奇等三位同学组成,公司最初想研发的是体感游戏,而后来公司希望技术对实业产生价值,因此在2012年推出了Face++云平台,将API接口开放人脸检测、属性分析等功能提供给开发者。 2012-2014年在用户数量和用例的积累下,旷视科技先后提供了Image++以及Brain++,分别是物体、字体的识别平台以及训练平台。 2014年随着公司在金融领域发力,公司在产业化方向努力。2014-2018年,公司主要在金融、安防和泛商业的AI服务领域形成一定的市场份额,而其中人脸数据方面的积累为人脸识别算法的不断进化提供保证。2015年公司营收达到千万级,2016年营收首次破亿。

旷视公司是全球为数不多的拥有自主研发的深度学习框架的公司之一,公司自研的深度学习框架Brain++是一个统一的底层架构,为算法训练及模型改进过程提供重要支持,为不同领域的碎片化需求定制不断增长的算法组合,包括很多长尾需求。 针对AI+IoT的战略布局,旷视使用的是“云+端”模式,一方面,旷视将最好的算法以及最新的安全措施部署在云端,实现对互联网金融、共享经济等领域的远程身份核实等功能的实现;在终端业务上,公司致力于安防、生活等场景中的摄像头、门禁、闸机等智能硬件、终端的系统解决方案的开发。

作为国内以全息视觉为代表的企业微美全息,其商业应用场景主要聚集在家用娱乐、光场影院、演艺系统、商业发布系统及广告展示系统等五大专业领域。

全息3D人脸识别软件的开发基于微美的全息成像特征成像检测和识别技术、模板匹配全息成像检测技术,以及基于深度学习和训练的视频处理和识别技术。传统的2D面部识别技术是一种基于面部特征的识别技术,它从面部图像或面部视频流中捕获信息,并自动检测和跟踪目标面部;微美的全息3D面部识别技术是全息成像捕捉和3D肖像的结合的识别技术。微美专注于软件技术的开发和应用,并拥有AI、机器识别技术、机器学习、模型理论和视频成像处理技术。全息3D面部识别技术是一种利用结构光和红外光的集合技术,所收集的特征点可以超过30,000点;传统2D面部识别技术的收集特征点不到1000点。并且3D技术受到周围环境的影响较小,有望克服传统2D面部识别技术中发现的如光线、姿势、遮挡、动态识别和面部表情等许多问题。

全息面部变化技术基于全息3D图层替换技术,包括基于AI的图像识别和动态融合处理技术,实时跟踪图像以及用其他面部替换面部。该技术取代视频帧中的人脸,合成视频并添加原始音频。微美已经在全息AR插件广告应用中验证了这些技术模块,并将继续开发和升级这些技术模块。微美相信这项技术将为名人广告,电影发行和直播视频流等应用带来新的业务增长。

随着我国的三维测量技术的不断发展,以及3D人脸识别算法补充了2D投影的缺陷,还对存在的传统难点,包括人脸旋转、遮挡、相似度等问题都有很好的应对,这也可以是人脸识别技术的重要发展线路之一。

我国拥有着世界第一庞大人口基数以及频繁的流动性,在这样的大环境下,人脸识别的便利与安全性尤为重要,智慧城市、智慧园区、公安、安保等信息化建设正在推动高准确度人脸身份识别系统市场快速增长。同时,替换已经安装使用、但准确度达不到发展需求的人脸身份识别系统的数量也在大量增长。而且,用户对识别准确度和超短时间识别需求也会不断提高。因此,高准确度的人脸识别技术在人脸身份识别系统的研制工作中,会有很大的发展空间和很高的经济效益前景。高准确度人脸身份识别系统的广泛应用,因在快速寻找人、核查人的效率和准确方面的突出功效,也将会产生非常大的政治和社会效益。