不知道你是否注意到,无论是停车场的收费、还是道路卡口的车辆违规检测,都已经慢慢实现了“无人化”:通过摄像头等图像摄取设备来拍摄车牌,进行自动化的识别,并与后端的管理系统对接,可以自动的执行车辆停车计费、违规记录等应用。与传统的人工识别与管理相比,自动化的车辆识别与管理不但降低了相应的人员成本,还有效提升了管理的速度以及精度,成为智慧交通体系中不可或缺的一环。
但与此同时,基于深度学习的车辆识别监测要想满足精度、性能的要求,需要高效的算法支持,以及大量的数据进行训练。但是,针对某一场景进行训练的算法往往无法充分满足其它场景的应用需求。以车牌识别为例,不同的国家和地区的车牌在文字、颜色、组合方式等方面都不尽相同,因此在没有基于一定数据进行训练的前提下,车牌识别算法很难迁移到其它国家和地区,这也造成了在部分市场规模较小的国家和地区,智慧交通体系的发展较为缓慢。
除了算法之外,算力也是影响基于深度学习的车辆识别系统应用的一个重要原因,算力越高,车辆识别与检测也就越容易达到更高的效率,也就更能适应比较苛刻的应用场景,如识别高速运动或是复杂场景中的车辆,而推理性能的增强则有助于加速算法的训练。同时,为了达到最佳的成本效益,用户往往希望能够以更少的节点承载更多的车辆识别负载,这就对性能提出了较高的要求。
智芯原动车牌识别系统的“出海”之路
作为中国领先的人工智能技术及解决方案提供商, 北京智芯原动科技有限公司*(以下简称:智芯原动),2018年被Intel投资,一直致力于为用户提供高效、高准确率、可快速部署的车辆识别解决方案。 智芯原动的云端车款识别平台可识别1600种左右车款,车款信息包括:品牌、型号、年代。为了满足全球不同区域用户对于车牌识别的需求,智芯原动推出了车牌识别解决方案。
针对传统车牌识别方案需要大量数据进行训练、部署速度慢、周期长的缺陷,通过搭载自研车牌算法框架,智芯原动海外车牌解决方案能够在少量(>1K)车牌样本条件下快速迭代,仅需2-4周的交付周期即可实现新国家车牌的开发任务,且综合准确率可高达90%-95%,能够满足基本应用的需求,而且随着训练数据的增加,这一准确率还将继续提升。
在该方案中,智芯原动使用了基于卷积神经网络深度学习的车款识别方法,并通过MobileNet*、GoogleNet* 等拓扑结构来实现分类推理优化。在智芯原动对车牌识别算法进行优化之后,有助于在小样本的前提下实现应用的快速开发及部署。
目前,智芯原动车牌识别解决方案已经在加拿大、土耳其、新加坡、赞比亚、安哥拉、中国、中国台湾、泰国、印度等二十余个国家和地区实现了产品落地。
智芯原动与英特尔合作加速车牌识别应用的推理性能
“要提升基于深度学习的车牌识别的推理性能,硬件以及加速工具都是非常重要的影响因素,从这两方面出发,我们与英特尔进行了持续的探索。” 智芯原动CTO王正表示,“在基于 CPU 的深度学习方案中,CPU的性能以及针对人工智能的技术创新至关重要,最新发布的第二代英特尔® 至强® 可扩展处理器针对人工智能应用负载进行了优化,搭载了VNNI 等技术,我们很期待通过该处理器来提升推理性能。”
除了使用第二代英特尔® 至强® 可扩展处理器之外,智芯原动还尝试了在MobileNet*、MobileNet-V2*、GoogleNet*、VGG-16*等多个拓扑结构中,英特尔® OpenVINO™ 工具套件分发版的推理性能。测试数据显示,与英特尔优化版本 Caffe 相比,使用OpenVINO™ 在 MobileNet 系列分类推理中实现了28.4倍的性能提升,性能提升非常显著。
之所以能够实现如此明显的加速效果,是因为OpenVINO™ 对深度学习和传统的计算机视觉这两类方法都有很好的支持,其包含一个深度学习的部署工具套件,可以帮助开发者将已经训练好的网络模型部署到目标平台之上进行推理操作。OpenVINO™ 把人工智能放在边缘做计算,通过将人工智能和异构边缘计算相结合,有利于提高性能,整合深度学习,加速开发、创新和定制。
“第二代英特尔® 至强® 可扩展处理器 + OpenVINO™ 的使用在具体的应用实例中,能够在视频图像分析中将推理性能提升到非常可观的程度,这不仅在车牌识别应用中有巨大的应用前景,而且还可以应用于广泛的智慧交通体系之中。通过部署优化版的解决方案,将允许用户部署更少的节点,同时支撑更多的推理负载,实现更低的总体拥有成本 (TCO)”,智芯原动车牌识别项目负责人指出。
车辆检测与识别撬动智慧交通市场
在智慧交通的庞大体系中,计算机视觉技术的应用是不可或缺的,无论是停车场综合服务、道路管理、还是道路卡口综合检测,都依赖于高效的面向车辆的视频图像分析能力。目前来看,全球范围内的交通周边产业都面临数字化水平偏低的挑战,企业需要拉通这些数字及信息、实现信息、数据共通,产生共有价值,这将为打造智慧交通体系,构建智慧城市带来巨大的契机。
基于计算机视觉的解决方案利用增强型深度学习神经网络以更精密的方式获取数据,将面向车辆识别的分析能力提升到全新水平。深度学习等人工智能方法使用经过训练的算法,通过分层的神经网络在数据中的各个抽象层级进行建模,可帮助构建计算机视觉、自然语言处理和图像识别等复杂流程,从交通系统中运行的车辆中抽取海量的数据信息。
从基于英特尔® 芯片的智能摄像头,到基于英特尔加速芯片的终端计算设备(如网络视频录像机、网关、视频分析设备等),再到运行训练和分析功能的云环境,英特尔提供了非常庞大的产品组合以支持从摄像头到云环境的人工智能用例。与智芯原动的合作正是英特尔在计算机视觉领域庞大计划的具体体现,这些合作还有望在更多的细分行业生根发芽,赋能充满智慧的数字化时代。