互联网技术 / 互联网资讯 / 营销 · 2022年9月30日 0

百度EasyDL在智能化转型浪潮中的“AI普惠”探索

文 | 曾响铃

来源 | 科技向令说(xiangling0815)

人人都想搭上人工智能这辆快车。

然而不会编程,心有余而力不足,无法跟上技术推动下产业发展的节奏应该怎么破?

百度EasyDL正是这样一款能够让没有技术基础的中小企业在智能化转型方面实现“弯道超车”的工具。

最近EasyDL推出的“万有引力”计划,进一步将AI落地的门槛与成本打了下来,让人工智能从概念到实验室,再到落地现实走入企业业务和大众生活,这一整套闭环流程不再像想象中的那么遥不可及。

EasyDL让AI落地so easy

1956年的夏天,麦卡锡、明斯基等科学家在美国达特茅斯学院开会研讨“如何用机器模拟人的智能”,首次提出了“人工智能(Artificial Intelligence,简称AI)”这一概念。

经过60多年的发展,人工智能进入到大规模落地阶段,越来越多的企业也开始进行智能化升级,这也让AI应用场景趋于多样化和复杂化,企业对高效定制AI的需求也越来越大。

在这样的背景之下,新的问题也产生了。

根据百度和波士顿咨询公司的联合调研中,发现约86%的市场需求需要定制开发业务场景下的AI模型,在定制模型的过程中,企业用户和开发者往往会面临缺少模型训练经验、数据采集和标注成本高、模型适配与部署流程繁琐、模型优化迭代周期长等难点,从而造成整个项目成本高、周期长,且在前期对项目效果无法准确预期。

就像一座大山横亘在企业与技术之间,企业想进行智能化转型,一方面自身不具备如此专业的能力,另一方面又因转型过程的不确定性而心生犹豫。

企业需要一种“傻瓜式”的AI落地或者应用的工具,基于百度飞桨深度学习平台的EasyDL就这样出现了。

作为一个高效易用的零门槛、一站式AI开发平台,EasyDL支持智能数据、模型开发、服务部署等全流程功能。目前已经支持图像分类、物体检测、图像分割、音视频分类、语音识别自训练、表格数据预测、文本分类、情感倾向分析等任务类型,可以帮助中小企业结合业务需求,解决效率和成本的问题。

EasyDL让AI落地到底有多容易,我们来看看两个例子。

青岛爱包花饰是一家专业的箱包检品公司,每天需要检查货品十多万件。

爱包花饰之前采用传统的X光检针机通过X射线返回箱包内部信息,其中需要人工肉眼判断箱包中是否有金属异物、金属配件数量是否符合生产要求,不光效率低而且人力成本大,长时间的重复工作还容易让检验员产生疲劳和松懈,以致品控始终难以提高。

爱包花饰使用EasyDL训练箱包质检模型,只是提供了含有针、剪刀等异物和金属部件商品的X光图像,在完全无需了解AI算法细节的前提下,也训练出了准确率90%的模型,箱包生产过程中的残留异物(如针、金属零部件等)的检出率和箱包的质检效率大大提高。

瀚才猎头之前也有着类似的烦恼,200万条人才数据,利用率不到10%。

作为“高级管理人员代理招募机构”,如何高效地为客户推荐合适的人才是瀚才猎头的核心业务,也是其在行业发展中的核心竞争力。

但瀚才猎头10余年发展过程积累的体量庞大的人才“数据库”却因为其难以整理和分类,导致大量的数据资源处于“闲置”状态,瀚才猎头的优势也没有得到体现和发挥。

这个局面在使用EasyDL后发生了改变,通过EasyDL平台的数据清洗和训练分类能力,瀚才猎头在1个月时间内将200万条经营数据划分成12个大行业、147个小行业和10个通用职级信息,使被“遗弃”的数据开始有了匹配的“用武之地”。

以前按照关键词搜索的方法,每天只能找到60-70份合适的候选者简历,现在经过数据结构化处理后,20分钟就可能达到600-1000份,而且精准度达到了95%以上,整个效率提升了200倍。

使用简单的背后是复杂技术的高度集成

以上两个案例都有一个共同点,即模型的训练过程不需要任何代码基础,只需按业务需求,完成数据处理和提交,然后选择部署方式就可以了。

看似简单的背后,实际上是百度EasyDL对复杂AI技术的深度掌控。

首先,在基础层,百度的超大数据库保证了模型效果。

EasyDL好用的第一关键在于效果,EasyDL保证效果的基础就是预置了百度大规模数据训练的预训练模型,让模型精度大大提升。

比如,在视觉任务中,图像分类训练任务内置了百度基于海量互联网数据,包括10万+分类、6500万图片训练的超大规模预训练模型,平均精度可提升3.24%-7.73%;物体检测训练任务内置百度基于800+标签、170万图片,1000万+检测框训练的超大规模物体检测预训练模型,平均精度可提升1.78%-4.53%。

再比如,在自然语言处理方向,EasyDL预置了由百度自研的预训练模型文心(ERNIE)2.0,将大数据预训练与多源丰富知识相结合,持续学习海量数据中的知识,将机器语义理解水平提升到一个新的高度。目前文心(ERNIE)在中英文的16个任务上已经超越了业界最好模型,全面适用于各类NLP应用场景。

其次,在应用层,通过智能数据服务来提升企业效率。

所谓的智能数据服务,就是从数据采集到数据标注,再到数据清洗,EasyDL都能提供一站式的全方位服务。

以中科立业为例,这家做智能结算果蔬秤的公司希望将AI服务集成在智能果蔬结算秤上进行果蔬识别,但他们在超市试运营时,经常会出现因物体遮挡(塑料袋遮挡)、光线多变(亮光、暗光)、果蔬形状角度多变等情况,导致数据采集质量不高,如果要解决这一痛点,提高识别率,需要更加丰富的训练数据。

EasyDL通过软硬一体、端云协同的自动数据采集方案,提前对端设备进行测评和适配,将数据采集效率从周提升到小时。

在数据标注方面,EasyDL提供图片、文本、音频、视频四种数据格式的11种数据标注模板,在物体检测、图像分割、文本分类三类任务场景中,通过百度自研的Hard Sample主动学习挖掘算法,进行针对性适配,在同样的模型效果指标下,可减少70%的数据标注量。

上文提到瀚才猎头简历库的文本分类中,员工手动标记了1万条,其余的199万条全部是自动完成的。

中科立业使用EasyDL后,通过对图像数据进行相似度的去重去模糊,剪裁,旋转,镜像以及数据增强等数据清洗处理,在50种水果的测试中,准确率达到了95%以上,整体效率提升了60%。

最后,在部署环节,多种方案让AI落地“零门槛”。

目前EasyDL提供了公有云API、本地服务器部署、设备端SDK、软硬一体部署四种方案。

其中,设备端SDK,适配了NV Jetson系列、Intel神经加速棒、华为NPU、华为Atlas、高通DSP、RK等十几种业界主流的端设备。

在软硬一体方案部署上,EasyDL提供了6款软硬一体方案,支持专项适配与加速,覆