人工智能 · 2024年2月4日

文安智能创始人陶海:人工智能迈入“感知+认知+协同”的2.0时代

导语:“尽管存在许多困难,但现在真的是人工智能发展最好的时机。”

文安智能创始人陶海:人工智能进入“感知+认知+协同”的2.0时代

在FUS猎云网2020年度人工智能产业峰会上,文安智能创始人陶海以《AI落地–垂直行业应用的全栈智能实践》为主题发表演讲。他表示,新基建加速人工智能应用垂直细分化,人工智能向全栈智能化发展,从“数据+算法+算力”的人工智能1.0到“感知+认知+协同”的人工智能2.0。

陶海认为,尽管人工智能存在许多困难和挑战,但现在真的是人工智能发展最好的时机。行业、场景非常多,AI公司虽然如雨后春笋般涌现,实际上还是不够的。“人工智能未来将从长期积累进入到厚积薄发、大有前途的时代。因为我们要进入一个真正解决问题,通过AI落地实现垂直行业中的全栈智能闭环。”

“人工智能2.0里的协同特指人机交互,因为最终的决策一定要人来做,这是基本的伦理。人工智能从感知、流程再造回过头来倒逼效率提升。”陶海说,做人工智能永远被需要,因为跟业务是紧密联系的,一定要进入业务闭环,不停的定制。

作为城市感知和获取信息的主要方式,计算机视觉技术为智慧城市中的公共安全和城市治理、交通、社区、教育、健康医疗、工业互联网等行业应用和服务体系提供有力的赋能。据IDC 最新预测,2023 年全球智慧城市技术相关投资将达到 1894.6亿美元,中国市场规模将达到 389.2 亿美元。

值得注意的是,近日文安智能获得近亿元C轮融资,由金茂创投和中汇金资本共同投资。今年8月以来,文安智能斩获赛文交通网颁布的“2019AI+智慧交通10大优秀企业”奖项,以及全球经济年会(GNEC)上颁布的“2020新基建成长企业100强”。

文安智能创始人陶海:人工智能进入“感知+认知+协同”的2.0时代

以下为陶海演讲实录,猎云网整理删改:

AI是一个非常艰苦的行业,虽然现在很火,从阿尔法狗之后大家非常热衷做AI,其实AI已经很多年了。而且一定程度上,大家会有一种感觉,现在的AI和真正意义上的人工智能,就是科幻片里的AI是不一样的,它是能思考、能交流,有想法,能够自主逻辑判断。其实我们现在说的所谓的AI,更多的是比较简单的大数据的一种回归算法,就是Y=F(x)。

这样的话你有什么X,有什么Y,定义就好了,收集数据,训练出F,就解决了这个问题。

为什么强调解决问题,因为现在有了前所未有的数据和前所未有的算力,所以我们这个F的拟合可以做的非常好,这样我们大量的实际问题能够解决掉。比如说识别类的问题,像人脸识别、二维码识别和图像识别类的问题都能解决,一下子让产业化落地非常快。

但是这个红利,在最近这五年,从2015年到2020年逐步消失,包括投资人也好,包括行业都看穿了,大家看这个东西可以做,但是人人都可以做,这样价值就没有了。所以感知层的AI,现在的价值衰减是越来越快。

但是人工智能真的就要进入低谷了吗?其实是没有的。因为我们真正的人工智能问题一直没有解决,只要一直没有解决,就永远有机会。

目前来讲,文安智能自AI领域深耕了15年,整个过程我们都经历过。我们认为,未来反倒是从长期积累进入到厚积薄发、大有前途的时代。因为我们要进入一个真正解决问题,通过AI落地实现垂直行业中的全栈智能闭环。

经历过一些困惑,现在我们慢慢清晰了。AI公司不能赋能百业,就是要进一两个行业,而且你必须还要做到这一两个行业最好的公司。可能你的规模不是最大的,但你是引领者、你是高端,你创新,你占领市场,这是一个很好的一条路。

但是再往后走,再远了,能不能变成老大老二,那要看你自己的努力情况。但是往这个方向走,就涉及到第三个阶段,你一定要去真正做出业务闭环,解决问题。

现在ToC和ToB里面经常会有两类公司,一类做产品的公司,这类公司可能好一年、好两年。举个例子,比如一款人脸相机卖15000元,成本才800元,很多玩家看到毛利高全冲进来了。一年之后,相机价格变成1500元,还有专门做硬件的公司会努力给你压缩成本。再比如人脸识别闸机刚出现时很火,但现在闸机人脸识别算法模块才150块钱,这就是做算法的人工智能公司必须过的一个槛。

我觉得感知层非常残酷,但是做人工智能有一个好处,不光是感知层,还有数据层,还有决策层,整个全栈人工智能其实是非常难做的,这也是我们做人工智能的一个机会。从我们角度讲,我们就深耕行业做全栈智能,这是我们目前想到的人工智能创业最好的一个路径。

我刚才讲的是比较实在的体会,下面讲一讲落地应用的挑战和应对。

文安智能创始人陶海:人工智能进入“感知+认知+协同”的2.0时代

尽管有那么多困难,现在真的是人工智能发展最好的时机。首先基础比较薄弱,这张图上,横坐标是市场规模、纵坐标是成熟度。AI+安防相对成熟度高,因为安防里的关键算法,公安一定要花钱买的算法不多,就是人脸识别,剩下还有治安防范,就是弱需求。

相对来讲这么多公司,这么多投入,都做人脸识别,发展的非常快,所以相对成熟。但是其他很多行业都不太成熟,只要不成熟,而且每个行业场景都非常多,本身行业就多,行业里场景又多,所以AI公司虽然如雨后春笋,实际上还是不够的。

其次,之前大家都认为人工智能就像是火箭,数据是燃料,算法是引擎,数据、算法、算力是以前传统的说法,这个比较适合说感知层AI,就是刚才说的Y=F(x)。你有足够的X有足够的Y,你标注足够好,训练一个神经网络F,就解决了这个问题。比如,一张图是男的,是猫、是狗,这都是映射问题,X就是图像,Y就是狗和猫,F就是神经元网络,这个问题就是算力算法数据解决的。

一旦进入真正业务闭环就不这么简单,就开始看阿尔法狗。当初这么多公司创立,这么多钱投进来是想得到各行各业的阿尔法狗,结果搞了一个F回来,搞了一个感知,不是搞了一个决策闭环,这其实有巨大的差距,有这个差距就有机会。

还有很多刚才谈到的信号灯控制,包括防疫人的跟踪。经过防疫大家知道了,不光人要跟踪,货物要跟踪,车要跟踪,摩托车要跟踪,自行车要跟踪,所有的东西万物都要跟踪。这个时候如果感知达到了万物跟踪的状态,就可以做万物的优化、规划,这就是我认为整个闭环最终的目标。

文安智能创始人陶海:人工智能进入“感知+认知+协同”的2.0时代

所以,人工智能将向全栈智能化发展,从“数据+算法+算力”的人工智能1.0到“感知+认知+协同”的人工智能2.0。

2.0实际上是感知加上数据,加上认知,加上协同。为什么加协同,这里的协同特指人机交互,因为最终的决策一定要人来做,这是基本的伦理。同时,人工智能大家都在讲智能体,都在讲云边协同,都在讲迭代。人工智能有一定概率会失败,而且失败会很惨,所以你一定不让很惨的事件发生。就像特斯拉的车撞到货车,不能让这个事件发生。这时候可以把人的因素加进去,人机交互协同,可能“十四五”阶段机器把公务员20%的工作接过来了,让他们轻松了20%,到“十五五”他们就能轻松50%。但是最终,这个人一定是在这个环节里的,流程要再造,人工智能从感知、流程再造回过头来倒逼效率提升。

我们认为“感知+认知+协同”是人工智能2.0。但有一个很麻烦的事情,这个事要对每个垂直行业去做,这里面山头林立,有一大堆过去的厂商,有过去的平台、过去的数据,你怎么整合,这个要累死你,因为这个不是我们做就能解决的。

在这个过程中,非常重要的一个事就是标准化。因为人工智能可以算出很多东西,但是就算一个视频识别算出来,如果没有标准,后面没法用。而且一个城市的各个区里面,一个厂家一个标准,最后这个数据互相都不通的。在过去视频监控里已经有这个问题,但是现在智能互通问题还没有标准,这个也很可怕。虽然我们坐在这天天说智能,但最后输出格式不一致,识别出来结果没有标准,这本身是一个很重要的事情需要去解决。

再说数据感知,从2015到2020,感知方面出现很多公司,做图像处理、模式识别、视觉,很多新创立的公司想办法解决各个行业的问题。目前来讲,愿意买单的,首先政府,然后是商业,我们现在老百姓买这些服务还是比较少的。

实际上即便是感知层,虽然我们说理论上认为是解决了,通过大量数据,大量的标签再加上F就解决掉。但是在实践当中并没有解决。比如我们最近做了一个课题,有些车时间长了不太好冒黑烟。通过AI能不能识别?很黑的

OpenMagic API

Need more than content? Move into the product flow.

If you are here for model access, pricing, developer docs, or the future API console, the dedicated product path now lives on api.openmagic.ai.

登录免费注册