人工智能 · 2024年7月15日

AI技术的应用迈入新阶段

域名预订/竞价,好“米”不错过

“创新的速度比创新本身更重要。”埃隆·马斯克曾这样说到。

近日,由马斯克所掌舵的特斯拉,在2024年世界人工智能大会上正式推出了第二代OptiMUS(擎天柱)人形机器人,距离第一代面世,仅过去9个月。

加速升级的人形机器人不负所望,成了今年WAIC大会(世界人工智能大会)的一大看点。除此以外,今年的WAIC大会还引发了哪些热门话题?带来了哪些前瞻指引?

开源和闭源,是互补关系

今年,华为盘古、百度文心、阿里通义、腾讯混元等国内知名大模型悉数都参加了WAIC,大模型依旧是重头戏之一。

大会开幕期间,在谈及大模型闭源与开源的选择时,两大头部企业陷入明显分歧。百度创始人、董事长兼首席执行官李彦宏称,模型开源无法做到众人拾柴火焰高,商业化闭源模型才最能打。

阿里云CTO周靖人则重申了阿里云开源开放的选择,并强调阿里两年前决定将通义大模型开源开放,时至今日,通义千问已经实现真正意义上的全尺寸、全模态开源,拉平了开源、闭源模型之间的差距。

相较而言,开源大模型和闭源大模型孰好孰坏,其实并没有定论。

从技术层面来看,闭源由于不公开源代码,安全性和服务质量更高,而且可以通过销售许可或提供基于模型的服务来盈利;但同时许可费高昂,外界难以审查监管,而且升级迭代高度依赖内部团队,速度有限。

开源则恰好相反,技术门槛和成本较低,吸引了全国范围的开发者和研究者参与,创新和迭代速度更快,适配更多应用领域,但无门槛的技术共享也带来了权益被侵犯的风险,质量、稳定性和安全性难以保证。

对比来看,闭源想要走向“成功”,唯一的路径就是进化为“超级应用”,从而创造价值;而开源凭借独有的兼容性打造了强有力的获客手段。由此可见,看似截然不同的两个方向背后,是由各自的商业利益驱使。

从应用层面来看,开源和闭源并不像手机端的iOS系统或者安卓系统只能二选一,尤其在ToB的情况下,应用端既需要技术共享也会考虑应用安全性,还需要满足多样化需求。

对此,百川智能CEO王小川表示,预计未来将有80%的企业会用到开源大模型,因为闭源没办法对产品做更好的适配,或者成本特别高,闭源可以给剩下的20%提供服务。

由此可见,二者并不是非此即彼的对立关系,在不同产品和应用场景中也可以是互补的关系。但归根究底,大模型在发展之余如何创造价值,选择开源还是闭源就不是核心问题,因为仅有基础模型却没有应用,就等同于一文不值。

AI落地的三大方向:大模型、机器人、终端产品

大模型作为人工智能大家族的组成部分,一直是热议的话题之一。随着WAIC 2024的落幕,AI应用落地的最新趋势也昭然若揭。

(一)大模型加速商业化

继百模大战后,大模型的“精耕细作”一直在持续。以ChatGPT和Sora为代表的大模型技术,也已进入新一轮迭代。从今年的WAIC来看,百度、阿里巴巴、腾讯、华为等行业巨头带来众多新技术和新产品,展现了大模型在金融、医疗、政务等多个行业场景的应用潜力。

截至目前,百度有千帆大模型平台、文心一言,阿里有阿里云百炼、通义大模型,腾讯有腾讯云混元大模型、元宝大模型,字节跳动有火山方舟、豆包大模型等等。

在过去的2023年里,大模型的长文处理能力、数字能力、推理能力、RAG(检索增强生成)、GPTs、多模态、原生应用、开源等多方面都有大幅增强。同时,训练和部署成本、行业适配能力、幻想问题以及数据安全这四大挑战也得以优化和解决。

在此基础上,定制化的大模型给To B和To C业务带来了非常深刻和彻底的改造,企业用户和终端个人用户也逐渐呈现刚性需求。

(二)机器人和AI高度结合

今年,人形机器人专区也是大会的一大亮点。在世博展览馆的中厅,18台人形机器人组成阵列展示“才艺”,并与观众亲切互动,可见机器人技术的协同效应以及在”异构群智”领域的重大突破。

随着人形机器人和AI两大领域的高速发展,产业进入深度融合阶段,AI大模型+人形机器人正掀起下一波技术热潮。

从技术角度看,两者在自然语言交互、知识库与推理、多模态感知与决策、运动规划、任务规划与执行、情感交互、持续学习等七个板块均有结合应用的可能性。

在实际应用方面也已经取得突破。比如WAIC 2024大会上,特斯拉的OptiMUS二代机器人将深度学习应用于视觉感知,实现了精准的目标识别与抓取,而且可以直立行走,进行路线规划。

自然语言交互领域,XiaoMi CybeROne等人形机器人搭载大语言模型,实现了高自然度语音交互。情感交互领域,Hanson Robotics的SopHia机器人通过面部表情合成和声音合成,实现了丰富的情感表达。

通过以上技术的融合,我们有望创造出具备感知、决策、规划、控制、交互、学习等多维能力的人形机器人,最终赋予其真正的智能化、人性化。

(三)AI终端“新物种”涌现

除了大模型、人形机器人,AI的终端产品逐渐渗透至日常生活。正如三次工业革命,蒸汽时代诞生蒸汽机、电气时代发明电灯泡、信息化时代创造计算机,每一件革命性的“新物种”都被应用于终端场景,AI大航海时代的产物也将如此。

今年,多个行业涌现了”终端新物种”。比如戴尔、联想、华为的AI PC新产品、内置大模型语音助手的雷鸟AR眼镜X2 LITe、实现AI翻译的时空壶同声传译器X1,以及今年上半年被热议最多的苹果vision Pro混合现实头显,等等。

追本溯源,终端产品的涌现,主要得益于AI模型、AI应用、AI硬件的协同发展。从AI产业结构来看,产业链上游为基础层,包括算力等,中游为算法和模型层,下游为应用层。先有算力、芯片等“硬件”的完善和加持,再是大模型、算法的“精耕细作”,终端“新物种”应运而生。

随着AI生态和技术的不断进化,未来AI终端还将迎来架构设计、交互方式、内容、应用生态等的全面创新和升级。或许,我们会从提问“AI终端应该长什么样”,转为好奇“AI终端会长什么样”。

2024,开启“AI+”时代

2024年,伴随大数据处理、高性能计算、深度学习等技术的快速发展和成熟,人工智能已经能够解决大量的复杂问题,加上日益成熟的大模型技术,人工智能的准确度、效率、通用性、灵活性得到显著提升。

应用层面,随着现代社会产生的数据开始爆发式增长,为人工智能的进化提供了“养料”,人工智能得以更好地学习和理解现实世界。加之,个人用户和企业客户对于个性化、高效的服务需求日益增强。

在底层技术高速发展,以及市场需求的牵引下,人工智能(AI)已经由“+AI”模式转型至“AI+”模式的阶段。

对比来看,早前的“+AI”阶段,人工智能还只是一项补充技术,被运用于传统行业的既有业务流程和产品之中,目标在于提升效率、解决特定问题。

如今的“AI+”阶段,AI不再仅仅是业务流程的附属部分,更是各行各业创新发展的重要驱动力,其核心在于数据驱动和自我学习,利用神经网络模型进行大量数据的训练,模拟人脑的学习机制,从而实现语音识别、图像识别等多领域超越人类的表现。

这一阶段跨越的完成,意味着AI从单纯的技术附加工具转向了引领行业变革的关键要素,从赋能单一功能升级为重塑整个业务形态。

业务形态的重塑具体到应用场景,覆盖了交通出行、生活服务、工业制造、文化传播、医疗健康、农村建设等多个领域。

AI+交通领域,在AI算法的加持下,车辆能够处理海量的传感器数据,实现对车辆周围环境的高精度感知。同时,还能预测其他车辆的行驶轨迹,为自动驾驶车辆提供决策依据。最重要的是,AI算法通过不断学习和优化,可以提升自动驾驶系统的性能和安全性。

AI+制造领域,由于大模型、机器学习、计算机视觉等细分技术实现突破,人工智能可以被应用于制造业全流程各环节,通过挖掘各单一环节的数据信息,进而赋能整体的预测、生产、管理、决策,从而实现精细化管理,助力企业降本增效。

工信部数据显示,经过智能化改造,制造业研发周期缩短约20.7%、生产效率提升约34.8%、不良品率降低约27.4%、碳排放减少约21.2%。

长远来看,“AI+”的潜力已经开始展现。

结语

2024年,AI应用落地的想象力无效迸发。大模型加速商业化、AI 和人形机器人深度结合、终端新物种大量涌现,大航海时代的历史齿轮开始高速运转。

不只是人工智能行业,整个产业链也在加速扩容,AI+交通、AI+汽车、AI+文化、AI+制造等都开始从理论走向实践,走进生产和生活。

“AI+”时代真的来了。

OpenMagic API

Need more than content? Move into the product flow.

If you are here for model access, pricing, developer docs, or the future API console, the dedicated product path now lives on api.openmagic.ai.