AI技术的应用迈入新阶段

域名预订/竞价，好“米”不错过

“创新的速度比创新本身更重要。”埃隆·马斯克曾这样说到。

近日，由马斯克所掌舵的特斯拉，在2024年世界人工智能大会上正式推出了第二代OptiMUS（擎天柱）人形机器人，距离第一代面世，仅过去9个月。

加速升级的人形机器人不负所望，成了今年WAIC大会（世界人工智能大会）的一大看点。除此以外，今年的WAIC大会还引发了哪些热门话题？带来了哪些前瞻指引？

开源和闭源，是互补关系

今年，华为盘古、百度文心、阿里通义、腾讯混元等国内知名大模型悉数都参加了WAIC，大模型依旧是重头戏之一。

大会开幕期间，在谈及大模型闭源与开源的选择时，两大头部企业陷入明显分歧。百度创始人、董事长兼首席执行官李彦宏称，模型开源无法做到众人拾柴火焰高，商业化闭源模型才最能打。

阿里云CTO周靖人则重申了阿里云开源开放的选择，并强调阿里两年前决定将通义大模型开源开放，时至今日，通义千问已经实现真正意义上的全尺寸、全模态开源，拉平了开源、闭源模型之间的差距。

相较而言，开源大模型和闭源大模型孰好孰坏，其实并没有定论。

从技术层面来看，闭源由于不公开源代码，安全性和服务质量更高，而且可以通过销售许可或提供基于模型的服务来盈利；但同时许可费高昂，外界难以审查监管，而且升级迭代高度依赖内部团队，速度有限。

开源则恰好相反，技术门槛和成本较低，吸引了全国范围的开发者和研究者参与，创新和迭代速度更快，适配更多应用领域，但无门槛的技术共享也带来了权益被侵犯的风险，质量、稳定性和安全性难以保证。

对比来看，闭源想要走向“成功”，唯一的路径就是进化为“超级应用”，从而创造价值；而开源凭借独有的兼容性打造了强有力的获客手段。由此可见，看似截然不同的两个方向背后，是由各自的商业利益驱使。

从应用层面来看，开源和闭源并不像手机端的iOS系统或者安卓系统只能二选一，尤其在ToB的情况下，应用端既需要技术共享也会考虑应用安全性，还需要满足多样化需求。

对此，百川智能CEO王小川表示，预计未来将有80%的企业会用到开源大模型，因为闭源没办法对产品做更好的适配，或者成本特别高，闭源可以给剩下的20%提供服务。

由此可见，二者并不是非此即彼的对立关系，在不同产品和应用场景中也可以是互补的关系。但归根究底，大模型在发展之余如何创造价值，选择开源还是闭源就不是核心问题，因为仅有基础模型却没有应用，就等同于一文不值。

AI落地的三大方向：大模型、机器人、终端产品

大模型作为人工智能大家族的组成部分，一直是热议的话题之一。随着WAIC 2024的落幕，AI应用落地的最新趋势也昭然若揭。

（一）大模型加速商业化

继百模大战后，大模型的“精耕细作”一直在持续。以ChatGPT和Sora为代表的大模型技术，也已进入新一轮迭代。从今年的WAIC来看，百度、阿里巴巴、腾讯、华为等行业巨头带来众多新技术和新产品，展现了大模型在金融、医疗、政务等多个行业场景的应用潜力。

截至目前，百度有千帆大模型平台、文心一言，阿里有阿里云百炼、通义大模型，腾讯有腾讯云混元大模型、元宝大模型，字节跳动有火山方舟、豆包大模型等等。

在过去的2023年里，大模型的长文处理能力、数字能力、推理能力、RAG（检索增强生成）、GPTs、多模态、原生应用、开源等多方面都有大幅增强。同时，训练和部署成本、行业适配能力、幻想问题以及数据安全这四大挑战也得以优化和解决。

在此基础上，定制化的大模型给To B和To C业务带来了非常深刻和彻底的改造，企业用户和终端个人用户也逐渐呈现刚性需求。

（二）机器人和AI高度结合

今年，人形机器人专区也是大会的一大亮点。在世博展览馆的中厅，18台人形机器人组成阵列展示“才艺”，并与观众亲切互动，可见机器人技术的协同效应以及在”异构群智”领域的重大突破。

随着人形机器人和AI两大领域的高速发展，产业进入深度融合阶段，AI大模型+人形机器人正掀起下一波技术热潮。

从技术角度看，两者在自然语言交互、知识库与推理、多模态感知与决策、运动规划、任务规划与执行、情感交互、持续学习等七个板块均有结合应用的可能性。

在实际应用方面也已经取得突破。比如WAIC 2024大会上，特斯拉的OptiMUS二代机器人将深度学习应用于视觉感知，实现了精准的目标识别与抓取，而且可以直立行走，进行路线规划。

自然语言交互领域，XiaoMi CybeROne等人形机器人搭载大语言模型，实现了高自然度语音交互。情感交互领域，Hanson Robotics的SopHia机器人通过面部表情合成和声音合成，实现了丰富的情感表达。

通过以上技术的融合，我们有望创造出具备感知、决策、规划、控制、交互、学习等多维能力的人形机器人，最终赋予其真正的智能化、人性化。

（三）AI终端“新物种”涌现

除了大模型、人形机器人，AI的终端产品逐渐渗透至日常生活。正如三次工业革命，蒸汽时代诞生蒸汽机、电气时代发明电灯泡、信息化时代创造计算机，每一件革命性的“新物种”都被应用于终端场景，AI大航海时代的产物也将如此。

今年，多个行业涌现了”终端新物种”。比如戴尔、联想、华为的AI PC新产品、内置大模型语音助手的雷鸟AR眼镜X2 LITe、实现AI翻译的时空壶同声传译器X1，以及今年上半年被热议最多的苹果vision Pro混合现实头显，等等。

追本溯源，终端产品的涌现，主要得益于AI模型、AI应用、AI硬件的协同发展。从AI产业结构来看，产业链上游为基础层，包括算力等，中游为算法和模型层，下游为应用层。先有算力、芯片等“硬件”的完善和加持，再是大模型、算法的“精耕细作”，终端“新物种”应运而生。

随着AI生态和技术的不断进化，未来AI终端还将迎来架构设计、交互方式、内容、应用生态等的全面创新和升级。或许，我们会从提问“AI终端应该长什么样”，转为好奇“AI终端会长什么样”。

2024，开启“AI+”时代

2024年，伴随大数据处理、高性能计算、深度学习等技术的快速发展和成熟，人工智能已经能够解决大量的复杂问题，加上日益成熟的大模型技术，人工智能的准确度、效率、通用性、灵活性得到显著提升。

应用层面，随着现代社会产生的数据开始爆发式增长，为人工智能的进化提供了“养料”，人工智能得以更好地学习和理解现实世界。加之，个人用户和企业客户对于个性化、高效的服务需求日益增强。

在底层技术高速发展，以及市场需求的牵引下，人工智能（AI）已经由“+AI”模式转型至“AI+”模式的阶段。

对比来看，早前的“+AI”阶段，人工智能还只是一项补充技术，被运用于传统行业的既有业务流程和产品之中，目标在于提升效率、解决特定问题。

如今的“AI+”阶段，AI不再仅仅是业务流程的附属部分，更是各行各业创新发展的重要驱动力，其核心在于数据驱动和自我学习，利用神经网络模型进行大量数据的训练，模拟人脑的学习机制，从而实现语音识别、图像识别等多领域超越人类的表现。

这一阶段跨越的完成，意味着AI从单纯的技术附加工具转向了引领行业变革的关键要素，从赋能单一功能升级为重塑整个业务形态。

业务形态的重塑具体到应用场景，覆盖了交通出行、生活服务、工业制造、文化传播、医疗健康、农村建设等多个领域。

AI+交通领域，在AI算法的加持下，车辆能够处理海量的传感器数据，实现对车辆周围环境的高精度感知。同时，还能预测其他车辆的行驶轨迹，为自动驾驶车辆提供决策依据。最重要的是，AI算法通过不断学习和优化，可以提升自动驾驶系统的性能和安全性。

AI+制造领域，由于大模型、机器学习、计算机视觉等细分技术实现突破，人工智能可以被应用于制造业全流程各环节，通过挖掘各单一环节的数据信息，进而赋能整体的预测、生产、管理、决策，从而实现精细化管理，助力企业降本增效。

工信部数据显示，经过智能化改造，制造业研发周期缩短约20.7%、生产效率提升约34.8%、不良品率降低约27.4%、碳排放减少约21.2%。

长远来看，“AI+”的潜力已经开始展现。

结语

2024年，AI应用落地的想象力无效迸发。大模型加速商业化、AI 和人形机器人深度结合、终端新物种大量涌现，大航海时代的历史齿轮开始高速运转。

不只是人工智能行业，整个产业链也在加速扩容，AI+交通、AI+汽车、AI+文化、AI+制造等都开始从理论走向实践，走进生产和生活。

“AI+”时代真的来了。

chatGPT

近期文章

人工智能 · 2024年7月15日

AI技术的应用迈入新阶段

Need more than content? Move into the product flow.