在大模型代表的新一轮技术浪潮下,智能化转型已然是毋庸置疑的趋势,科技大厂们纷纷给出了智能化的“道法术&Rdquo;,大大小小的企业也开始更新认知,想要从创新中挖掘出驱动增长的新质生产力。
但现实和智能化的美好愿景之间,仍然横亘着一片鲜有人涉足的“荒海&Rdquo;,脚下还没有坚实的路。
3月23日在天津举办的昇腾AI开发者创享日上,与会的专家和学者们也在讨论相关课题,并向外界传达了一种可行的智能化范式:来自不同行业的上千万开发者,有望扮演起“渡舟&Rdquo;的角色,通过一个个落地应用的项目或产品,照亮千行万业的智能化之路。
01 “迟疑不决&Rdquo;的开发者
站在新旧时代转换的起点,对于所有人来说都是陌生的领域。按照以往的经验,挑战常常伴随着机遇,尤其是对开发者群体而言,当智能化已经是一种现在进行时,预示着新的蓝海正在拉开帷幕。
有些耐人寻味的是,明明市场已经到了起风的阶段,不少开发者却表现出了迟疑的一面。并非是开发者看不到风口,而是有着“难言之隐&Rdquo;。
一是AI开发的门槛太高。
把人工智能落地到不同的行业、场景,去解决各种各样的业务问题,意味着大量的微调、定制和优化。单单是高昂的算力成本、所需要耗费的时间成本,就把大多数开发者挡在了智能化的大门外。
不少大厂意识到了其中的问题,也试图降低开发者的门槛,比如陆续开放的AI原生应用开发平台,将大模型组件、AI能力组件等开放给开发者。这种做法在某种程度上降低了AI开发的难度,却只能治标,而无法治本。打一个比方的话,像是给了开发者一份菜谱,却没有给食材、没有给器具,大多数开发者依然走不出“无米之炊&Rdquo;的困局。
二是AI开发的方向不明。
许多人对AI开发的理解停留在互联网应用上,直接的例子就是对AI原生应用的高呼,“我们需要100万量级的AI原生应用,但是不需要100个大模型&Rdquo;。可对开发者来说,诸如此类的声音恐怕无法感同身受。
调用大模型的能力不难,难的是怎么挖掘市场需求,找到对的应用场景。原本就深入产业一线的开发者,可以用私有数据在通用大模型的基础上微调出适用的产品,用于解决切实的业务问题。但对那些远离业务一线的开发者,或者说缺少高质量数据的开发者,更像是一场雾里看花、靠运气去试机会的游戏,结果大概率是九死一生。
相对应的,行业上下出现了冷热不均的一幕:科技大厂们纷纷为人工智能浪潮摇旗大喊,推出了一个又一个大模型,推出了方便能力调用的平台,推出了让开发者们沟通的社区,而开发者仍处于观望的心态。
个中原因不难解释。
人工智能毕竟是一个新生事物,落地过程中必然存在一定的障碍。问题在于,如果没有源源不断的开发者参与,生态繁荣就无从谈起。纵使口号喊得再响,人工智能也只是可望不可即的新技术罢了。
作为千行万业智能化转型的“蚂蚁雄兵&Rdquo;,势必要打消开发者群体的疑虑,为眼前的难题找到适合大多数行业的解法。不仅考验着每一个参与者的智慧,还决定着智能化的进程能够走多快、走多远。
02 昇腾AI的“通关指南&Rdquo;
从2022年开始,昇腾AI开发者创享日陆续走进西安、成都、北京、杭州、广州等17个城市,目的正是为开发者们提供一个深度探讨与交流的平台,倾听当地开发者的诉求,并不断输出解决方案。
对于开发者在智能化转型中的苦恼,昇腾AI没有直接回答。但我们从昇腾AI开发者创享日&Middot;天津站的活动上,看到了三个解题思路。
第一个思路是给开发者提供工具。
确切的说是昇腾全栈AI软硬件平台,包含Atlas系列硬件、异构计算架构CANN、AI框架MindSpoRe、应用使能MindX等等。
以技术揭秘环节重点提到的算子编程语言Ascend C为例,原生支持C和C++标准规范,最大化匹配了既有的开发习惯;并通过多层接口抽象、自动并行计算、孪生调试等技术,极大地提高算子开发效率,让开发者可以低成本完成大模型算子开发和模型调优部署。言外之意,开发者可以集中精力寻找最该去解决的问题,而非把时间和精力花费在不必要的开发过程上。
第二个思路是帮开发者提升能力。
智能化转型是个相当复杂的过程,既要降低AI开发的门槛,也要帮助开发者提升技能,有能力应对不断变化的外界需求。
特别是AI人才缺口越来越大的局面下,搭建人工智能人才生态与培养体系,无疑是解决问题的关键所在。除了昇腾AI引力学堂、CANN训练营等技术赋能和上手实操活动,在昇腾AI开发者创享日&Middot;天津站的活动上,当地12所高校的14个学院加入了昇腾万里人才加速计划,涵盖科研创新、研究论证、基础模型的研究与创新等,旨在以产学研用深度融合的方式培养更多的开发者。
第三个思路是为开发者指引方向。
不少开发者是远离一线的技术人员,缺少深入产业的机会,导致一些开发者“明明手里拿着锤子,却不知道钉子到底在哪里&Rdquo;。
同样是做AI原生应用,昇腾AI没有高喊口号,而是以赛促用。以昇腾AI创新大赛为例,在行业应用创新赛道和高校创新赛道之外,新增加了昇腾AI原生创新精英挑战赛,以3-4个月为一个赛事周期,鼓励开发者探索算法、算子、加速库等融合创新和性能优化,通过“急行军&Rdquo;的方式加速AI与行业融合,将CANN等基础能力与行业需求进行深度创新与实践,去解决实实在在的行业刚需。
沿用前面的比方,昇腾AI想要给开发者的不是一份照方去做的菜谱,而是一整套“通关指南&Rdquo;:让开发者低成本获取算力、提高开发的效率、理解产业的实际需求,以此深入场景,发掘、响应真实的行业需求。
03 和产业智能化同行
无可否认的是,智能化是一个宏大命题,开发者想要扮演起“渡舟&Rdquo;的角色,还需要从更大的维度上培养创新的土壤,消除AI工程化的阻力,让开发者们有机会、有渠道去释放创新的技术红利。
这也是昇腾AI开发者创享日&Middot;天津站想要表达的主张,进一步深入到当地的产业生态资源,为开发者营造适合生存的环境。
时间回到2022年8月,天津市人工智能计算中心正式启动建设,计划建设100P智能算力,四个月后便满载上线。2023年7月底,天津智算中心二期竣工上线,算力扩容到200P的规模。目标是在“一个中心、四个平台&Rdquo;的运营理念下,以普惠性的公共算力、全周期的技术支持、全链条的产业合作加速推动天津市创新应用和人工智能产业聚集发展。
昇腾AI开发者创享日&Middot;天津站的活动上,天津市人工智能计算中心在生态共建方面结出了新的“果实&Rdquo;&Mdash;&Mdash;“海河&Rdquo;系列大模型发布。
其中海河&Middot;岐伯是一款专注于中医药领域的大模型,主要应用于辅助中医药专业人才培养、辅助诊疗以及中医药养生保健等场景;海河&Middot;优医旨在为泌尿外科疾病提供精准的诊断与治疗方案,通过智能交流与问诊,能够自动采集病史信息,整合上传或扫描的检查报告,生成全面的电子病历、初步诊断和治疗建议。
需要回答的问题是,人工智能计算中心以及大模型生态共建等动作,和开发者的个体命运有什么关系呢?
或许可以从一位青年开发者的经历中找到答案。
南开大学计算机视觉实验室的陈铎晟,刚进实验室的时候还是AI领域的“小白&Rdquo;。因为天津智算中心和华为港口军团的合作,陈铎晟“被迫&Rdquo;学习了人工智能原理、深度学习以及昇腾AI有关的基础知识。
如同打通了“任督二脉&Rdquo;一般,陈铎晟迅速担起了车辆识别项目中的核心工作,利用昇腾AI基础硬件进行训练和推理开源模型,并不断优化代码以实现提高检测识别的精度,打磨出了高精度、内存小、计算少的智能港口车辆识别模型。陈铎晟本人也完成了从“小白&Rdquo;到项目负责人的华丽转身。
在昇腾AI生态里,像陈铎晟这样的开发者已经超过265万,他们并不被外界所熟知,但用自己的汗水和创新,解决了一个个困扰行业许久的业务难题,成为千行万业数智化转型升级的“无名英雄&Rdquo;。
同时也再次印证了一个朴实的道理:只要给开发者创新的土壤和机