人工智能 · 2024年1月27日

百度利用LinearDesgin算法在生物科学领域开发AI强引擎

文|曾响铃

来源|科技向令说(xiangling0815)

AI+医疗的想象力在哪?

作为国内AI行业的领跑者,百度以AI技术跨界生物科学领域的动作值得思考。

记得疫情刚刚爆发那会儿,百度免费开放LinearFold算法,可将病毒RNA分析从55分钟缩短至27秒的消息迅速在社会各界引起热议,AI战“疫”的力量以数据的形式清晰地呈现在人们眼前。

5月,百度研究院继而推出全球首个mRNA疫苗基因序列设计算法LinearDesign,用于设计优化mRNA序列。在AI+医疗上,百度再度迎来新的突破。

这一突破,更加备受瞩目。在2020中国互联网大会的公益盛典上,随着LinearDesign算法的研究宣传短片的放映,AI+医疗的话题再次被聚焦讨论。人们关注LinearDesign算法对医疗行业的促进,同时也更关注AI与产业结合的趋势。

LinearDesign算法是百度AI在生物计算领域的重要研究成果,它提供了一套更加直接和高效的解决方案,去辅助医药机构找到适合疫苗生产的mRNA序列。一经上线,这个算法便受到多家疫苗公司和医药机构的关注。

从某种程度来说,LinearDesign算法让市场与社会都看到了AI跨界与其他产业融合的一个潜力,在此即是AI+医疗的想象力。

LinearDesign算法诞生于百度AI的三维融合判断

那么,当我们聚焦在LinearDesign算法,便存在着诸多意义深刻的路径可以去讨论。

LinearDesign算法并不是一蹴而就的,很大程度上它是源于百度对AI行业和社会发展的判断和积累。正是基于这种判断和积累,才最终诞生了LinearDesign算法,也令我们看到了AI跨界产业融合的一些趋势。

首先,基于技术发展的导向来说,跨界融合是技术发展的最终导向。

此前,在2020国际大数据竞赛上,中国工程院副院长王辰院士与百度CTO王海峰展开了一场精彩的对话。在对话中,王辰院士对医学的理解很是深刻,他说道:“医学实际上最大的特点就是多学。”

对于AI而言,它的发展也是如此,最终会演化成为一门“多学”,表现为与其他领域、行业结合的导向。百度多年在AI领域深耕,深谙于此。

百度做AI,人人皆知。但是,百度跨界生命科学领域,鲜有耳闻。

事实上,在2018年,百度就已经开展了RNA二级结构领域的研究,并先后推出了全世界最快速的RNA结构预测算法LinearFold和全世界最快的RNA配分方程和碱基对概率预测算法LinearPartition等。

早期的跨界研究,为百度在生物计算领域的AI算法研究积累了大量专业的经验,使其能在2020年新冠疫情爆发之际快速反馈,两个月内即可上线LinearDesign算法。

其次,基于产业发展的阶段来说,产业与智能的融合是当前阶段的必然趋势。

2019年,百度CTO王海峰在年末演讲中就笃定,“AI进入大生产时代。”AI走向更加广阔的应用层,必然与其他领域完成新一轮的融合。

在中国发展研究基金会联合百度发布的《中国智能经济发展白皮书》里,对这一个趋势予以更加明晰的方向解释,一是智能产业化,二是产业智能化。在现阶段的两大基本方向下,AI跨界融合的趋势尤为明显。

基于对AI发展阶段的判断,百度很早就已经开始了对产业跨界合作的布局,毕竟目前早已不再是“闭门造车”的阶段。

以LinearDesign算法的研发来说,在其上线之前,百度研究院就开展了与斯坦福大学生物化学系Rhiju Das教授、罗彻斯特大学RNA生物中心主任David Mathews教授等世界顶级的RNA研究专家的专业合作。

很显然,LinearDesign算法的诞生正是得益于百度早前的合作布局。

最后,基于时代发展的需求来说,突发的新冠疫情加速推动了AI跨界发展的进程。

这是一个有趣的时间轴。LinearFold和LinearPartition两大算法的研发,百度花费了近两年的时间,而LinearDesign算法的上线,百度只用了两个月的时间。

从两年到两个月,不仅仅是百度在生物计算领域的专业积累,更得提一下新冠疫情的刺激和催化。自疫情爆发以来,越来越紧迫的局势让人们开始聚焦在科技手段。

从免费开放LinearFold,缩短RNA分析时间上取得的积极反馈,百度看到了AI技术在生命科学领域的价值,积极寻求将AI技术转化为社会力量的路径。于是,百度研究院锚定生物计算领域,进而研发了一套设计最优mRNA序列的新算法——LinearDesign。

诚然,LinearDesign算法的上线,是百度研究院两个月的研发,也是百度近几年在生物计算领域的积累。百度对于技术发展、产业发展和时代发展的三维预判,成为了这套算法诞生的三个基本条件。

聚焦LinearDesign算法,AI大生产时代“水到渠成”

当我们聚焦LinearDesign算法的价值反馈,时代显然需要AI技术与其他产业的融合。

那么,再回想起百度CTO王海峰的判断,“AI进入大生产时代”,这个时代下的AI跨界融合又将为行业发展带来哪些思考?

或许,从行业的角度来说,至少有三点值得思考。

1.跑通AI“第一曲线”,LinearDesign算法跳至“第二曲线”。

通过对管理学家查尔斯·汉迪提出的“第二曲线”理论的理解,我们可以总结出技术发展的一个趋势。当单一的技术发展到达极限点,若想迎来新的突破,那么就有必要与其他的产业融合应用,发掘破局点。

LinearDesign是一套设计最优mRNA序列的AI算法。其核心还是以AI技术为主,在应用上向生命科学领域跨越。很显然,百度在跑通了AI的“第一曲线”,LinearDesign算法是其跳至“第二曲线”的表现。

事实上,也正是LinearDesign算法的高效反馈,让百度拥有了跨界生命科学领域的底气,也让学术界和生物制药行业的企业看到了百度在AI算法领域的优势。可以说,这为百度布局生命科学产业提供了契机。

据悉,在LinearDesign算法上线之后,百度以此与多家中外学术机构和生物制药企业开展了交流与合作,并与中国疾病预防控制中心病毒病预防控制所签署了战略合作协议,联合设立“中国CDC应急技术中心 – 百度基因测序工作站”,等等。

不得不说,百度AI借助LinearFold、LinearPartition、LinearDesign等多个算法在生命科学领域已然成功跳跃到了“第二曲线”,进而实现新的增长。

2.LinearDesign算法解决医药痛点,医疗场景反哺AI成长。

AI跨界产业融合是一个双向哺育的过程。以AI+医疗来说,AI技术在加速改革医疗模式同时,医疗行业也在为AI技术的应用构建了场景,双向促进在加速产业融合发展。

LinearDesign算法是一个明显的呈现。在现有的mRNA疫苗研发上,存在一个巨大的挑战,即mRNA疫苗的稳定性问题。这是一个医药研究的痛点,对此百度则尝试运用AI技术来更高效的解决这个问题。

于是,LinearDesign算法上线,并针对性的解决mRNA序列不稳定的问题。“它设计了一组结构更稳定的序列,并使用翻译效率高的密码子。”罗彻斯特大学教授、RNA生物中心主任David Mathews对此解释道,并予以了高度的认可。

同时,在新冠病毒的刺突蛋白序列上的计算机模拟实验表明,LinearDesign能够设计出结构最稳定的序列,而且设计时间只需要1个半小时。如果采用线性时间近似算法,所需时间可以进一步缩短到11分钟。

很显然,疫情所构建的医疗场景,成为百度的AI算法研发的催化剂。而通过这个催化,百度的AI算法也在辅助医药机构解决行业痛点。双向的促进,不管是对于医疗行业或是AI领域,都具有明显的价值反馈。

3.LinearDesign算法还有第二轮跨界,AI没有边界。

LinearDesign算法最早是源于新冠病毒的mRNA疫苗研发,但是其本质作为一个优化序列的算法,凡是涉及到序列设计的领域,都具备应用空间。也就是说,除了用于新冠病毒mRNA疫苗的研发,LinearDesign算法还能用于个性化肿瘤药物等其他mRNA药物、抗体和疫苗的研发。

很显然,AI技术本身不具备特定的边界,在跨界融合的过程中,具有较强的通用特征,如LinearDesign算法。诚然,AI进入大生产时代,对产能的重视程度越来越高。AI在跨界融合的过程中如何避免“重复造轮子”的资源浪费,是目前科技企业需要聚焦的问题。

为此,通用化、平台化的AI产品或服务往往具有更加广泛的市场空间。以百度来说,除了LinearDesign算法之外,旗下的百度大脑、飞桨、DuerOS开放平台等AI产品都是如此,打破边界性应是未来AI跨界应用常态化的发展。

结语

从LinearDesign算法的聚焦到AI产业跨界融合的讨论,我们都不难看出,如今的科技的发展正在不断整合优化,越来越多的技术被应用于各行各业。就医疗行业来说,AI+医疗的想象力不仅仅在于AI巨头的技术赋能,也在于医疗行业的场景构建。

那么,随着百度与生命科学领域的合作交流愈发深入,也意味着前者的

OpenMagic API

Need more than content? Move into the product flow.

If you are here for model access, pricing, developer docs, or the future API console, the dedicated product path now lives on api.openmagic.ai.

登录免费注册