三年前,谷歌大脑研究人员宣布创建了自动化机器学习平台——AutoML,该AI系统能够创造自己的AI系统。AutoML的诞生试图探讨这一技术能否让更多行业专家能够跨越工程与算法的障碍,仅利用专业知识和数据积累,可以在机器的帮助下完成深度学习算法的开发。从而大大提高模型设计效率,实现人工智能平民化。
在其内部,探智立方就是持有这种关注的一家公司,这家同样是三年前成立的国内人工智能企业致力于开发一个有“自动模型设计”能力的平台——DarwinML。那样,DarwinML以进化算法为基础,找到模型不依赖人工设计的“进化之路”,从而降低人工智能的应用门算法,让各行业的IT人员,行业专家能更容易地将人工智能落地于各种适合并需要的场景中,解决人才补充及技术能力不足的普遍问题。
基于进化算法的AutoML路线
在AI自动模型设计方面,AutoML的实现路径实际上包括四个大方向:强化学习,进化算法,迁移学习方法及元学习(MetaLearning是未来有潜力的方向之一),目前各家公司的实现路径不同,不过大多数采用的是迁移学习。与众不同的是,探智立方一直坚持探索进化算法方向。
不过可能也有缺点:需要背靠足够大的数据科学家团队,以及特定领域中丰富的模型种类。我们可以看到今天AutoML产品在图像领域里效果最优,这是因为图像领域中可以获取的资源是最多的(并非是模型,甚至模型权重都有开源)。
但在大量其他领域,如果希望对逐步,结构化数据进行处理和分析,没有一定之规,也没有现成成重,迁移的方法或许就无法适用了。
同时,基于序列模型的方法和元学习方法超越面临的搜索空间过大后导致运算量需求指数级上升等不同挑战。
在最重要的是,进化算法提供了另外一个途径:它是真正有机会在机器学习模型设计任务中超越人类的不论是DAS还是NASNet,其初始条件都是固定配置。进化算法没有这个限定,它能够创造出全新的网络结构,可能是有人从未设计出过的模型。”
AutoML的实际应用
钱广锐介绍:“如今的学界对AutoML的研究主要集中在方法论本身,而探智立方更多关注如何能够让AutoML技术用户实际的数据结合,在项目中落地。我们开发的DarwinML平台,在帮助下大量的用户学习了自己的数据,训练自己的模型的过程中,也让平台越来越聪明,能够更高效地帮用户实际解决问题。”
“一个由3个人组成,经验2-4年的数据科学团队,在一到两周时间内设计出来的模型,在使用DarwinML的情况下,目前,DarwinML已经可以大幅度提高数据科学家的工作效率了。可以做到效果更好,而且机器的模型生成时间不超过一天。”宋煜表示。可以预见,在不远的未来,探智立方在自动化机器学习(AutoML)方面的技术能力,将进一步助推人工智能的加速落地。
探智立方解决方案总监徐宁和产品总监宋煜
有兴趣的企业客户和行业专家可登录探智立方的网站:www.iqubic.net,或按以下方式进行体验。