AutoML和AutoDL:简化

2019-07-02 02:41发布

点击上方关注,All in AI 中国

什么是AutoML?

作为一名数据科学研究工程师,任何问题陈述的最耗时的任务都是数据分析、试验和选择正确的算法和参数调整。所有这些都需要人类的专业知识,这也是数据科学家如今如此重要的原因。

但如果可以消除这种人为干预呢?如果可以制作出能够选择正确算法的模型,进行数据分析和微调以获得完美模型的情况怎么办?这就是AutoML的全部内容,且肯定是完全自治系统的下一步。

其他类似术语包括AutoDL、AutoCV和AutoNLP,用于表示深度学习、计算机视觉和自然语言处理领域的模型。例如,用外行人的话来说,AutoCV的目标是创建一个单一的系统,可以承担任何计算机视觉问题,理解数据并选择正确的工作方式来处理它,所有这一切都不需要任何人为干预。

为何选择AutoML?

机器学习和人工智能现在正在炒作,并且已经有很多研究方向被称为近年来该领域的未来。 AutoML,或者有些人喜欢称之为元学习,粗略地讲,是一种关于学习的学习形式。

自成立以来,ML的研究一直在不断发展,我们已经创建了各种各样的模型和系统,每个模型和系统都针对特定的问题陈述。然而,我们现在处于这样一个阶段,我们可以将这些模型结合起来,并在某种意义上,在层次结构中向上移动。由于我们的最终目标是达到层次结构的顶层并创建一个自治系统,我想说这些元模型的炒作绝对是值得的。

基于Google Cloud的AutoML服务

AutoML与ML有何不同?

在ML中,数据科学家首先从问题陈述和数据集开始。对数据进行分析和清理,确定性能指标,然后根据人类直觉对可能在数据集上工作的一些模型进行实验。在我们最终达到可接受的模型之前,有很多特征工程和微调。

AutoML试图尽可能多地自动化这个管道。虽然其中一些步骤更易于自动化,例如模型微调,但有些步骤非常困难,例如选择正确的架构/模型等。总之,AutoML是关于尝试创建一个单一系统,在建模和训练过程的每一步都不需要人工干预。

它有多成功?

最近在AutoML和AutoDL领域已经做了很多工作。我认为这在很大程度上应该归功于AutoML最近举办的多个竞赛,它们试图改善这个领域,并邀请创新的想法。

谷歌已经创建了自己的基于云的AutoML平台,可以帮助那些对ML一无所知的人们使用ML。然而,使用他们的模型非常昂贵,仅适合那些愿意花费相同的钱的企业。

还有很多成功的开源平台,如Auto-Sklearn和Auto-keras,它们已经成功地为每个人提供了免费的AutoML领域的最新进展!

下一步是什么?

AutoML已经取得了几年前无法实现的成功,而谷歌这样的平台已经能够建立能够将数据科学家从常用机器学习流程中删除的系统。但我们仍然远离所谓的真正的自治系统很远。

文章来源: https://www.toutiao.com/group/6708629818176438791/