你可能对机器学习感兴趣,或者对它略知一二。如果有一天你和朋友或同事谈论机器学习,有些人可能会问你“机器学习是什么?”这篇文章的目的是给你一些参考定义,以及一个现成的、容易记住的有趣定义。

我们将从这一领域对机器学习的标准定义的理解,以及对机器学习的程序员定义,当我们问到机器学习是什么时,我们可以用现成的笑话结束。

权威的定义

让我们从机器学习参考书开始,这些参考书通常在四门大学课程中使用。这些是我们对权威的定义,为我们更深入地思考这个问题奠定了基础。我选择这四本书来强调这一领域的一些有用和不同的观点。经验告诉我们,有很多方法可以做到这一点,所以选择正确的角度是取得进步的关键。

米切尔定义机器学习。

汤姆·米切尔,在他的机器学习介绍中(中文:计算机科学系列:机器学习),提供了一个定义:

“机器学习的问题在于计算机程序如何自动地用经验提高性能。”

我喜欢这个简单明了的定义,这是我们在文章结尾提出的程序员定义的基础。注意“计算机程序”和“自动增强”这个词。编写程序来提高自己,这是一种挑衅!

在他的介绍中,他反复提到了一个简短的表单系统:

“在某些任务中,如果一个计算机程序以经验和自我完善的方式来衡量一个计算机程序的性能,那么我们就把它称为从经验中学习的一个计算机程序。”

不要让术语定义吓跑你。它是一个非常有用的表单系统。我们将这个正式的系统作为一个模板,以经验E,任务T,和性能测量P在一个表的顶部,并且列出复杂的问题,不那么模棱两可。它可以作为一种设计工具,帮助我们清晰地思考要收集什么数据(E),做出什么决定(T),以及如何评估结果(P)。这就是为什么我们将它定义为标准定义。请记住。

统计学习基础

“统计学习的要素:数据挖掘、推理和预测”是由斯坦福大学的三位统计员撰写的,它将自己描述为组织探索其领域的统计框架。它在前言中写道:

“在许多领域有很多数据,统计学家的工作就是让所有这些数据有意义:提取重要的模式和趋势,了解数据的含义。”我们称之为从数据中学习。

我所理解的统计学家的工作是使用统计工具来解释数据。作者似乎想把所有机器学习作为辅助工具。有趣的是,他们选择将“数据挖掘”包括在书名中。

统计学家从数据中学习,但软件也可以,我们从软件中学习,从各种机器学习方法和学习结果中做出的决定。

模式识别

Bishop在前言中写道“模式识别和机器学习”:

“模式识别来自工程,机器学习来自计算机科学。”然而,这些领域可以在同一领域的两个方面看到。

看着这个,你会觉得毕肖普从工程学的角度来到这个领域,然后用同样的方法学习和使用计算机科学。这是我们应该效仿的成熟方法。更广泛地说,是否一个方法声称区域,如果它可以通过从数据中学习我们得到更深入的了解或结果,从而更符合我们的需求,所以我们称之为机器学习。

算法的角

Marshland使用了米切尔在机器学习中的机器学习定义:一个算法视角。在他的序言中,他为他的书提供了有力的解释:

机器学习最有趣的一个特点是它存在于几个不同的理论学科之间,主要是计算机科学、统计学、数学和工程学。机器学习经常被作为人工智能的一部分来研究,它被牢牢地嵌入在计算机科学中。要理解为什么这些算法有效地工作需要一定数量的统计和数学的复杂性,这往往是计算机科学专业的本科生所缺乏的技能。

这是深刻和有益的。首先,他强调了该领域的多学科性质。虽然我们从上面的定义中得到了这样的感觉,但他进一步强调了这一点。”

 



相关文章