本节提供广为流行的人工智能机器学习类型的概述。如果你已经熟悉这些算法,并希望继续讨论特定算法,则可以跳过本节并转到下面的「何时使用特定算法」。

1. 监督学习(Supervised learning)

监督的学习算法基于一组样本进行预测。例如,它可以使用历史售价来估计未来售价。在监督学习里,输入变量包含带标签的训练数据和你感兴趣的某个输出变量。通过某种算法分析训练数据,就是一个学习将输入映射到输出的函数的过程。这个推断函数对训练数据进行泛化,即可预测未知情况下的结果,将新的未知输入映射到输出。

分类:当数据用于预测分类变量时,监督学习也称为分类。如将标签或指示符,像狗/猫分配给一张图片就是这种情况。当只有两个标签时称为二分类。当有两类以上时,称为多分类。
回归:当预测连续值时,就是一个回归问题。

预测:这是根据过去和现在的数据对未来进行预测的过程。最常用来分析趋势。一个常见的例子是根据今年和前几年的销售情况估计下一年的销售额。

2. 半监督学习(Semi-supervised learning)

有监督学习的挑战是标注数据的过程可能既昂贵又耗时。如果标签有限,我们可以使用未标记的样本来增强有监督学习。因为在这种情况下机器没有被完全监督,所以我们说是它是半监督的。在半监督学习里,我们同时使用未标记数据与少量标签数据,从而提高学习准确性。

3. 无监督学习(Unsupervised learning)

执行无监督学习时,机器得到的是完全未标记的数据。这一算法常用于发现基础数据的内在模式,如聚类结构,低维流形或稀疏树/图。

聚类:对一组数据样本做分组,使相似的样本归入一个组(或一个集群)中(根据某些标准)。这通常用于将整个数据集分成几组,以便在每个组中进行分析,帮助用户找到它们的内在模式。

维度约减:减少需要考虑的变量数量。在许多应用中,原始数据具有非常高的维度特征,并且一些特征是冗余的或与任务无关的。降低维度有助于找到真实的,潜在的关系。

4. 增强学习(Reinforcement learning)

增强学习基于环境的反馈,达到分析和优化代理 (agent) 行为的目的。机器学习尝试不同的场景来发现哪些行为产生最大的回报,而不是被动接受行动指令。试错和延迟奖励将强化学习与其他技术区分开来。



相关文章