当今社会,伴随着互联网的高速发展,资源的匮乏,是如今开源是创新的核心,推动着技术的飞速革新。目前机器学习红遍全球。男女老少都在学机器学习模型,分类器,神经网络和吴恩达。你也想成为一份子,但你该如何开始?

在这篇文章中我们会讲Python的重要特征和它适用于机器学习的原因,介绍一些重要的机器学习包,以及其他你可以获取更详细资源的地方。

为什么用Python做机器学习

Python很适合用于机器学习。首先,它很简单。如果你完全不熟悉Python但是有一些其他的编程经验(C或者其他编程语言),要上手是很快的。其次,Python的社区很强大。这使得Python的文档不仅条理性好,而且容易读。你还可以在StackOverFlow上找到关于很多问题详细解答(学习基石)。再次,一个强大的社区带来的副产品就是大量有用程序库(Python内部自带的和第三方软件),基本上可以解决你所有的问题(包括机器学习)。

值得知道的Python程序库

Scikit-learn

你刚开始学机器学习吗?如果你需要一个涵盖了特征工程,模型训练和模型测试所有功能的程序库,scikit-learn是你的最佳选择!这个优秀的免费软件提供了机器学习和数据挖掘所需要的所有工具。它是目前Python机器学习的标准库。要使用任何成熟的机器学习算法都推荐使用这个库。

这个程序库支持分类和回归,实现了基本所有的经典算法(支持向量机,随机森林,朴素贝叶斯等等)。程序库的设计让迁移算法十分容易,使用不同的算法做实验非常轻松。这些经典算法可用性很强,能用于大量不同的情况。

但这并不是Scikit-learn的全部功能,它同样可以用来做降维,聚类等等任何你所能想到的。由于它构建在Numpy和Scipy之上(所有的数值计算都是由C语言来完成的),它的运行速度也超快。

以上的例子都是在告诉你这个数据库的功能性,如果你想要去学习使用它,可以到网上找些机器学习教程。

 



相关文章