机器学习在经过20年的发展之后,现在已经成为一个热门的行业,机器学习目前有非常广泛的应用,如数据挖掘、计算机视觉、自然语言处理、生物识别、搜索引擎、医学诊断、DNA测序、语音和手写识别、策略游戏或机器人等。

在GitHub上,云社区专门翻译并编译了28个最流行的开源在线机器学习项目,供开发人员参考。

TensorFlow是谷歌发布的第二代机器学习系统。根据谷歌,在一些基准测试中,在第一代的膨胀率是第一代的两倍。

具体来说,TensorFlow是一个基于数据流图(数据流图)数值计算的开源软件图书馆:图中节点(节点)代表数学运算,同时图像的边缘(边缘)多维数组表示节点之间的循环,即张量(张量)。这种灵活的架构允许用户在台式机、服务器或移动设备上的一个或多个cpu上进行多变量计算,而无需重写代码;与此同时,任何基于梯度的机器学习算法都可以从张力的自动微分学中学习。此外,通过一个灵活的Python接口,可以更容易地在TensorFlow中表达思想。

最初由谷歌大脑团队(该团队隶属于谷歌的机器智能研究机构)的研究人员和工程师开发,开发目的用于机器学习和神经网络研究的深度。但它的多功能性足以使其在其他计算领域得到广泛应用。

目前谷歌内部有很多AI技术,包括谷歌App语音识别、Gmail自动回复功能、谷歌照片图像搜索等,使用TensorFlow。

开发语言:c++

许可协议:Apache许可2.0。

使项目地址:https://github.com/tensorflow/tensorflow

scikitt -learn是一个基于SciPy的机器学习的Python模块。该项目由David Cournapeau于2007年创建,当时该项目名为GuGe Summer of Code,自那以后,许多志愿者都做出了贡献。

主要特点:

scikitlearn的基本功能主要分为六个部分:分类、回归、聚类、数据还原、模型选择和数据预处理,这些都可以参考官方网站上的文档。在测试之后,scikit-learn可以运行在Python 2.6、Python 2.7和Python 3.5上。另外,它应该能够运行在Python 3.3和Python 3.4上。

注:scikit-learn是以前被称为Scikits.Learn。

开发语言:Python。

许可协议:3条款BSD许可。

使项目地址:https://github.com/scikit-learn/scikit-learn

Caffe是一种由神经网络的表达式、速度和模块性生成的深度学习框架。后来,由伯克利视觉和学习中心(BVLC)和社区参与者对伯克利的发展做出了贡献,然后再与制作和Caffe结合——用户通过电子邮件发送了一个相对松散和自由的社区。

Caffe是一个c++ /CUDA框架,允许开发者使用他们的自由网络组织,目前支持卷积神经网络和完全连接的神经网络(人工神经网络)。在Linux上,c++可以通过命令行操作该接口,该命令行还具有用于MATLAB、Python和CPU和GPU的特殊接口。

目前,Caffe应用实践主要包括数据整理、设计网络结构、培训结果,以及基于现有的培训模式,这是Caffe直接承认的。

开发语言:c++

许可协议:BSD 2条款许可。

使项目地址:https://github.com/BVLC/caffe

PredictionIO是开发人员和数据科学家的开源机器学习服务器。它通过REST api支持事件收集、算法调度、评估和查询结果。用户可以通过预测来进行预测,比如个性化的推荐和发现内容。PredictionIO提供了20种预定义的算法,开发者可以直接在自己的数据上运行。几乎任何应用程序和预测集成都可以变得更加“智能”。其主要特点如下:

PredictionIO基于REST API(应用程序接口)标准,但它还包括用于编程语言(如Ruby、Python、Scala和Java)的SDK(软件开发工具包)。开发语言是Scala语言,数据库使用MongoDB数据库,计算系统采用Hadoop系统架构。

开发语言:Scala。

许可协议:Apache许可2.0。

使项目地址:https://github.com/PredictionIO/PredictionIO

 

 



相关文章