机器学习这个词是个谜。从字面上理解,它是英文名称Machine Learning机器学习(ML)的字面翻译,它指的是计算机世界中的计算机。这个名字使用了拟人化技术来说明允许机器“学习”的技术。但电脑是死。他们怎么能像人类一样学习?

传统上,如果我们想让计算机工作,我们给它一堆指令,然后它按照指令一步一步来。因为水果,很清楚。但这在机器学习中不起作用。机器学习根本不接受你的输入。相反,它接受您输入的数据!换句话说,机器学习是计算机使用数据而不是指令来完成各种工作的一种方式。这听起来很疯狂,但实际上很实用。“统计”的概念将是你学习“机器学习”概念的时候,而相关性的概念,而不是因果关系,将是支持机器学习的核心概念。你将颠覆这个基本观点,即在你之前所有的项目中,因果关系无处不在。

这里有一个故事可以简单地说明机器学习是什么。这个故事更适合澄清概念作为一个概念。在这里,故事没有展开,但相关的内容和核心存在。如果你想学习一些关于机器学习的知识,就足够阅读这个故事了。如果你想更多地了解机器学习和与之密切相关的当代技术,请继续寻找。有更多的。

我相信大家都有跟别人相约,然后等人的经历。现实中不是每个人都那么守时的,于是当你碰到一些爱迟到的人,你的时间不可避免的要浪费。我就碰到过这样的一个例子。

我有一个朋友,他从来就不是那么守时,最常见的表现是他经常迟到。当有一次我跟他约好在某个地方见面时,在我出门的那一刻我突然想到一个问题:我现在出发合适么?我会不会又到了地点后,花上30分钟去等他?我决定采取一个策略解决这个问题。

要想解决这个问题,有好几种方法。第一种方法是采用知识:我搜寻能够解决这个问题的知识。但很遗憾,没有人会把如何等人这个问题作为知识传授,因此我不可能找到已有的知识能够解决这个问题。第二种方法是问他人:我去询问他人获得解决这个问题的能力。但是同样的,这个问题没有人能够解答,因为可能没人碰上跟我一样的情况。第三种方法是准则法:我问自己的内心,我有否设立过什么准则去面对这个问题?例如,无论别人如何,我都会守时到达。但我不是个死板的人,我没有设立过这样的规则。

事实上,我相信有种方法比以上三种都合适。我把过往跟她相约的经历在脑海中重现一下,看看跟他相约的次数中,迟到占了多大的比例。而我利用这来预测他这次迟到的可能性。如果这个值超出了我心里的某个界限,那我选择等一会再出发。假设我跟她约过5次,他迟到的次数是1次,那么他按时到的比例为80%,我心中的阈值为70%,我认为这次她应该不会迟到,因此我按时出门。如果她在5次迟到的次数中占了4次,也就是他按时到达的比例为20%,由于这个值低于我的阈值,因此我选择推迟出门的时间。这个方法从它的利用层面来看,又称为经验法。在经验法的思考过程中,我事实上利用了以往所有相约的数据。因此也可以称之为依据数据做的判断。依据数据所做的判断跟机器学习的思想根本上是一致的。

刚才的思考过程我只考虑“频次”这种属性。在真实的机器学习中,这可能都不算是一个应用。一般的机器学习模型至少考虑两个量:一个是因变量,也就是我们希望预测的结果,在这个例子里就是她迟到与否的判断。另一个是自变量,也就是用来预测她是否迟到的量。假设我把时间作为自变量,譬如我发现她所有迟到的日子基本都是星期五,而在非星期五情况下他基本不迟到。于是我可以建立一个模型,来模拟她迟到与否跟日子是否是星期五的概率。

如果我把这些建立模型的过程交给电脑。比如把所有的自变量和因变量输入,然后让计算机帮我生成一个模型,同时让计算机根据我当前的情况,给出我是否需要迟出门,需要迟几分钟的建议。那么计算机执行这些辅助决策的过程就是机器学习的过程。

机器学习方法是计算机利用已有的数据(经验),得出了某种模型(迟到的规律),并利用此模型预测未来(是否迟到)的一种方法。通过上面的分析,可以看出机器学习与人类思考的经验过程是类似的,不过它能考虑更多的情况,执行更加复杂的计算。事实上,机器学习的一个主要目的就是把人类思考归纳经验的过程转化为计算机通过对数据的处理计算得出模型的过程。经过计算机得出的模型能够以近似于人的方式解决很多灵活复杂的问题。

从以上的分析可以看出,机器学习与人类思维的体验过程是相似的,但它可以考虑更多的案例并进行更复杂的计算。事实上,机器学习的主要目的之一是将人类思想诱导的过程转化为通过数据处理来计算的过程。计算机模版可以用相同的方法解决许多轻巧和繁杂的问题。



相关文章