科技行业一直都有炒作的问题,总是专注于“下一个工件”,永远对世界将会是什么样子大惊小怪。在他们认为正在增长的增长市场中抢占地盘时,制造商的本质是追逐热点,一个接着一个。

很容易理解为什么机器学习在安全领域被过分夸大了。随着攻击者的复杂性稳步上升,越来越多的高端技术被引入攻击方法,被称为异常快速强大的机器智能来寻找和停止威胁,这似乎是一个非常好的主意。

但是,夸大安全技术的能力和有效性是十分危险的。听信不实宣传的公司,有可能产生一种虚假的安全自信,反而沦为攻击受害者。而且这种案例还会对安全业其他同行的信誉也添上污名。

我们要先搞明白,机器学习并不能预测股市是有原因的。因为最先进的技术之所以有限制不是因为没有足够多的机器学习用例而是人们必须开阔视野,给予正确的指令。

让我们来看一些例子。

视频

很难处理视频。通常假设视觉(面孔、图像、物体、OCR等)与视频中的图像机器是一样的,但情况并非总是如此。数字视频是一个结合编码器和压缩比和宽度的世界。

在处理视频时,必须使用较低的分辨率,否则会消耗大量资源,可能要等上几年才能完成。但大多数情况下,如果频率低或者视频压缩高,就会得到部分帧。你可以在维基百科的图片条目中搜索更多关于图片组(图片组,大老党)的结构信息,以及它是如何工作的,但问题是视频文件不一定是连续的静止图像。因此,通过绘制人脸识别和图像识别的框架来识别视频,与对一系列静态照片的识别有很大的不同。

你可以通过暂停任何 YouTube 视频来自行测试。要注意人们的面部表情有时会显得很奇怪,有时变得模糊或变得不像本人。下面是 Rick Santorum 的影片的冻结帧的例子。

从人脸识别的角度来看这些人脸:

这是一个人脸识别系统所看到的:

你能告诉我左边那个人就是 Rick Santorum 吗?如果你不知道,那电脑也可能辨认不出来。

作为一个人,观看视频并识别人物非常容易。但是如果你把每一帧都拉出来看,你就会开始注意到数据的质量并不总是像你想的那么好。

这是否意味着你不应该在视频中使用机器学习?当然不是。机器学习是自动分类和标记资产的好方法。诀窍在于对结果设定合理的期望。所有的地球上的名人收集模型的这个视频将会得到大量的假正类(即,错误识别),相反,如果模型只收集在美国是,在视频中结果将会更好。但是,即使您不能以这种方式管理一个经过培训的模型,您仍然可以通过查看整个数据来获得价值。如果Rick Santorum在视频中是独立的,那么在大多数情况下,模型可以正确地识别人。你可以看到他会出现在那个时间点,然后对他可能出现在视频中的可能性做出一些假设。这一切并不适用于每个用例,但是如果您计划做一些尝试,尝试不同的工作流程和模型(思考是解决问题的方法),那么您就会成功。

如何通过机器学习获得成功

正如刚才所言,机器学习是惊人的。它能在很短的时间内完成非凡的事情。我们公司的一个客户用它来识别虚假的数以百万计的文章在期刊上的研究文章和其他客户使用面部识别确认参加考试的人员。

通过向他们展示他们更有可能购买的东西来增加电子商务网站的收入。这是一个很好的例子,因为假正类和负类并不会影响收入的增长,甚至有时会有所帮助,因为它们是通过显示客户在平时不注意事物的情况,就等于让客户看到了新的类别。

人们使用自然语言处理(NLP)来处理文本以提高搜索性能,并选择更容易触发你购买欲望的照片。机器学习越来越适用于我们的生活。如果你知道你的期望,那么机器学习可以给你带来无限商机



相关文章