深度学习:对实际问题解决者的简要指导

来源:互联网 发布:淘宝lol代练 编辑:程序博客网 时间:2024/06/02 21:24

深度学习:对实际问题解决者的简要指导

 

注:本文在翻译时,并未逐字逐句进行翻译,有些地方只是将其主旨翻译出来,需要查看详细的文章,其原文链接为:

http://www.infoworld.com/article/3003315/big-data/deep-learning-a-brief-guide-for-practical-problem-solvers.html Nov 102015

 

当处理预测问题时,相较于其他机器学习技术,深度学习无疑是更有效的方法。

 

深度学习将数据中的高级模式建模成复杂的多层网络,正在快速发展。深度学习是最长用的建模方法,它具有解决机器学习和人工智能中的富有挑战性的问题的潜质。像微软和google这样的公司,使用深度学习处理一些复杂领域的问题,像语音识别,图形识别,3-D物体识别,和自然语言处理。

 

但是,为了构建一个有用的模型,深度学习需要相当大的计算能力。时至今日,计算的成本和可用性仍然限制着它的实际应用。同时,研究者缺少经验和理论将深度学习用于实际中。在给定的时间和资源下,其它的方法通常表现的更好。

 

随着计算性能的提升,和创新算法的优秀建模能力,数据科学家将获得越来越多的经验和知识,利用深度学习解决问题。

 

媒体的报道总是趋向于称深度学习用于一些未来的应用中(如语音和图像识别),其实数据科学家将其用到很多的实际问题中。未来几年,一些商业的应用应该会用快速的发展。

 

深度学习的能力(优势)

 

与其它的机器学习技术相比,深度学习有4点主要的优势: 

 

      能够探查出特征间的复杂交叉关系。

 

      能够从较少处理过的原始数据中学习到低层特征。

 

      能够处理高基数类数据(work with high-cardinality class memberships)(注:一种含有大量离散值的数据)

 

       能够处理未被标记的数据(work with unlabeled data)(从未被标记的数据中学习潜在知识)

 

深度学习可以发现变量间的相互关联。相互关联是两个或多个变量间的组合而产生的影响。例如,一种药物,仅对年轻女性具有副作用。一个预测模型,包含性别和年龄的组合影响,会比仅考虑性别的模型要好。

 

传统的预测模型也能估量这些影响,但是需基于很多的手动假设检验。深度学习可以自动的探测其中的相互关系,而不依赖于分析者的专业知识或是先前的假设。

 

传统的预测方法很大程度上,依赖于数据科学家的能力,通过特征工程来对数据进行预处理,这个过程需要大量的领域知识和技能。

 

 

 

如上图所示,左上是深度学习训练的模型,右上是梯度提升机(gradient boosted machines),右下是一般的线性模型,左下是随机森林。从图中,可以看出深度学习模型的准确度。

 

深度学习的缺点(劣势)

 

深度学习训练得到的模型很难去解释。训练的模型通常包含许多层和上千个结点,去解释每个结点变得不太可能。数据科学家通常以预测结果来评价深度学习的模型效果,而将模型的自身结构视为“黑盒”。

 

训练的过拟合问题。当然,这个问题,其他的机器学习方法同样存在,可以通过诸如独立性检验的方法避免这个问题。

 

深度学习需要大量的计算资源去构建模型。同时,复杂性也是深度学习想要部署的一个潜在问题。

 


深度学习并不新,最早的技术可以追溯到20世纪50年代。随着计算成本的下降,数据容量的扩大,这项技术正在提高,对于深度学习的热情也在猛增。揭开大数据集下的隐藏关系,不需要领域专家,耗时的特征工程,甚至是大量的数据预处理,深度学习成为解决商业问题的一种引人注目的方式。

0 0
原创粉丝点击