大数据概述及其生态圈(一)
来源:互联网 发布:简单的二进制算法 编辑:程序博客网 时间:2024/06/11 19:44
大数据是什么
经常听别人说“我要去学习大数据”,乍一听大数据应该是某个技术。
百度解释:无法在规定时间内用给现有的常规软件工具对其内容进行抓取、管理和处理的数据集合。通俗讲,大数据就是大到难以处理的数据集合,是社会技术发展过程中碰到的棘手问题。
于是,我们为了解决这个问题,衍生出各种技术,而这些技术才是我们学习的内容。所以说,“我要去学习大数据”完整的说法应该是“我要去学习处理大数据问题的技术”。
大数据技术生态圈
先放图:
注:图中左侧是技术大分类,右侧是技术细分,括号中是列举的具体技术关键字
大数据技术分类详解
遮住右边的技术细分,我们看左边的五个大分类。我用一个通俗的案例帮助大家理解和记忆。
假设,现在我们要搞大数据了,买来了200台计算机,并整齐地放在了某个房间里。那么问题来了,怎么有效的组织这些计算机,让它们协同工作呢?“技术架构支持”这类技术就是为了解决这个问题。
好了,现在我们已经将200台计算机有效组织,并能配合工作。开始搞大数据,哎?一拍脑瓜,数据哪来?“数据采集”呼之欲出,它帮你解决数据哪来的问题。
现在,我们已经找到了数据源,并且有了采集的技术,但是呢,我们放哪啊?“数据存储”技术为你服务。
一步步攻克难题,我们现在已经可以从我的网站或者各类系统将数据持续不断地存储到一个数据仓库。那么我们如何使用这些宝贵的数据,挖掘出它们无尽的价值呢?“数据计算”登场了。
万事俱备,就差最后一步了。现在我们已经从大量数据中挖掘提取出了有价值信息。我们需要展示出来啊!对,“展示和交互”氤氲而出。
到此,我们的大数据实践之旅完美结束。
技术细分和相关具体技术的讲解,由于时间原因,将留到下一节中。
1 0
- 大数据概述及其生态圈(一)
- 大数据概述及其生态圈(三)数据采集
- 大数据概述及其生态圈(二)基础架构支持
- 大数据生态圈
- 大数据技术生态圈
- 一图简述大数据技术生态圈
- 大数据分析技术生态圈一览
- [036]大数据生态圈概览
- 大数据分析技术生态圈一览
- 七张图全面了解大数据生态圈
- 【大数据 hadoop】hadoop生态圈
- 大数据基础知识点---hadoop生态圈
- Spark 及其生态圈
- 一文教你看懂大数据的技术生态圈 Hadoop,hive,spark
- 一文教你看懂大数据的技术生态圈:Hadoop,hive,spark
- 一文看懂大数据的技术生态圈,Hadoop,hive,spark都有了
- 一文教你看懂大数据的技术生态圈:Hadoop,hive,spark
- 一文教你看懂大数据的技术生态圈:Hadoop,hive,spark
- Codeforces Round #369 (Div. 2)
- LeetCode 42 Trapping Rain Water
- MySQL锁定状态查看命令
- numpy.flatten() 与 numpy.ravel()的区别
- MM 收货容差如何设定
- 大数据概述及其生态圈(一)
- Extjs组件的生命周期
- 数据库事务隔离级别
- AndroidStudio上项目和git项目互传
- Java并发编程:Timer和TimerTask(转载)
- Android中自定义属性attr.xml的格式详解
- struts2中通过Action以InputStream的下载文件以及在iOS以及Android端接收的实现方式
- 浅读HDFS文件上传部分的过程源码
- 大数据痛点:政府部门不会轻易放开掌握的数据