大数据的门口

来源:互联网 发布:linux系统更改ip地址 编辑:程序博客网 时间:2024/06/10 00:21

初来乍到,小兵一枚;


中关村老师介绍到:

(题外话:大数据分析就是可以预测未来事物的方法,简称算卦,而且相当准哦!)


大数据的定义:超出常规手段获取的大量数据集


特征:

          Voluem:数据量大,包括采集,存储和计算的量都特别大;

          Variety: 种类和来源多样化;

          Velocity:  数据增长速度快,处理速度也快;

          Veracity:数据的准确性,垃圾邮件代表的网络垃圾困扰着大数据发展;

          Value:数据价值密度相对较低,却又弥足珍贵;


Variety--种类和来源多样化其中包括以下几种:

结构化数据——关系型数据表

半结构数据——邮件,HTML,报表,XML文档,Json

非结构化数据——WEB日志,实时多媒体,社交网络数据,文档类型数据


/1PB = 1024TB = 1,048,576 GB/

/1EB = 1024PB = 1,073,741,824GB/

/1ZB = 1024EB = 1,099,511,627,776GB/


人类文明开始到2003年地球共产生了5EB数据;

2012年全年,全球产生数据2.7ZBZ是2003年以前的500倍;

2015年,全球估计产生数据8ZB,等于1800万个美国国会图书馆;


好啦,小兵明天再来!



原创粉丝点击