大数据的四个典型特征
来源:互联网 发布:多媒体排序播放软件 编辑:程序博客网 时间:2024/06/10 04:02
大数据(Big Data)是指“无法用现有的软件工具提取、存储、搜索、共享、分析和处理的海量的、复杂的数据集合。”业界通常用4个V(即Volume、Variety、Value、Velocity)来概括大数据的特征。
一是数据体量巨大(Volume)。截至目前,人类生产的所有印刷材料的数据量是200PB(1PB=210TB),而历史上全人类说过的所有的话的数据量大约是5EB(1EB=210PB)。当前,典型个人计算机硬盘的容量为TB量级,而一些大企业的数据量已经接近EB量级。
二是数据类型繁多(Variety)。这种类型的多样性也让数据被分为结构化数据和非结构化数据。相对于以往便于存储的以文本为主的结构化数据,非结构化数据越来越多,包括网络日志、音频、视频、图片、地理位置信息等,这些多类型的数据对数据的处理能力提出了更高要求。
三是价值密度低(Value)。价值密度的高低与数据总量的大小成反比。以视频为例,一部1小时的视频,在连续不间断的监控中,有用数据可能仅有一二秒。如何通过强大的机器算法更迅速地完成数据的价值“提纯”成为目前大数据背景下亟待解决的难题。
一是数据体量巨大(Volume)。截至目前,人类生产的所有印刷材料的数据量是200PB(1PB=210TB),而历史上全人类说过的所有的话的数据量大约是5EB(1EB=210PB)。当前,典型个人计算机硬盘的容量为TB量级,而一些大企业的数据量已经接近EB量级。
二是数据类型繁多(Variety)。这种类型的多样性也让数据被分为结构化数据和非结构化数据。相对于以往便于存储的以文本为主的结构化数据,非结构化数据越来越多,包括网络日志、音频、视频、图片、地理位置信息等,这些多类型的数据对数据的处理能力提出了更高要求。
三是价值密度低(Value)。价值密度的高低与数据总量的大小成反比。以视频为例,一部1小时的视频,在连续不间断的监控中,有用数据可能仅有一二秒。如何通过强大的机器算法更迅速地完成数据的价值“提纯”成为目前大数据背景下亟待解决的难题。
四是处理速度快(Velocity)。这是大数据区分于传统数据挖掘的最显著特征。根据IDC的“数字宇宙”的报告,预计到2020年,全球数据使用量将达到35.2ZB。在如此海量的数据面前,处理数据的效率就是企业的生命。
0 0
- 大数据的四个典型特征
- 大数据的典型案例
- 大数据的四大特征
- 八个典型的大数据应用案例
- 八个典型的大数据应用案例
- 大数据应用的几个典型例子
- 大数据预测分析的四个关键因素
- 处理大数据的四个步骤
- 大数据的4V特征
- 大数据的4个特征--笔记
- 线性结构的四个特征
- 阴谋论的四个特征
- 浅谈操作系统的四个特征
- 事物的四个特征ACID
- 数据库的常用的三大范式及事务的四个特征
- 三种最典型的大数据存储技术路线
- 大数据计算模式以及对应的典型系统
- 大数据架构的典型方法和方式
- linux查看虚拟内存和cpu占用率
- RabbitMQ 安装配置与管理
- Java基础----Scanner
- Wax框架简明教程(1) 简介
- jpa+spring配置多数据源
- 大数据的四个典型特征
- 针对测试行业,新人的一些建议:我适合做测试吗?
- Xcode基本操作和一些快捷键(在CocoaChina上面找的)!供大家学习
- Wax框架简明教程(2)安装
- Java中this关键字的几种用法
- 浅述SATA接口Raid、AHCI、IDE三种模式
- 提示pcntl没找到
- DDR3内存技术参数
- Wax框架简明教程(3)开始使用Wax