HDFS文件

来源:互联网 发布:电脑拍照软件 清晰 编辑:程序博客网 时间:2024/06/10 06:26

客户端想上传文件,询问dataNode,dataNode查询元信息后返给客户端(如2号仓库可以存放),客户端拿到信息后,与dataNode建立流通讯。
客户端不是写多分,而是dataNode水平进行复制,nameNode进行记录。

数据量越来越多,在一个操作系统管辖的范围存不下,那么就分配到更多的操作系统管理的磁盘中,但是不方便管理和维护,因此迫切需要一种系统的来管理多台机器上的文件,这就是分布式文件管理系统。
允许文件通过网络在多台主机上分享的文件系统,可让多机器上多用户分享文件和存储空间。
通透性,实际上是通过网络来访问文件的动作,由程序与用户看来,就像是访问本地磁盘一般。

容错:即使系统中节点脱节,整体来说系统仍然可以持续运作而不会由数据损失。
一次写入多次查询,不支持并发,小文件不合适。

原创粉丝点击