相关题目
Hive是一种数据仓库处理工具,使用类似SQL的HiveSQL语言实现数据查询功能,所有Hice的数据存储都存储在HDFS中。
HDFS运行时,NameNode会将文件系统的元数据从磁盘中全部加载到内存,因此文件系统所能 存储的文件总数受限于NameNode的内存容量。
HDFS客户端以N副本向HDFS写文件时,若其中一个副本写入失败,则所有副本都会返回写入失败。
HDFS采用的是“一次写入、多次读取''的文件访问模型。所以推荐一个文件经过创建、写入和关 闭之后,就不要再去修改。
Hbase最小的存储单元是Region。
Hbase中OpenScanner的过程,会创建两种不同的Scanner来读取Hfile和MetaStore的数据,Hfile对应的scanner为StoreFileScanner,MetaStore对应的Scanner为MetaStoreScanner。
HBase过滤器能将列名或列值设置为过滤条件,同时支持多个过滤器配合使用。
HBase的scan方法读取数据时返回的数据保存在Result对象中?
Hbase的BloomFiliter是用来过滤数据。
Hadoop系统中YARN分配给Container的内存大小,可以通过参数 yarn.app.mapreduce.am.resource.mb (yarn.nodemanager.resource.memory-mb )来设置。
