相关题目
HLL类型的存储长度是固定的。
Hive中union all操作符用于合并两个或多个select语句的结果集,结果集中,不允许有重复值。
Hive中group by指的是通过一定规则将一个数据集划分成若干个小的数据集,然后针对若干个小的数据集进行分组处理。
Hive在load时不检索数据是否符合schema的,hive遵循的是schema on read,只有在读时模式的时候才会检查hive的数据字段。
Hive是一种数据仓库处理工具,使用类似SQL的HiveSQL语言实现数据查询功能,所有Hice的数据存储都存储在HDFS中。
HDFS运行时,NameNode会将文件系统的元数据从磁盘中全部加载到内存,因此文件系统所能 存储的文件总数受限于NameNode的内存容量。
HDFS客户端以N副本向HDFS写文件时,若其中一个副本写入失败,则所有副本都会返回写入失败。
HDFS采用的是“一次写入、多次读取''的文件访问模型。所以推荐一个文件经过创建、写入和关 闭之后,就不要再去修改。
Hbase最小的存储单元是Region。
Hbase中OpenScanner的过程,会创建两种不同的Scanner来读取Hfile和MetaStore的数据,Hfile对应的scanner为StoreFileScanner,MetaStore对应的Scanner为MetaStoreScanner。
