![]() |
1
4
您可以采用不同模式的联合,就像您已经在做的那样。存储“稀疏”或“宽”数据(表中的列数较多,但单个记录中的列数较少)实际上是Parquet擅长的一个领域。一些文章摘录提到了这一点: Dremel made simple with Parquet
从 Parquet: Columnar Storage for Hadoop Data :
您可能希望在查询中提及特定的列,而不是执行
|
![]() |
Nk.Pl · 为Kafka主题创建配置单元表生成器 7 年前 |
![]() |
Enrico Gallinucci · HDFS配置的容量高于磁盘容量 7 年前 |
![]() |
Omid · 计算fat 32和HDFS的最大体积大小 7 年前 |
![]() |
dlamblin · Hadoop HDFS就地压缩 7 年前 |
![]() |
user2007861 · 在HDFS文件夹中查找旧文件 7 年前 |
![]() |
osk · 加载a。Scala中HDFS的csv文件 7 年前 |