【图文详细 】Hive 优化策略 之 合理利用文件存储格式

版权声明:版权声明:本文为博主原创文章,转载请附上博文链接! https://blog.csdn.net/qq_42246689/article/details/84801042

创建表时,尽量使用 orc、parquet 这些列式存储格式,因为列式存储的表,每一列的数据在 物理上是存储在一起的,Hive 查询时会只遍历需要列数据,大大减少处理的数据量。 

猜你喜欢

转载自blog.csdn.net/qq_42246689/article/details/84801042