首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 教程频道 > 数据库 > 其他数据库 >

hive bucket产生的小文件有关问题

2012-11-03 
hive bucket产生的小文件问题Hive bucket主要作用:1. 数据sampling2. 提升某些查询操作效率,例如mapside j

hive bucket产生的小文件问题

Hive bucket主要作用:
1. 数据sampling
2. 提升某些查询操作效率,例如mapside join


与此同时,在数据不均匀的情况下,bucket产生大量小文件,会带来很大麻烦,具体表现为:
1. 文件数目过多,给namenode带来压力
2. 在对查询条件不加限制时,启动大量map任务
3. 数据入库慢

结论:
bucket,慎用!

热点排行