首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 教程频道 > 其他教程 > 开源软件 >

HBase表增多snappy压缩

2013-10-13 
HBase表增加snappy压缩转载请标明来源:http://blackwing.iteye.com/blog/1942037此前使用的是LZO,近期想着

HBase表增加snappy压缩
转载请标明来源:http://blackwing.iteye.com/blog/1942037

此前使用的是LZO,近期想着试试snappy的实力,snappy的安装可以参考另外一篇文章:http://blackwing.iteye.com/blog/1940933

HBase添加snappy压缩步骤如下:
1. 验证snappy是否正常安装:
找某个文件,对其进行压缩测试

hbase org.apache.hadoop.hbase.util.CompressionTest   hbase-hadoop-regionserver.log snappy


如果正确安装snappy则会显示SUCCESS字眼

2. 为表增加snappy压缩
1) 先disable该表
2) 修改表定义
alter 'mytable',{NAME=>'cf1',COMPRESSION => 'snappy'}

3) enable 'mytable'

表中此前的数据,还没有压缩,如果要让整个表的数据都压缩,需要对表进行major compact:
major_compact 'mytable'


之后打开该表所在某个rs的web界面,在Region Name找到表所在行,看Metrics中的:

storefileUncompressedSizeMB=160, storefileSizeMB=66, compressionRatio=0.4125

就可以看得,压缩前后容量以及压缩比。

如果enable表时卡死,可以强行退出后,根据这篇文章处理:http://blackwing.iteye.com/blog/1914841

热点排行