Hive使用RLIKE需要使用转义字符
使用Hive做数据清洗,经常需要使用正则表达式。
?
比较讨厌的是,正则表达式匹配失败的时候,hive完全不会报错。
原来的写法
SELECT * from ahhs_product_info where product_name NOT RLIKE '([\u4e00-\u9fa5])+' ;
?
在hive里面的写法
SELECT * from ahhs_product_info where product_name NOT RLIKE '([\\u4e00-\\u9fa5])+' ;
?
使用了转义字符,就可以正常地识别正则表达式了。
正则表达式的强大功能比Oracle的LIKE牛逼多了!!