正则表达式检索中文
中文的Unicode编码范围是\u4e00-\u9fa5 (中文),如何定义一个正则表达式检索txt文档中的中文
[解决办法]
python用u'[\u4e00-\u9fa5]+':
In [158]: mixed = u'some chinese(中文) some others'
In [159]: re.findall(u'[\u4e00-\u9fa5]+', mixed)
Out[159]: [u'\u4e2d\u6587']