正则表达式检索汉语

2013-07-16

正则表达式检索中文中文的Unicode编码范围是\u4e00-\u9fa5 (中文)，如何定义一个正则表达式检索txt文档中的

正则表达式检索中文
中文的Unicode编码范围是\u4e00-\u9fa5 (中文)，如何定义一个正则表达式检索txt文档中的中文
[解决办法]
python用u'[\u4e00-\u9fa5]+':


In [158]: mixed = u'some chinese(中文） some others'

In [159]: re.findall(u'[\u4e00-\u9fa5]+', mixed)
Out[159]: [u'\u4e2d\u6587']

[解决办法]

引用:

谢谢楼上的关注，关于正则表达式俺是一点也不会，能否把上面的代码变化成
VC6.0 IDE查找用的形式。

正则不会的时候感觉很高深，会了就发现，他说白了就是规则而已。
推荐本书，regular expressions cookbook。

热点排行

perl python