ruby中无法匹配中文字符
使用ruby来抓取数据
我写的代码是这样的:
txt_file ="C:\\all.txt"
#打开文件
new_file =File.open(txt_file, "r:utf-8")
@str=""
new_file.each_line do |line|
@str += line
end
c=/id=release_MyApps_rptMain_ctl00_A1\s*title=(^[\u4e00-\u9fa5]*$)\shref=/.match(@str)
puts c
其中@str中想要匹配的字符串是这样的id=release_MyApps_rptMain_ctl00_A1 title=儿童 href="http://book.com/Product/App265035.html" target=_blank
运行程序后什么都不输出,但是去掉匹配中文的部分之后就能得到数据
我想要把其中的红色字体取出来,请问要怎么做?
[解决办法]
"title=(.*?)\s+href="