首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 教程频道 > 开发语言 > perl python >

使用python对文本进行格式整理,该如何处理

2012-04-27 
使用python对文本进行格式整理源文件格式如下2012-04-23 06:52:31202.96.134.133.53192.168.0.188 dns QU

使用python对文本进行格式整理
源文件格式如下;
2012-04-23 06:52:31 202.96.134.133.53 192.168.0.188 dns QUERY,NOERROR,|| 1 pgdt.tcdn.qq.com,IN,A 10 pgdt.tcdn.qq.com,IN,A,90,119.147.130.249 pgdt.tcdn.qq.com,IN,A,90,119.147.130.250 pgdt.tcdn.qq.com,IN,A,90,119.147.130.251 pgdt.tcdn.qq.com,IN,A,90,119.147.130.252 pgdt.tcdn.qq.com,IN,A,90,121.11.67.141 pgdt.tcdn.qq.com,IN,A,90,202.104.241.132 pgdt.tcdn.qq.com,IN,A,90,119.147.130.153 pgdt.tcdn.qq.com,IN,A,90,119.147.130.154 pgdt.tcdn.qq.com,IN,A,90,119.147.130.247 pgdt.tcdn.qq.com,IN,A,90,119.147.130.248 0 0

现计划进行格式整理  
第一列为time (2012-04-23 06:52:31) 
第二列为dnsserver (2012-04-23 06:52:31) 
第三列为sip (2012-04-23 06:52:31)
第四列为 query_contain (pgdt.tcdn.qq.com)
第五列为query_result (A 10 pgdt.tcdn.qq.com,IN,A,90,119.147.130.249 pgdt.tcdn.qq.com,IN,A,90,119.147.130.250 pgdt.tcdn.qq.com,IN,A,90,119.147.130.251 pgdt.tcdn.qq.com,IN,A,90,119.147.130.252 pgdt.tcdn.qq.com,IN,A,90,121.11.67.141 pgdt.tcdn.qq.com,IN,A,90,202.104.241.132 pgdt.tcdn.qq.com,IN,A,90,119.147.130.153 pgdt.tcdn.qq.com,IN,A,90,119.147.130.154 pgdt.tcdn.qq.com,IN,A,90,119.147.130.247 pgdt.tcdn.qq.com,IN,A,90,119.147.130.248)
思路如下:
使用正则挑出以上5要素,然后print
第一列和第二列的time和dnsserver 我会用正则匹配出
sip我的想法是匹配dns前面的一个ip地址,但这样就会把dns也匹配到 怎么去除dns
query_contain想法是|| 1 后面的一个域名 同理怎么去除|| 1
query_result想法是匹配IN,A后面的所有内容 同求怎么写

请大牛指点一二,谢谢!

[解决办法]
怎么time,dnsserver和sip都是日期?

第一列为time (2012-04-23 06:52:31) 
第二列为dnsserver (2012-04-23 06:52:31) 
第三列为sip (2012-04-23 06:52:31)

热点排行