首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 教程频道 > 操作系统 > UNIXLINUX >

Linux使用GREP,awk删除指定行

2013-12-04 
Linux使用GREP,awk删除指定行求助urllochttp://www.ucat.cc/index.php?ctlregister/loclastmod20

Linux使用GREP,awk删除指定行求助

  <url>
    <loc>http://www.ucat.cc/index.php?ctl=register</loc>
    <lastmod>2013-11-18</lastmod>
    <changefreq>always</changefreq>
    <priority>0.9</priority>
  </url>
  <url>
    <loc>http://www.ucat.cc/index.php?ctl=login</loc>
    <lastmod>2013-11-18</lastmod>
    <changefreq>always</changefreq>
    <priority>0.9</priority>
  </url>
  <url>
    <loc>http://www.ucat.cc/tenders/</loc>
    <lastmod>2013-11-18</lastmod>
    <changefreq>always</changefreq>
    <priority>0.8</priority>
  </url>
  <url>
    <loc>http://www.ucat.cc/systemContent/main/1.html</loc>
    <lastmod>2013-11-18</lastmod>
    <changefreq>always</changefreq>
    <priority>0.9</priority>
  </url>
  <url>
    <loc>http://www.ucat.cc/case/</loc>
    <lastmod>2013-11-18</lastmod>
    <changefreq>always</changefreq>
    <priority>0.8</priority>
  </url>
  <url>
    <loc>http://www.ucat.cc/home/</loc>
    <lastmod>2013-11-18</lastmod>
    <changefreq>always</changefreq>
    <priority>0.8</priority>
  </url>
  <url>
    <loc>http://www.ucat.cc/javascript:AddFavorite();</loc>
    <lastmod>2013-11-18</lastmod>
    <changefreq>always</changefreq>
    <priority>0.9</priority>
  </url>
  <url>
    <loc>http://www.ucat.cc/tenders/javascript:AddFavorite();</loc>
    <lastmod>2013-11-18</lastmod>
    <changefreq>always</changefreq>
    <priority>0.7</priority>
  </url>


这样的文本怎样才能包含javascript的段落,意思是所有包含javascript的行,上1行下4行都不要

我用grep -i -B1 -A4 "javascript" index.html

这样可以提取不需要的行,但是我需要的是另外的部分,于是我用
grep -iv -B1 -A4 "javascript" index.html>sitemap1.xml.new

结果返回的和原文件一摸一样啊。

应该怎么写呢???
[解决办法]
awk -vRS="</url>\n" '!/javascript:/{print $0"</url>"}' index.html > sitemap1.xml.new

sed '/<url>/{:1;N;/<\/url>/!b1;/javascript/d}' index.html > sitemap1.xml.new

热点排行