python 扫描js,html文件中的所有注释
需求:
python扫描js,html中是否有匹配到的规则,匹配到后发邮件出来;但是有个问题,匹配的结果文件中有些其实是注释了的,不应该被扫描出来。
所以想用python 对js,html文件中的所有注释不进行扫描;扫描时,直接过滤掉所有的注释文件
哪位大侠有办法呢?小女子在此谢过了。
类似多行注释:/\*.*?\*/
单行的也有很多种情况:
//******;
** //****
引号内(包括单引号和双引号)的双斜线不算注释
引号是配对出现的, 两个引号之间的以反斜线转义掉的引号不算结束符
由连续的非引号非斜线部分组成的字符串也不是注释
除去上述内容以外, 以双斜线开始直至行尾的部分就是注释
有没有demo可以用python扫描时直接过滤js,和html的注释呢? python 过滤js,html注释
[解决办法]