这个有关问题可能有一点难度 希望前辈们看看
这个问题可能有一点难度 希望前辈们看看是这样的。我有一个需求.需要将一段HTML字符串中样式没有单引号 或
这个问题可能有一点难度 希望前辈们看看
是这样的。我有一个需求.需要将一段HTML字符串中样式没有单引号 或者双引号的改成单引号.
比如其中有一个标签<table border=0></table> 这样的话我需要用代码改成<table border='0'></table>
因为如果不替换的 我后面的将HTML字符串转换为XML 会报错。需要动态处理 不能手动修改HTML字符串。
字符串中的字符不确定有多少个这样的需要添加或修改的标签.
本来开始打算用正则去匹配
不过老大说 让我用一个递归算法来实现 从<html> 开始 一层一层的递归去寻找替换或者修改。
思路我知道 但是实现上 我遇到点瓶颈 希望各位不吝赐教 谢谢! 递归 HTML asp.net
[解决办法]
所谓“思路”,就是html语法分析。
那种匹配个简单的词法,功能很差劲。只有依据语法来处理,例如 HtmlAgility 那样,才是语法分析。
[解决办法]
这个是xml解析的问题,应该使用转义字符:
< < 小于号
> > 大于号
& & 和
' ’ 单引号
" " 双引号
http://blog.csdn.net/teedry/article/details/5816687
[解决办法]
建议还是用标准的xml解析程序去分析。
[解决办法]
楼主问的也是关于XML针对特殊符号编码问题而已。
不需要去刻意去处理html。因为html变化很多样,楼主的关键点在于如何针对xml的特殊字符串进行格式化,单单"或'是没法真正解决问题的。
[解决办法]
不知楼主是如何保存为XML文件的,若是可以的话,在XML文件中直接丢进<![CDATA[你的内容]]>中就可以了,不用考虑什么转义、单双引之类的问题
[解决办法]
把你们老大割了,正则多好,非得这样!要干吗?
[解决办法]用转义字符才是比较标准通用的作法,否则一旦你的xml要作其它用途会埋下隐患
[解决办法]如果不考虑效率 不需要用到递归,但是比较的繁琐我想到了1个方法但是自我感觉不太良好,比如你的Html代码是这样的 <table class=myclass></table><table border=0></table>
[解决办法]如果你非得将得到的字符串当做 xml文档来进行识别,那为什么不直接用 json呢?
如果很急忙处理。为何不直接将这个xml当做 普通字符串用正则表达式进行单独解析呢?
[解决办法]用jq写一段js,把所有的属性值(属性也就那么多,全部罗列出来)替换(比如:
var _t=$(this).attr("paramattr");
$(this).attr("paramattr",'"'+_t+'"');
)
,然后获取当前页面的所有html,ajax到一般处理文件,进行xml解析