在ASP中用正则表达式提取img标签及其src属性值,然而如果你进到了这里。。强烈建议换PHP吧
<%
Function RegImg(TheStr)
Dim RegEx
Set RegEx = New RegExp '建立正则表达对象。
RegEx.IgnoreCase =True ' 是否区分大小写,True为不区分且默认
RegEx.Global = True '全部匹配还是只匹配第一个
RegEx.Pattern = "<img[^>]*src\s*=\s*['"&CHR(34)&"]?([\w/\-\:.]*)['"&CHR(34)&"]?[^>]*>" ' 搜索所使用的正则表达式
If Regex.test(TheStr) Then ' 判断是否有匹配值,返回True或者False。不受Global属性影响。
Dim Matches
Set Matches = RegEx.Execute(TheStr) ' 执行搜索。Execute 方法返回一个Matches 集合,其中包含了在 TheStr 中找到的每一个匹配的 Match 对象。如果未找到匹配,Execute 将返回空的 Matches 集合。
For Each Match in Matches ' 遍历匹配集合。
RetStr = RetStr & Match.Value & "<br />" '获取整个img
RetStr = RetStr & Match.SubMatches(0) '只取src
Next
RegImg = RetStr
End If
End Function
Response.Write RegImg("<p><img src=""https://www.wdssmq.com/UPLOAD/cbfs.gif"" width=""132"" height=""132"" alt=""111"" /></p>")
%>
说明:
由于单双引号在ASP中的用法,所以最终的正则表达式应该是:<img[^>]*src\s*=\s*['"]([\w/\-\:.]+)['"][^>]*>
以“<img”开头,后边跟着0或者任意数量不为“>”的字符,方括号表示一个字符集,"^"在方括号中表示对字符集的否定,“*”指匹配前一个字符或规则0或任意次;
然后是“src”跟着零或任意数量的空白字符,当然在本例中\s一般是为了匹配空格(此外还有制表符、分页符什么的);
等号就是匹配其本身;
之后是一个单引号或者一个双引号,与方括号中字符的其中之一匹配,同样加上“^”就是不为单引号且不为双引号的任意字符;
[\w/\-:.]+是图片地址的规则,\w与任何单词字符匹配,包括下划线。等价于"[A-Za-z0-9_]",与之后的斜杠、反斜杠、连接符、冒号、点句构成一个字符集,判断引号后的字符是否属于这个字符集,"+"号表示判断前一规则一次或更多次,这里用“*”号也可以, 由于我们需要单独拿出这部分。。所以外边再加上圆括号,通过上边实例中的Match.SubMatches(0)读取
再次单引号或者双引号;
再次0或任意数量不为“>”的字符;
“>”号结束。
正则表达式30分钟入分教程:http://deerchao.net/tutorials/regex/regex.htm
RegExp对象还有一个replace方法,,明天再补吧。。
留言网址默认屏蔽 临时查看 认领以解除屏蔽
好吧,[F]Sleep[/F]RegExBuilder软件不错
回复
#cmt3382
回复
https://www.wdssmq.com
----------
置百丈玄冰而崩裂,掷须臾池水而漂摇。
回复
#cmt3380
回复