好东西,老外用正则表达式写的HTML分离函数

时间:2022-04-09 13:48:09

存成.asp文件,执行,你用ASPHTTP抓内容的时候用这个很爽,当然自己要改进一下了

  1. <% 
  2. Option Explicit 
  3.  
  4. Function stripHTML(strHTML) 
  5. 'Strips the HTML tags from strHTML 
  6.  
  7.   Dim objRegExp, strOutput 
  8.   Set objRegExp = New Regexp 
  9.  
  10.   objRegExp.IgnoreCase = True 
  11.   objRegExp.Global = True 
  12.   objRegExp.Pattern = "<.+?>" 
  13.  
  14.   'Replace all HTML tag matches with the empty string 
  15.   strOutput = objRegExp.Replace(strHTML, ""
  16.  
  17.   'Replace all < and > with < and > 
  18.   strOutput = Replace(strOutput, "<""<"
  19.   strOutput = Replace(strOutput, ">"">"
  20.  
  21.   stripHTML = strOutput    'Return the value of strOutput 
  22.  
  23.   Set objRegExp = Nothing 
  24. End Function 
  25.  
  26.  
  27. %> 
  28.  
  29. <form method="post" id=form1 name=form1> 
  30.   <b>Enter an HTML String:</b><br> 
  31.   <textarea name="txtHTML" cols="50" rows="8" wrap="virtual"><%=Request("txtHTML")%></textarea> 
  32.   <p> 
  33.   <input type="submit" value="Strip HTML Tags!" id=submit1 name=submit1> 
  34. </form> 
  35.  
  36. <% if Len(Request("txtHTML")) > 0 then %> 
  37.     <p><hr><p> 
  38.     <b><u>View of string <i>with no</i> HTML stripping:</u></b><br> 
  39.     <xmp> 
  40.     <%=Request("txtHTML")%> 
  41.     </xmp><p> 
  42.     <b><u>View of string <i>with</i> HTML stripping:</u></b><br> 
  43.     <pre> 
  44.     <%=StripHTML(Request("txtHTML"))%> 
  45.     </pre> 
  46. <% End If %>