正则表达式轻松消除HTML代码

一、清楚内容中的Javsscript 代码

  

复制代码 代码如下:

  Function ClearJSCode(originCode)

  Dim reg

  set reg = New RegExp

  reg.Pattern = "<SCRIPT[^<]*</SCRIPT>"

  reg.IgnoreCase = True

  reg.Global = True

  clearJSCode = reg.Replace(originCode, "")

  End Function

  二、清除内容中的HTML代码

  

复制代码 代码如下:

  Function ClearHTMLCode(originCode)

  Dim reg

  set reg = new RegExp

  reg.Pattern = "<[^>]*>"

  reg.IgnoreCase = True

  reg.Global = True

  ClearHTMLCode = reg.Replace(originCode, "")

  End Function

  现在好多网站的内容都是使用采集程序生成的,使用上边的代码就可以轻松的将内容中的HTML和JS代码清除掉。