去html代码的正则 推荐

复制代码 代码如下:

  '==================================================

  '函数名:ScriptHtml

  '作  用:过滤html标记

  '参  数:ConStr ------ 要过滤的字符串

  '==================================================

  Function ScriptHtml(Byval ConStr,TagName,FType)

  Dim Re

  Set Re=new RegExp

  Re.IgnoreCase =true

  Re.Global=True

  Select Case FType

  Case 1

  Re.Pattern="<" & TagName & "([^>])*>"

  ConStr=Re.Replace(ConStr,"")

  Case 2

  Re.Pattern="<" & TagName & "([^>])*>.*?</" & TagName & "([^>])*>"

  ConStr=Re.Replace(ConStr,"")

  Case 3

  Re.Pattern="<" & TagName & "([^>])*>"

  ConStr=Re.Replace(ConStr,"")

  Re.Pattern="</" & TagName & "([^>])*>"

  ConStr=Re.Replace(ConStr,"")

  End Select

  ScriptHtml=ConStr

  Set Re=Nothing

  End Function

  1 content=ScriptHtml(content,"br",1) ‘去掉所有<br>HTML标记

  2 content=ScriptHtml(content,"a",2) ‘去掉所有<a></a>和两个标记之间的内容

  如  <a href=www.126.com>www.126.com</a>  把这一段全去了

  3  content=ScriptHtml(content,"td",3) ‘去掉<td>和</td>HTML标记

  如  <td>士大夫撒</td>  把<td> </td> 去掉了 但士大夫撒还保留

  依次类推把其他HTML标记都过滤了 div objdect什么的 自己看吧