订阅本栏目 RSS您所在的位置: 深山工作室 > ASP > 正文

利用asp正则功能去除网页中自定义HTML标记(来自eWebEditor)

深山行者个人网站 2010/8/20 14:15:15 深山行者 字体: 浏览 13196

function ExecReg(re, content)
    Dim myRegExp, ResultString
    Set myRegExp = New RegExp
     myRegExp.Global = True
     myRegExp.Pattern = re
     ResultString = myRegExp.Replace(content, "")
     ExecReg = ResultString
end function

function DecodeFilter(html)
         html = LCase(html)
' 去除所有客户端脚本javascipt,vbscript,jscript,js,vbs,event,
         html = ExecReg("</?script[^>]*>", html)
         html = ExecReg("(javascript|jscript|vbscript|vbs):", html)
         html = ExecReg("on(mouse|exit|error|click|key)", html)
         html = ExecReg("&#", html)
' 去除表格<table><tr><td><th><a><p><img><div>
         html = ExecReg("</?table[^>]*>", html)
         html = ExecReg("</?tr[^>]*>", html)
         html = ExecReg("</?th[^>]*>", html)
         html = ExecReg("</?td[^>]*>", html)
         html = ExecReg("</?a[^>]*>", html)
         html = ExecReg("</?p[^>]*>", html)
         html = ExecReg("</?img[^>]*>", html)
         html = ExecReg("</?div[^>]*>", html)
         html = ExecReg("</?ul[^>]*>", html)
         html = ExecReg("</?li[^>]*>", html)
         html = ExecReg("</?tbody[^>]*>", html)
         html = ExecReg("</?h1[^>]*>", html)
         html = ExecReg("</?h2[^>]*>", html)
         html = ExecReg("</?h3[^>]*>", html)
         html = ExecReg("</?h4[^>]*>", html)
         html = ExecReg("</?h5[^>]*>", html)
         html = ExecReg("</?h6[^>]*>", html)
         html = ExecReg("</?b[^>]*>", html)
         html = ExecReg("</?strong[^>]*>", html)
' 去除样式类class=""
         html = ExecReg("(<[^>]+) class=[^ |^>]*([^>]*>)", html)
' 去除样式style=""
         html = ExecReg("(<[^>]+) style=""[^""]*""([^>]*>)",   html)
' 去除XML<?xml>
         html = ExecReg("<\?xml[^>]*>", html)
' 去除命名空间<o:p></o:p>
         html = ExecReg("</?[a-z]+:[^>]*>", html)
' 去除字体<font></font>
         html = ExecReg("</?font[^>]*>", html)
' 去除字幕<marquee></marquee>
         html = ExecReg("</?marquee[^>]*>", html)
' 去除对象<object><param><embed></object>
         html = ExecReg("</?object[^>]*>",   html)
         html = ExecReg("</?param[^>]*>", html)
         html = ExecReg("</?embed[^>]*>", html)
         DecodeFilter= html
end function


使用:DecodeFilter(内容)

后一页:asp计算器
相关阅读
Python拼接字符串的几种方式
css里expression实现界面对象的批量控制
Asp.net中防止用户多次登录的方法
倒计时广告/始终保持在网页中部
javascript表单验证!
万家乐橱柜网站
经典表格隔行变色程序
防止 IE 浏览器被黑的技巧十则
共有0条关于《利用asp正则功能去除网页中自定义HTML标记(来自eWebEditor)》的评论
发表评论
正在加载评论......
返回顶部发表评论
呢 称:
表 情:
内 容:
评论内容:不能超过 1000 字,需审核,请自觉遵守互联网相关政策法规。
验证码: 验证码 
网友评论声明,请自觉遵守互联网相关政策法规。

您发布的评论即表示同意遵守以下条款:
一、不得利用本站危害国家安全、泄露国家秘密,不得侵犯国家、社会、集体和公民的合法权益;
二、不得发布国家法律、法规明令禁止的内容;互相尊重,对自己在本站的言论和行为负责;
三、本站对您所发布内容拥有处置权。

更多信息>>栏目类别选择
百度小程序开发
微信小程序开发
微信公众号开发
uni-app
asp函数库
ASP
DIV+CSS
HTML
python
更多>>同类信息
ASP中Utf-8与Gb2312编码转换乱码问题的解决方法页面编码声明
asp显示随机密码
通过阿里云服务接口获得ip地址详细信息
iis点开后任务栏上有显示,但是窗口看不到的解决办法
RSA加密解密插件
微软Encoder加密解密函数
更多>>最新添加文章
在Android、iOS、Windows、MacOS中微信小程序的文件存放路径
python通过代码修改pip下载源让下载库飞起
python里面requests.post返回的res.text还有其它的吗
aliyun阿里云续费域名优惠口令(注册、续费都可以使用)
windows7环境下安装配置jdk
python对微信操作要用到这两个库wxpy与itchat
ASP中Utf-8与Gb2312编码转换乱码问题的解决方法页面编码声明
DW设置之后更好用 DreamweaverCS编辑GB2312与UTF-8文件在代码视图中点击鼠标错位问题的解决办法
更多>>随机抽取信息
asp正则替换内容里的CSS样式
旅行社手机网站模板7
divcss范例下载
鼠标经过表格列时变色
超级酷的滚动条颜色代码生成器
网站最近更新缓慢说明