订阅本栏目 RSS您所在的位置: 深山工作室 > ASP > 正文

ASP取出HTML里面的图片地址的函数

www.yaohaixiao.com 2008/5/23 21:20:41 深山行者 字体: 浏览 8788

以下是取出HTML里面的图片地址的函数:

主要原理就是用正则判断 <img> 的<src>属性。这在采集程序中将非常有用。

函数如下(以下是引用片段): 

以下是引用片段:
Function ShowPic(str)
  Set objRegExp = New Regexp'设置配置对象  
  objRegExp.IgnoreCase = True'忽略大小写  
  objRegExp.Global = True'设置为全文搜索  
  objRegExp.Pattern = "<img.+?>"

为了确保能准确地取出图片地址所以分为两层配置:首先找到里面的<img>标签,然后再取出里面的图片地址后面的getimgs函数就是实现后一个功能的。

以下是引用片段:

strs=trim(str) 
Set Matches =objRegExp.Execute(strs)'开始执行配置 
For Each Match in Matches 
RetStr = RetStr &getimgs( Match.Value )'执行第二轮的匹配 
Next 
ShowPic = RetStr
End Function


Function getimgs(str) 
getimgs="" 
Set objRegExp1 = New Regexp 
objRegExp1.IgnoreCase = True 
objRegExp1.Global = True 
objRegExp1.Pattern = "http://.+?"""'取出里面的地址 
set mm=objRegExp1.Execute(str) 
For Each Match1 in mm 
getimgs=getimgs&left(Match1.Value,len(Match1.Value)-1)&"||"'把里面的地址串起来备用 
next 
End Function 


'取得图片内容
function getHTTPPage(url) 
on error resume next 
dim http 
set http=server.createobject("MSXML2.XMLHTTP")'使用xmlhttp的方法来获得图片的内容 

Http.open "GET",url,false 
Http.send() 
if Http.readystate<>4 then 
exit function 
end if 
getHTTPPage=Http.responseBody 
set http=nothing 
if err.number<>0 then err.Clear 
end function


'保存图片
function saveimage(from,tofile) 
dim geturl,objStream,imgs 
geturl=trim(from) 
imgs=gethttppage(geturl)'取得图片的具休内容的过程 
Set objStream = Server.CreateObject("ADODB.Stream")'建立ADODB.Stream对象,必须要ADO 2.5以上版本 
objStream.Type =1'以二进制模式打开 
objStream.Open 
objstream.write imgs'将字符串内容写入缓冲 
objstream.SaveToFile server.mappath(tofile),2'-将缓冲的内容写入文件 
objstream.Close()'关闭对象 
set objstream=nothing 
end function 


'调用实例
Dim strpic,i,fname
strpic = ShowPic("<DIV align=center><IMG src=""http://img.knowsky.com/img/knowskylogo.gif"" border=0></DIV>")
strpic = Split(strpic,"||")
If UBound(strpic) > 0 Then 
For i = 0 To UBound(strpic) - 1
'保存图片
fname=cstr(i&mid(strpic(i),instrrev(strpic(i),"."))) 
saveimage(strpic(i),fname)
Next
Else
End If

前一页:cookies
相关阅读
巧妙运用CSS样式表立刻改变鼠标的样式
另类的title提示文字
自由鸟旅行社
利用CSS设置网页滚动条颜色
windows2003的IIS文件上传大小限制的解决方案
Appium元素定位方式之android_uiautomator定位
广西亚太国际旅行社有限公司
这个可以做为论坛,也可以做留言板
共有0条关于《ASP取出HTML里面的图片地址的函数》的评论
发表评论
正在加载评论......
返回顶部发表评论
呢 称:
表 情:
内 容:
评论内容:不能超过 1000 字,需审核,请自觉遵守互联网相关政策法规。
验证码: 验证码 
网友评论声明,请自觉遵守互联网相关政策法规。

您发布的评论即表示同意遵守以下条款:
一、不得利用本站危害国家安全、泄露国家秘密,不得侵犯国家、社会、集体和公民的合法权益;
二、不得发布国家法律、法规明令禁止的内容;互相尊重,对自己在本站的言论和行为负责;
三、本站对您所发布内容拥有处置权。

更多信息>>栏目类别选择
百度小程序开发
微信小程序开发
微信公众号开发
uni-app
asp函数库
ASP
DIV+CSS
HTML
python
更多>>同类信息
ASP中Utf-8与Gb2312编码转换乱码问题的解决方法页面编码声明
asp显示随机密码
通过阿里云服务接口获得ip地址详细信息
iis点开后任务栏上有显示,但是窗口看不到的解决办法
RSA加密解密插件
微软Encoder加密解密函数
更多>>最新添加文章
在Android、iOS、Windows、MacOS中微信小程序的文件存放路径
python通过代码修改pip下载源让下载库飞起
python里面requests.post返回的res.text还有其它的吗
aliyun阿里云续费域名优惠口令(注册、续费都可以使用)
windows7环境下安装配置jdk
python对微信操作要用到这两个库wxpy与itchat
ASP中Utf-8与Gb2312编码转换乱码问题的解决方法页面编码声明
DW设置之后更好用 DreamweaverCS编辑GB2312与UTF-8文件在代码视图中点击鼠标错位问题的解决办法
更多>>随机抽取信息
一个非常不错的简单的ajax读取新浪rss的小例子
微信公众号回复图片消息或用客服接口推送图片消息
搜索引擎优化八个基础的知识
可以生成跟QQ菜单一样的生成器
另外一种符合web2.0的链接打开方式--利用base打开链接
python错误yntaxError: Non-UTF-8 code starting with '\xd3' in file 文件.py but no encoding declared