Function ProxyPage(url)
Set Retrieval = CreateObject("MSXML2.ServerXMLHTTP.5.0")
With Retrieval
.SetProxy 2 , "255.0.0.0:80" '代理ip:代理端口
.Open "Get", url, False, "", ""
.setRequestHeader "Referer","http://www.baidu.com/" '伪造referer
.Send
ProxyPage = BytesToBstr(.ResponseBody)
End With
Set Retrieval = Nothing
End Function
附BytesToBstr过程,你采集的时候可以定义网页是utf-8还是gb2312,utf="True"为 utf-8
Function BytesToBstr(body)
dim objstream
set objstream = Server.CreateObject("ad"&""&"odb.st"&""&"ream")
objstream.Type = 1
objstream.Mode =3
objstream.Open
objstream.Write body
objstream.Position = 0
objstream.Type = 2
if utf="True" then
objstream.Charset = "utf-8"
else
objstream.Charset = "gb2312"
end if
BytesToBstr = objstream.ReadText
objstream.Close
set objstream = nothing
End Function
代码解释:
如果你系统是win 2003 只能使用以下代码
CreateObject("MSXML2.ServerXMLHTTP.4.0")
若为xp
CreateObject("MSXML2.ServerXMLHTTP.5.0")
伪造referer用处很一般,不过对于一些站还是有用的,所以代码我加上了,可以注释掉,
注意:
如果你不会写asp采集,那么代码你可能不懂,那就不是我这次发帖所讨论了,希望对大家有用。
相关文章
- asp.net HttpWebRequest 通过url 获取页面代码 获取的不完整,想要的部分没有 采集天猫商品
- asp中格式化HTML函数代码 SDCMS加强版
- asp 通用修改和增加函数代码
- asp采集HTML内容常用代码,详讲正则采集
- 一个asp替换函数img里面多余的代码
- html静态页面中执行php、asp函数代码
- asp 小偷采集程序原理与常用函数方法
- [C#]使用 C# 代码实现拓扑排序 dotNet Core WEB程序使用 Nginx反向代理 C#里面获得应用程序的当前路径 关于Nginx设置端口号,在Asp.net 获取不到的,解决办法 .Net程序员 初学Ubuntu ,配置Nignix 夜深了,写了个JQuery的省市区三级级联效果
- Asp 返回引用类型函数代码
- ASP下实现自动采集程序及入库的代码