★→ASP程序学习群:62655404 微信公众号开发

详细的百度蜘蛛爬行检测代码诠释

网络 2009/4/25 11:41:50 深山行者 字体:  浏览 22086 我要评论
需要定制网站程序、公众号程序、微信小程序可以联系:565449214或者加微信13961347334(备注:需要技术)
或者在处理一些技术问题时,有什么不懂的地方,随时可以加我QQ:565449214讨论技术或者加QQ群62655404讨论
当前标签
蜘蛛百度

最近在网上看了篇有关百度蜘蛛的爬行代码的解释,发现和现在的爬行有些改变,已至于开始时看我的[url]www.pipiflash.com[/url]这个站的日志看不懂是什么意思,经过多次研究终于明白其中,所以今重新整理解释如下:

做seo的朋友都知道,研究se爬行规律对于网站优化意义重大,特别是对百度蜘蛛Baiduspider的研究。本文解释一下百度蜘蛛爬行后返回代码代表的具体含义:

2xx 成功

200 正常;请求已完成。

201 正常;紧接 POST 命令。

202 正常;已接受用于处理,但处理尚未完成。

203 正常;部分信息 — 返回的信息只是一部分。

204 正常;无响应 — 已接收请求,但不存在要回送的信息。

3xx 重定向

301 已移动 — 请求的数据具有新的位置且更改是永久的。

302 已找到 — 请求的数据临时具有不同 URI。

303 请参阅其它 — 可在另一 URI 下找到对请求的响应,且应使用 GET 方法检索此响应。

304 未修改 — 未按预期修改文档。

305 使用代理 — 必须通过位置字段中提供的代理来访问请求的资源。

306 未使用 — 不再使用;保留此代码以便将来使用。

4xx 客户机中出现的错误

400 错误请求 — 请求中有语法问题,或不能满足请求。

401 未授权 — 未授权客户机访问数据。

402 需要付款 — 表示计费系统已有效。

403 禁止 — 即使有授权也不需要访问。

404 找不到 — 服务器找不到给定的资源;文档不存在。

407 代理认证请求 — 客户机首先必须使用代理认证自身。

410 请求的网页不存在(永久);

415 介质类型不受支持 — 服务器拒绝服务请求,因为不支持请求实体的格式。

5xx 服务器中出现的错误

500 内部错误 — 因为意外情况,服务器不能完成请求。

501 未执行 — 服务器不支持请求的工具。

502 错误网关 — 服务器接收到来自上游服务器的无效响应。

503 无法获得服务 — 由于临时过载或维护,服务器无法处理请求。

比如说:

2008-05-10 00:28:03 W3SVC818374 222.214.218.36 GET /flash/1622.html - 80 - 221.10.254.26 Baiduspider+(+[url]http://www.baidu.com/search/spider.htm[/url]) 200 0 0 21089

如果你的域名是[url]www.pipiflash.com[/url],这就意味着百度蜘蛛在2008-05-10 00:28:03 爬过[url]http://www.pipiflash/flash/1622.html[/url] 这一页,200 0 0 21089中的200协议代码代表了请求已完成也就是它发现这页并以入库了。根据这个我们可以多查看iis日志,研究蜘蛛爬行的路径,找出自己网站存在的问题,进而改正。

相关阅读
( 2021/6/10 8:56:21 )百度小程序开发第一坑tcomponent自定义组件命名坑Compile san component failed. . [SAN ERROR] ROOT>swan-custom-component>view>千万不要用下划线作为自定义组件名
( 2021/6/8 23:24:05 )开始百度小程序开发需要准备工作
( 2021/5/8 9:02:37 )定制开发微信小程序的操作流程
( 2021/2/7 16:55:29 )公众号被动回复与客服接口主动推送音乐封面缩略图ThumbMediaId不显示bug问题
( 2020/12/16 22:20:58 )微信小程序转uni-app项目
( 2019/5/6 17:22:07 )网站从http改成https(ssl证书)后设置301跳转将http跳转到https的方法
( 2019/4/9 13:50:50 )国内网站常用的一些 CDN 静态资源公共库加速服务
( 2019/3/18 14:11:33 )ios苹果版手机微信内置浏览器$(document).on(
共有0条关于《详细的百度蜘蛛爬行检测代码诠释》的评论
发表评论
正在加载评论……
返回顶部发表评论
呢 称:
表 情:
内 容:
评论内容:不能超过 1000 字,需审核,请自觉遵守互联网相关政策法规。
验证码: 验证码 
深山工作室网友评论声明,请自觉遵守互联网相关政策法规。

您发布的评论即表示同意遵守以下条款:
一、不得利用本站危害国家安全、泄露国家秘密,不得侵犯国家、社会、集体和公民的合法权益;
二、不得发布国家法律、法规明令禁止的内容;互相尊重,对自己在本站的言论和行为负责;
三、本站对您所发布内容拥有处置权。

更多信息>>栏目类别选择
uni-app
rss学习
个人空间
网站设计
网站公告
下载
photoshop学习
ASP学习
DIV+CSS学习
SEO搜索引擎忧化
java学习
HTML学习
网站信息
网站类信息
更多>>同类信息
告诉你一些GOOGLE搜索你不知道的东西
12个定律原则
百度蜘蛛饲养技巧
国内各大搜索引擎的蜘蛛名称列表
七种网站添加链接的简单方法
怎样增加网站外链接和注意事项
网站需要SEO,基本的SEO建站要点
搜索引擎优化八个基础的知识
更多>>最新添加文章
uni-app开发表单input组件的一些规则说明自己预留使用
查询某个字符在字符串中出现的位置数组
百度小程序开发第一坑tcomponent自定义组件命名坑Compile san component failed. . [SAN ERROR] ROOT>swan-custom-component>view>千万不要用下划线作为自定义组件名
开始百度小程序开发需要准备工作
uni-app:使用uni.downloadFile下载word或pdf文件并保存到手机
小程序中利用addPhoneContact将联系人的信息添加到手机通讯录支持保存联系人头像
小程序打开pdf文件并保存到本地 支持远程pdf、word、xls表格文件打开
uni-app里面复制内容时保留换行利用正则替换br标签替换成回车换行符
更多>>随机抽取信息
根据页面模板动态生成html页面
禁止网站的静态模板被下载
深山行者留言系统V2.0 (简称留言板V2.0)
html中meta标签详解
正则表达式全部符号解释
百度蜘蛛饲养技巧
asp正则替换内容里的特定内容
ASP.NET 2.0跨网页提交的三法