网站建设 > SEO培训

如何应对百度蜘蛛爬行异常?

分类:SEO培训 发布时间:2012-10-25 02:58:20

摘要:这两天我收到了百度的反馈,网站抓取异常,这让我很困扰。很明显,可以成功检测到百度网站管理员平台爬网诊断工具。为什么抓取异常?我不明白。结果,编辑到In

  这两天我收到了百度的反馈,网站抓取异常,这让我很困扰。很明显,可以成功检测到百度网站管理员平台爬网诊断工具。为什么抓取异常?我不明白。结果,编辑到Internet以查看早晨信息,所获得的信息被概括为网站关键字优化中异常爬网的常见原因, 包括以下几点:

  1. 服务器连接异常

  服务器连接异常有两种情况:一种是网站不稳定,尝试连接时,百度Pider暂时无法连接到您网站的服务器; 第二、 百度Pider无法连接到您网站的服务器。

如何应对百度蜘蛛爬行异常? 第1张

  服务器连接异常的原因通常是您的Web服务器太大。负载太重。您的网站也可能出现故障。请检查网络服务器(例如apache, iis)网站已安装并正常运行,并使用浏览器检查是否可以正常访问主页。您的网站和主机也可以阻止Baiduspuder访问,并且您需要检查站点和主机的防火墙。

  2. 网络运营商的例外情况:网络运营商分为两类:电信和中国联通。百度助手无法通过电信或网通访问您的网站。如果发生这种情况您需要联系网络服务提供商,或使用两线服务购买空间,或购买CDN服务。

  3. DNS例外:如果Baiduspider无法解析您网站的IP地址,DNS异常将发生。这可能是网站的IP地址错误,域名服务提供商也有可能阻止Baidupider。请使用whois或主机检查您网站的IP地址是否正确且可解析。如果没有,请与域名注册商联系以更新您的IP地址。

  4. IP阻塞:IP阻塞是:限制网络的出口IP地址,阻止用户访问IP段的内容,在这些情况下,尤其是阻止百度IP。仅当您的网站不希望访问百度Pider时才需要此设置。如果您想让百度Pider访问您的网站,请检查是否将百度Pider IP错误地添加到相关设置中。当您需要联系服务提供商以更改设置时,您的网站所在的空间服务提供商也可能已禁用百度IP。

  5.UA阻止:UA是用户代理。服务器通过UA识别访问者的身份。当指定的UA访问该网站时,返回例外页面(例如403.500页)或跳到另一页,那是, UA被阻止。仅当您不想让百度兄弟访问您的网站时才需要此设置。如果您希望百度Pidel访问您的网站,百度Pidel是否有任何时间设置与用户代理相关的设置并进行修改。

  6.死链:页面无效,无法为用户提供任何有价值信息的页面是无效链接。包括两种形式:协议失效链接和内容失效链接:

如何应对百度蜘蛛爬行异常? 第2张

  协议无效链接:页面的TCP协议状态/ HTTP协议状态清楚地显示了无效链接,例如404. 403. 503状态等。

  内容死锁:服务器的返回状态为正常,但是内容已更改为不存在, 删除或需要许可以及其他与原始内容无关的页面。对于无效链接,我们建议网站使用协议无效链接,通过百度站长平台的死链接工具提交给百度,这样百度可以更快地找到无效链接,减少无效链接对用户和搜索引擎的负面影响。

  综上所述,我们可能了解了百度蜘蛛爬行的原理,这是网站流量的保证,百度蜘蛛爬行是收藏的保证,因此, 网站只能根据百度蜘蛛爬网规则获得更好的排名。