关于百度快照抓取不全的原因及影响分析

痕风 2014年2月15日15:32:00
评论
102

近来,本人网站在交换友情链接时候,遇到一问题:百度的“网页快照”显示不全,经检查还真只显示了一半,究其原因,网上找了一下有以下几点说明:

 

1、空间问题

一个是空间的速度,如果空间速度不给力导致打开网页速度过慢,而恰恰是蜘蛛访问的时间,那很有可能蜘蛛抓取一部分内容转头就走了,从而快照显示不正常,或许这也是空间不稳定对SEO影响的一种。再有一点就是看下同一服务器下的其他的站点有没有出现这种情况,如果有的话也可能是你们之间互相影响了。

2、网站代码阻止蜘蛛爬行

首页用了大量的图片或者干脆整个FLASH,在打开网页的时间加载一下,而这一加载中间就很明显的会停顿几秒钟,而这个停顿对蜘蛛来说是非常不友好的,你试想一下人家正爬到高兴的时间,突然显示了一个错误页面,心情肯定糟透了,所以这个问题一定要注意,这是让蜘蛛恋上你的站的大忌。

3、百度设置

百度有个设置是蜘蛛抓取网页的上限为125K,当网页大小超过125K,则超出的部分会被百度抛弃,在被抛弃的地方出现的链接都不会被百度抓取,同样在被抛弃的地方优化布局的关键词,也将全部无效。所以根据这个情况我们要尽量保持网页尽量不要超过125K,如果必须大于125K,则要将重要的内部链接布局和关键词布局的重点放在网页的上半部分,这样也会让网站获得不错的排名。否则百度抓取不到的部分对于网站的排名也起不到任何作用的。

4、百度服务器问题

这一点有可能是存放你数据的服务器有点小问题,或者是你更改了网站的一些比较重要的标签元素等,百度对你的一个考核,总之,关于百度的问题你可以发挥想象去想,当然这一点我们是无法人为改变的。

百度对门户站的首页快照抓取不全的问题由来已久,有图为证:

关于百度快照抓取不全的原因及影响分析

图一:QQ快照

关于百度快照抓取不全的原因及影响分析

图二:新浪快照

关于百度快照抓取不全的原因及影响分析

图三:搜狐快照

关于百度快照抓取不全的原因及影响分析

图四:首页快照

通过以上三大门户和笔者自己的直播站点的快照发现,百度都只抓取了大约120-130K左右的数据,更悲催的是新浪直接显示空白的快照。

提出问题

其实以上的问题,很多站长都已经非常清楚,但是很多站长最纠结的问题是,不知道以上百度快照显示不全的问题会不会影响到网站关键词的布局和排名?

分析问题:

一、搜索引擎产品横向对比分析:其实我们可以通过对比其他的搜索引擎发现,国内其他的搜索引擎如360,搜狗,搜搜等的快照都不存在这样子的问题;而百度作为国内的搜索行业的巨头,快照抓取不完整这种技术问题可以排除。

二、百度搜索引擎优化指南中有明确指出,建议网站不要过大,影响加载速度,不过并没有明确限制说最大多少K。

总结问题:

总结以上两点,笔者认为,只要用户体验好,加载速度快,网站内容健康,原创度高,其实快照显示不全并不影响网站的排名和关键词的优化布局。百度之所以显示不全,笔者认为百度是出于一种建议的思路,建议中小站长们的网站的首页尽量不要过大,因为中小站长本身不具备很强的服务器分流等技术,当网页太大时,确实会影响到加载速度。

笔者自己的站点快照也抓取不全(如以上图四),但是并没有影响到这个站点的相关关键词的排名。希望以上观点能够对还在纠结于百度快照抓取不全的朋友有些帮忙。

继续阅读
weinxin
痕风的起点
专注于互联网资讯、中央空调、Windows、wordpress、建站技术、软件应用等相关网络资源的分享。
匿名

发表评论

匿名网友 填写信息

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: