新手站长一定要看的IIS日志分析

痕风 2013年4月27日21:17:07
评论
55

  百度现在变换规则非常快,机制也越来越完善,很多昨天还有排名的站点,今天却没有了,很多昨天没排名的站,今天就出现在首页了,让很多做站的站长感觉很是头大,以前做SEO都是根据百度的规律来进行,而现在百度的变化完全让SEO的同胞们摸不着头脑,其实这也不难,仔细分析IIS日志,依然会发现很多规律的,做为一个新站的建设者,我就拿自己的网站来举例说明如何分析IIS日志中蜘蛛爬行的状况。

  建议大家在上线之前之前一定要禁止百度蜘蛛爬行的,因为要做很多站内的检测,对百度蜘蛛开放之前一定要做好检查,一定要检查死链,很多做站的都是用的别人的程序,这里面就肯定存在很多软件的链接,该改的一定要修改完,当你确实认为站点没有问题了,那就可以对百度蜘蛛进行放行了。我的站是4月1日才上线的,在此之前进行了半个月的调试,

  

新手站长一定要看的IIS日志分析

 

  大家可以看这张图,在4月1日之前是完全没有蜘蛛的。我是4月1日才对百度蜘蛛开放的,现在百度对新站是给予一定的权重的,所以只要你把站点检查好了以后就完全可以很快的被收录,有人肯定要问我之前3月份还是有蜘蛛爬行的,在这说一下,那个不是蜘蛛爬行的,是我使用第三方工具进行查询的,这个是IIS日志,只要你对站点进行操作都会有记录的。

  

新手站长一定要看的IIS日志分析

 

  大家可以看这个图。在4月1号的时候蜘蛛就来得非常多了,这里有必要讲解下蜘蛛的一些具体IP分析,很多人肯定有疑问,你怎么知道是百度蜘蛛呢?这方面其实多在网上找下资料,你就能发现很多方面相关的,当然很多都是转载的,并不是很完善。我结合我的站的日志给大家详细讲解下蜘蛛的IP。

  根据不同的IP我们可以分析网站是个怎样的状态.下面就按照我IIS日记上的百度蜘蛛IP为例:

  123.125.68.*这个蜘蛛经常来,别的来的少,表示网站可能要进入沙盒了,或被者降权。

  220.181.68.*每天这个IP 段只增不减很有可能进沙盒或K站。

  220.181.7.*、123.125.66.* 代表百度蜘蛛IP造访,准备抓取你东西。

  121.14.89.*这个ip段作为度过新站考察期。

  203.208.60.*这个ip段出现在新站及站点有不正常现象后。

  210.72.225.*这个ip段不间断巡逻各站。

  125.90.88.* 广东茂名市电信也属于百度蜘蛛IP 主要造成成分,是新上线站较多,还有使用过站长工具,或SEO综合检测造成的。

  220.181.108.95这个是百度抓取首页的专用IP,如是220.181.108段的话,基本来说你的网站会天天隔夜快照,绝对错不了的,我保证。

  220.181.108.92 同上98%抓取首页,可能还会抓取其他(不是指内页)220.181段属于权重IP段此段爬过的文章或首页基本24小时放出来。

  123.125.71.106 抓取内页收录的,权重较低,爬过此段的内页文章不会很快放出来,因不是原创或采集文章。

  220.181.108.91属于综合的,主要抓取首页和内页或其他,属于权重IP 段,爬过的文章或首页基本24小时放出来。

  220.181.108.75重点抓取更新文章的内页达到90%,8%抓取首页,2%其他。权重IP 段,爬过的文章或首页基本24小时放出来。

  220.181.108.86专用抓取首页IP 权重段,一般返回代码是304 0 0 代表未更新。

  123.125.71.95 抓取内页收录的,权重较低,爬过此段的内页文章不会很快放出来,因不是原创或采集文章。

  123.125.71.97 抓取内页收录的,权重较低,爬过此段的内页文章不会很快放出来,因不是原创或采集文章。

  220.181.108.89专用抓取首页IP 权重段,一般返回代码是304 0 0 代表未更新。

  220.181.108.94专用抓取首页IP 权重段,一般返回代码是304 0 0 代表未更新。

  220.181.108.97专用抓取首页IP 权重段,一般返回代码是304 0 0 代表未更新。

  220.181.108.80专用抓取首页IP 权重段,一般返回代码是304 0 0 代表未更新。

  220.181.108.77 专用抓首页IP 权重段,一般返回代码是304 0 0 代表未更新。

  123.125.71.117 抓取内页收录的,权重较低,爬过此段的内页文章不会很快放出来,因不是原创或采集文章。

  220.181.108.83专用抓取首页IP 权重段,一般返回代码是304 0 0 代表未更新。

  注:以上IP尾数还有很多,但段位一样的123.125.71.*段IP 代表抓取内页收录的权重比较低.可能由于你采集文章或拼文章暂时被收录但不

  放出来.(意思也就是说待定)。

  220.181.108.*段IP主要是抓取首页占80%,内页占30%,这此爬过的文章或首页,绝对24小时内放出来和隔夜快照的,这点我可以保证!

  一般成功抓取返回代码都是200 0 0返回304 0 0代表网站没更新,蜘蛛来过,如果是200 0 64别担心这不是K站,可能是网站是动态的,

  所以返回就是这个代码。

  大家仔细看这些IP。再结合我站点内的图可以仔细看下是否也存在这些IP段呢,做站必须养成良好的查询日志的习惯,这样你才能找到站的问题,也才能有的放矢,我在4月1日进行的放蜘蛛行为,而站点在4月4日就有很不错的排名,绵阳富乐网,富乐网均排在了第一位,这和我每天关注IIS日志分不开的。大家可以看下如下的图:

  

新手站长一定要看的IIS日志分析

 

  百度首页每天都在持续增加。

  

新手站长一定要看的IIS日志分析

 

  这些IP都是百度蜘蛛给的权重IP。如果你的站点有很多这样的蜘蛛在爬行,那么恭喜你,你的站会很快就有排名的,并且快照绝对是最新快照,在这说下最新快照的意思,正常快照都是前一天的快照,而最新快照有时候会出现当天快照的,这和做站内文章有很大的关系,本人在做站的这20天里,从没发过站外的链接,一直是在做站内的文章。所以排名上升很快,百度现在很重视体验度的。

  

新手站长一定要看的IIS日志分析

 

  有些人会问这类IP是做什么用的,这是百度对你的站已经关注了,只是还在考验期,权重比较低,不用担心,这类IP更多的时候是出现在内部文章的收录方面,百度现在并非像GOOGLE那样智能,所以你不能要求百度对你的文章进行秒收,即使你是完全原创的文章,百度依然会先收录入库的,然后一般7天以后就会放出来。

  综上所述,大家在做站的时候一定要经常去看IIS日志,要分析问题,比如我的站就有很多404的错误,我到现在也还在找原因。

  

新手站长一定要看的IIS日志分析

 

  这类404的错误让人只有慢慢去找原因,我也不知道为什么突然会很大,之后又会突然很小。这方面还需要和很多高手交流一下。

  这也是本人做站的一点小经验,拿出来跟大家分享一下,大家都是为了排名才没日没夜的坐到电脑面前,都是非常辛苦的,希望大家多多交流,共同进步,本文由绵阳富乐网天空星云所写,如需转载请保留出处,尊重原创,共同进步!

继续阅读
weinxin
痕风的起点
专注于互联网资讯、中央空调、Windows、wordpress、建站技术、软件应用等相关网络资源的分享。
匿名

发表评论

匿名网友 填写信息

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: