小小的天,有大大的梦想,终有一天,我有属于我的天!

网站LOG日志:一个常被埋没的SEO要素

SEO核心技术 1034℃ 4评论

作为我个人对网站LOG日志的理解,我形象的把它称之为网站的日记。还记得在学生年代,我有一个属于自己的日记本,带锁的那种而且还是带密码锁的,我总是把自己一天中所做的比较重要的时记录下来,不管是做得好的,还是不好的我都会认真写在上面。网站其实也是跟人一样,网站LOG日志是记录web服务器接收处理请求以及运行时错误等各种原始信息的以(·log)结尾的文件。所以这是我们检查网站SEO各项数据的一项重要指标。

怎么说呢?很多站长可能都知道网站LOG日志很重要,可能是因为密密麻麻的字符串让人比较头疼,所以很多人仅仅是知道,而没有去深究,殊不知网站LOG日志能为我们做SEO提供非常大的帮助!下面我就再啰嗦一下网站LOG日志,也算是总结吧!希望对那些还不是很熟悉它的朋友有小小的帮助。

rizhi

一:查看目录抓取概况

目录抓取,可以清晰的查看到光顾网站的蜘蛛爬行过哪些目录。要知道:有些目录是没有价值的,如一些图标目录、下载目录、留言目录等,还有后台目录、数据库,如果任由蜘蛛爬行,也是一种安全隐患。另外一方面,搜索引擎对于不同的站点都有着抓取配额,无用目录,更不要占用这样的配额,以免减少有效配额的抓取量。

二:查看页面抓取概况

页面抓取可以准确的查看到蜘蛛爬行的每一个页面,这也是对于LOG日志分析上非常重要的一个环节。如:多重URL链接的抓取?垃圾页面的抓取?都是可以在其中展现出来的。甚至:某个页面抓取频率越高,通常代表这个页面更有价值。

如果你想优化的页面,抓取频率偏低,那么就要为其增加适当的曝光度,来达成你想要的结果。

三:查看状态码信息

状态码分为两种,一种是蜘蛛状态码,另一种是用户状态码,通过蜘蛛状态码可以准确的查看到网站是否存在抓取问题。例如:404代表的是错误页,301、302代表的是重定向,还有一些:504、500、等状态码,值得说的是:除去200状态码,出现其他的状态码都是应当值得注意的,当然,如果只是个别几条则无需理会。但是如果数量一旦偏多,网站则100%出现问题了。

而用户状态码,则代表用户的访问情况,在这其中可以清晰的看到用户最为关注哪些页面。不要认为这是小事情,懂得营销的站长,知道投其所好!

上面说的是一些LOG日志工具都有的功能,而接下来我们再说一下一些进阶类型的东西:

Ⅰ:如果想要更多有效的着陆页被蜘蛛更多的抓取,那么请进行结构内链的完善。

Ⅱ:不希望蜘蛛抓取那些没有优化意义的页面上,那么robots.txt上来进行封闭。

Ⅲ:“蜘蛛陷阱”无止尽的循环,浪费抓取配额,通过页面抓取,都可以直观看到。

Ⅳ:曝光力度够了,蜘蛛一样不抓取,只能说页面价值太低,需要进一步优化。

Ⅴ:我们希望每个页面的下载时间足够快,可以在有效的时间内抓取更多的页面。

Ⅵ:不是所有的蜘蛛都是真的蜘蛛,要学会查看蜘蛛是否为“采集”和“模拟”。

Ⅶ:分析每天的蜘蛛,可以查看上升或者下降的趋势,明显变化,网站会出事的。

Ⅷ:降低或者封禁不会带来流量的蜘蛛,以减少服务器压力,对大型网站很重要。

关于网站LOG日志我就说到这儿了,希望大家能够提高对网站LOG日志的重视,这样对你的SEO优化总是有好处的!

喜欢 (5)
发表我的评论
取消评论
表情

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
(4)个小伙伴在吐槽
  1. 这篇文章很有用
    威客网2016-02-27 14:18 回复
  2. 看一看来瞧一瞧,这个博客真是好!
    益群网2016-02-29 14:50 回复
    • 谢谢。
      小明seo2016-03-03 10:16 回复
  3. 我分析我网站IIS日志,发现BAIDU蜘蛛都是来请求下sitemap.xml就走了。是咋回事?新站做了个多星期了,一直只收录了首页
    柠檬C视频网2016-11-23 15:17 回复