首页 > 华企学院 > 优化教程 > 站内优化之文件优化

站内优化之文件优化

作者:华企商城小编  浏览量:72   发布时间:2016-04-24 16:20:10

  站内优化之文件优化

  Robots.txt对于任何一个从事SEO研究工作的人都是至关重要的,因为透过 Robots.txt 我们可以直接与搜索引擎蜘蛛进行对话,告诉他们哪些可以抓取,哪些不可以抓取。

  一、为什么设置Robots.txt?

  在进行SEO操作的时候,我们需要告诉搜索引擎哪些页面重要哪些页面不重要,重要的页面让蜘蛛进行抓取,不重要的页面进行屏蔽可以减少网站服务器的负担。

  二、一些常见的问题和知识点

  1、蜘蛛在发现一个网站的时候,第一步是抓取网站的Robots.txt文件(当然官方上是这么说的,有时候也会出现不遵守的情况);

  2、建议所有的网站都要设置Robots.txt文件,如果你认为网站上所有内容都是重要的,你可以建立一个空的robots.txt文件;

  三、在robots.txt文件中设置网站地图

  你可以在robots.txt中添加网站的地图,告诉蜘蛛网站地图所在的地址。

  四、Robots.txt的顺序

  在蜘蛛协议中,Disallow 与 Allow是有顺序的,这是一个非常重要的问题,如果设置错误可能会导致抓取错误。

  引擎蜘蛛程序会根据第一个匹配成功的Allow或Disallow行确定是否访问某个URL,一个例子可以让你更清楚明白:

  1.User-agent: * 2.Allow: /seojc/bbs 3.Disallow: /seojc/  这个情况下,蜘蛛/seojc/bbs目录可以正常抓取,但/seojc/目录的文件无法抓取。通过这种方式可以允许蜘蛛访问特定目录中的部分url。

  我们对调下位置观察一下。

  1.User-agent: * 2.Disallow: /根目录下的文件夹/ 3.Allow: /seojc/bbs  /seojc/目录出现在第一行,禁止抓取目录下的所有文件,那么第二行的Allow就无效,因为第一行中已经禁止抓取seojc目录下的所有文件,而bbs目录正好位于seowhy目录下。因此匹配不成功。

  五、Robots.txt路径问题

  在蜘蛛协议中,Allow和Disallow后面可以跟两种路径形式,即绝对链接、相对链接。绝对链接就是完整的URL形式,而相对链接只针对根目录。这是重点记住。

  六、斜杠问题

  Disallow: /seojc表示禁止抓取seoic这个目录下的所有文件,如:seojc.1.html、seojc/rmjc.php都不允许抓取;

  Disallow: /seojc/ 表示禁止抓取seojc这个目录下的文件,即允许抓取seojc.1.html,但是不允许抓取seojc/rmjc.php。

文章站内优化之文件优化由,SEO优化诊断http://www.netshop168.com/goods-176.html,整理发布。

华企商城更多商品介绍:快速提升百度排名与权重必备    商务型Linux国内独立IP空间  教你如何谨慎选择虚拟主机服务商

文章转载请注明出处:http://www.netshop168.com/article-4202.html


精品推荐
下一篇:分享一下最新的网站seo方案(纯干货)
上一篇:站内优化之网址优化
相关文章

华人企业网
关注微信公众号
享受更多优惠

 

消费者最喜爱的网站TOP100 | | 网络社会征信网 | 北京工商 | 法律顾问 | 京ICP备07504386号-6 | 网站地图