robots文件放在网站上有什么样的作用

很多站长再对网站开始优化之前,会忽略非常重要的一点,那就是网站上的robots文件,而这个文件的作用就是告诉搜索引擎这个网站上什么可以抓取,什么不能抓取,文件放在网站的根目录。

User-agent禁止访问抓取系列:

User-agent: *

这里的*好是通配符,意指所有的搜索引擎都可以抓取,包括百度、搜狗等等

Disallow: /

意思是禁止蜘蛛抓取该网站的任何目录

Disallow:/456

意思是禁止蜘蛛抓取该网站的456以及456层级之下的所有内容

Disallow:/456/

意思是禁止蜘蛛抓取456层级之下的所有内容,但是可以抓取456页面的内容

robots文件放在网站上有什么样的作用

Disallow:/***.png

意思是禁止蜘蛛抓取网站上所有png格式的图片,想要禁止抓取其它格式也是这样书写,比如想要禁止抓取网站jpg格式的图片,书写方式为Disallow:/***.jpg

Disallow:/456789/***.png

禁止蜘蛛访问456789层次下的png图片,其他格式也是同样的书写方式

Disallow:/*?*

禁止蜘蛛抓取网站上所有的动态url页面

Disallow:/789/*?*

禁止蜘蛛抓取网站上789目录下的所有动态页面,不影响抓取网站789目录中的其它内容

Allow允许抓取访问系列:

Allow的意思是允许蜘蛛访问抓取的意思,在写robots文件的时候一定要注意一件事,就是在书写的时候,一定要将allow放在disallow前面,才能不受disallow的影响. robots.txt文件名称一定要小写的,不要大写。

未经允许不得转载:武汉seo » robots文件放在网站上有什么样的作用