银河集团GALAXY
全部
All
当前位置: 首页 > 新闻资讯 > 什么是Robots协议
相关新闻
  • 制造业与互联网融合的产物—“工业互联网”

    2026-04-17 17:37

    在中国机电一体化技术应用协会成立30周年的庆祝大会上,工信部信息化网站开发软件服务司副司长王建伟分享到当前工业互联网平台发展进展,以及工业互联网网站开发平台面临的问题与建议。今天银河集团GALAXY建

  • Bilibili(B站)被央视点名了!

    2026-04-11 14:22

    Bilibili(以下简称B站)是国内知名的视频弹幕网站,弹幕、二次元、番剧(日本连载动画电视剧)……带着这些标签,该网站成为年轻人追逐潮流文化的聚集地。记者登陆B站,点击主站番剧连载动画一

  • 银河集团GALAXY签约Future Club(未来俱乐部)—奢华官网的缔造

    2026-04-10 23:56

    FutureClub(以下简称:未来俱乐部)依托久臣强大的豪车平台资源和的市场布局。吸引着众多懂车、爱车的人士加入其中。目前主要业务为奢华豪车、游艇、直升机租赁及商务接待。超跑豪车中不泛全

  • 网站建设中的“傲慢与偏见”

    2026-04-05 08:00

    网站建设公司内容维护是很多企业最容易忽略的工作,但网站建设公司维护是网站建设后期必不可少的环节。在网络应用走向云端运用的同时,北京的中小企业除了因为公司本身网络营销知识资讯落差外,更面临资讯

  • 银河集团GALAXY建站小编分享网站设计中哪些地方容易犯错

    2026-04-03 12:32

    现在的客户越来越注意网站开发与动画效果了,其实在这里有一个尴尬的误区。大多数的客户对网站有他自己的审美观,且不论这个审美观的好坏,但是已经是一种自我所属的审美观,就已经不好了,因为这个网站开

什么是Robots协议

返回列表
发布时间:2026-04-14 10:36
Robots协议的全称是“网络爬虫排除标准”(Robots Exclusion
Protocol),网站通过Robots协议让搜索引擎知道哪些页面能抓取,哪些页面不能抓取。


公司网站设计案例


robots.txt文件是一个文本文件,使用任何一个常见的文本编辑器,可以创建和编辑它。robots.txt是一个协议,而不是一个命令。robots.txt是搜索引擎中访问网站的时候要查看的个文件。robots.txt文件告诉蜘蛛程序在服务器上什么文件是可以被查看的。


当一个搜索蜘蛛访问一个站点时,它会首先检查该站点根目录下是否存在robots.txt,如果存在,搜索机器人会按照该文件中的内容来确定访问的范围;如果该文件不存在,所有的搜索蜘蛛将能够访问网站上所有没有被口令保护的页面。



Robots.txt文件主要是限制整个站点或者目录的搜索引擎访问情况,而Robots
Meta标签则主要是针对一个个具体的页面。和其他的META标签(如使用的语言、页面的描述、关键词等)一样,Robots
Meta标签也是放在页面中,专门用来告诉搜索引擎ROBOTS如何抓取该页的内容。


Robots
Meta标签中没有大小写之分,name=”Robots”表示所有的搜索引擎,可以针对某个具体搜索引擎写为name=”BaiduSpider”。content部分有四个指令选项:index、noindex、follow、nofollow,指令间以“,”分隔。


index指令告诉搜索机器人抓取该页面;


follow指令表示搜索机器人可以沿着该页面上的链接继续抓取下去;


Robots Meta标签的缺省值是index和follow,只有inktomi除外,对于它,缺省值是index、nofollow。



Robots协议用来告知搜索引擎哪些页面能被抓取,哪些页面不能被抓取;可以屏蔽一些网站中比较大的文件,如:音乐,视频等,节省服务器带宽;也可以屏蔽站点的一些死链接。方便搜索引擎抓取网站内容;设置网站地图连接,方便引导蜘蛛爬取页面。


Robots协议是网站出于安全和隐私考虑,防止搜索引擎抓取敏感信息而设置的。搜索引擎则会按照Robots协议给予的权限进行抓取。Robots协议代表了一种契约精神,互联网企业只有遵守这一规则,才能保证网站及用户的隐私数据不被侵犯。Robots协议是维护互联网世界隐私安全的重要规则,如果被破坏,其后果是不可想象的。