专业网站建设

robots.txt是什么?有什么用?

robots.txt的写法

  第一:什么是robots.txt?

  这是一个文本文件,是搜索引擎爬行网页要查看的第一个文件,你可以告诉搜索引擎哪些文件可以被查看,哪些禁止。当搜索机器人(也叫搜索蜘蛛)访问一个站点时,它首先会检查根目录是否存在robots.txt,如果有就确定抓取范围,没有就按链接顺序抓取。

  第二:robots.txt有什么用

  为何需要用robots.txt这个文件来告诉搜索机器人不要爬行我们的部分网页,比如:后台管理文件、程序脚本、附件、数据库文件、编码文件、样式表文件、模板文件、导航图片和背景图片等等。说到底了,这些页面或文件被搜索引擎收录了,用户也看不了,多数需要口令才能进入或是数据文件。既然这样,又让搜索机器人爬行的话,就浪费了服务器资源,增加了服务器的压力,因此我们可以用robots.txt告诉机器人集中注意力去收录我们的文章页面。增强用户体验。

  1、用robots屏蔽网站重复页

  很多网站一个内容提供多种浏览版本,虽然很方便用户却对蜘蛛造成了困难,因为它分不清那个是主,那个是次,一旦让它认为你在恶意重复,你就惨了

  User-agent: *

  Disallow: /sitemap/ 《禁止蜘蛛抓取 文本网页》

  2、用robots保护网站安全

  很多人纳闷了,robots怎么还和网站安全有关系了?其实关系还很大,不少低级黑客就是通过搜索默认后台登陆,以达到入侵网站的目标

  User-agent: *

  Disallow: /admin/ 《禁止蜘蛛抓取admin目录下所有文件》

  3、防止盗链

  一般盗链也就几个人,可是一旦被搜索引擎“盗链”那家伙你100M宽带也吃不消,如果你做的不是图片网站,又不想被搜索引擎“盗链”你的网站图片

  User-agent: *

  Disallow: .jpg$

  4、提交网站地图

  现在做优化的都知道做网站地图了,可是却没几个会提交的,绝大多数人是干脆在网页上加个链接,其实robots是支持这个功能的

  Sitemap: http:-www-***-com/sitemaps/sitemaps.xml

  5、禁止某二级域名的抓取

  一些网站会对VIP会员提供一些特殊服务,却又不想这个服务被搜索引擎检索到

  User-agent: *

  Disallow: /

  以上五招robots足以让你对搜索引擎蜘蛛掌控能力提升不少,就像百度说的:我们和搜索引擎应该是朋友,增加一些沟通,才能消除一些隔膜。

  第三:robots.txt基本语法

  1、robots.txt的几个关键语法:

  a、User-agent: 应用下文规则的漫游器,比如Googlebot,Baiduspider等。

  b、Disallow: 要拦截的网址,不允许机器人访问。

  c、Allow: 允许访问的网址

  d、”*” : 通配符—匹配0或多个任意字符。

  e、”$” : 匹配行结束符。

  f、”#” : 注释—说明性的文字,不写也可。

  g、Googlebot: 谷歌搜索机器人(也叫搜索蜘蛛)。

  h、Baiduspider: 百度搜索机器人(也叫搜索蜘蛛)。

  i、目录、网址的写法:都以以正斜线 (/) 开头。

  如

  Disallow:/

  Disallow:/images/

  Disallow:/admin/

  Disallow:/css/

  2、列举一些robots.txt 具体用法:

  (1)允许所有的robot访问

  User-agent: *

  Disallow:

  或者

  User-agent: *

  Allow: /

  或者建一个空文件”robots.txt”即可。

  (2)仅禁止某个机器人访问您的网站,如Baiduspider。

  User-agent: Baiduspider

  Disallow: /

  3、仅允许某个机器人访问您的网站,如Baiduspider。

  User-agent: Baiduspider

  Disallow:

  User-agent: *

  Disallow: /

  4、禁止访问特定目录

  User-agent: *

  Disallow: /admin/

  Disallow: /css/

  Disallow:

  要拦截对所有包含问号 (?) 的网址的访问(具体地说,这种网址以您的域名开头、后接任意字符串,然后接问号,而后又接任意字符串),请使用以下内容:

  User-agent: Googlebot

  Disallow: /*?

  要指定与某个网址的结尾字符相匹配,请使用 $。例如,要拦截以 .xls 结尾的所有网址,请使用以下内容: User-agent: Googlebot

  Disallow: /*.xls$

  您可将此模式匹配与 Allow 指令配合使用。例如,如果 ? 代表一个会话 ID,那么您可能希望排除包含 ? 的所有网址,以确保 Googlebot 不会抓取重复网页。但是以 ? 结尾的网址可能是您希望包含在内的网页的版本。在此情况下,您可以对您的 robots.txt 文件进行如下设置:

  User-agent: *

  Allow: /*?$

  Disallow: /*?

  Disallow: /*? 指令会阻止包含 ? 的所有网址(具体地说,它将拦截所有以您的域名开头、后接任意字符串,然后接问号,而后又接任意字符串的网址)。

  Allow: /*?$ 指令将允许以 ? 结尾的任何网址(具体地说,它将允许所有以您的域名开头、后接任意字符串,然后接 ?,? 之后不接任何字符的网址)。

  以上介绍多数都是Google的http:-www-google-com/support/we … cn&answer=40360,百度的大同小异具体可以看http:-www-baidu-com/search/robots.html

  PS:一般网站查看robots.txt文件的方法是主页后面加robots.txt就可以,比如淘宝网的就是http:-www-taobao-com/robots.txt请注意,仅当您的网站包含不希望被搜索引擎收录的内容时,才需要使用robots.txt文件。如果您希望搜索引擎收录网站上所有内容,请勿建立robots.txt文件。

上一篇
下一篇

推荐内容

网站建设的前期准备工作

建站公司在开始网站建设的工作前,必须要做好以下几方面的梳理:网站框架、网站风格、目标群体、功能、预算。前期的准备工作直接影响到网站后期的维护以及能否使建设出来的网站发挥出它的最大功用。

企业网站应该怎样发挥其应有的价值

在21世纪互联网高速发展的时代,网上用户的数量比往年高出了不少,也给很多个人和企业带 来了巨大的市场和商业价值,比如虚拟主机行业的迅速发展就是典型。

企业在网站建设中易进入的四大误区

网站内容只有不断的有更新,才会被抓取到,从而有个好的排名。网站排名越靠前,被用户看的几率就越大。再者,倘若用户每次浏览同一个网站出现的都是相同饿内容,没有任何更新,那么久而久之,就不会再被关注了。

网站建站页面改版后怎样避免排名大幅下降

随着企业的发展,现有的网站可能并不能很好的反映企业的实际情况,这就需要对企业网站进行一个网站改版。那么网站建设中,怎样避免搜索引擎对我们改版后的网站产生反感的情绪呢

营销型网站建设与响应式网站建设有什么区别?

除专业人士,普遍人对网站的种类区分概念都是很模糊的,只想着我想做一个网站,或是我想做一个很炫的网站,再或是我想做个网站一帮助提高公司业绩。

网站营运有哪些关键点?

网站的营运其实和现实营运店铺、公司是一样的,只要经营不善就可能倒闭,那我们做网站营运的时候有哪些关键的地方要注意的呢?今天深圳网站建设公司大腕互联就和大家分享一下。

做好企业网站设计提高网站用户的转化率

怎样将网站的访问者转化为成交的顾客?这就涉及到提高用户转化率的问题了。对企业特别是中小型企业来说,用户转化率都至关重要,它关系着网站的存亡,尤其是对那些进行网上销售的公司来说。

8个方法迅速提升百度竞价效果?

许多企业和朋友咨询到如何做百度SEM(百度竞价)?我在互联网营销公司从事竞价工作已有8年年头,以前做过医疗行业,家装行业,企业网站,环保行业,机构行业等做过不少行业,感觉应该给大家简单讲解一下做百度竞价,到底应该注意些什么?

大腕动态新闻

设计、印刷一体化将是印刷行业进化新方向

信息技术革命带来了互联网和电子商务,在电子商务热潮下,几乎所有行业都发生了相应的变革,而印刷业作为信息产业的重要组成部分自然也进行了“改造”。

在线简历设计用新一代在线智能设计平台·变设龙

在线简历设计用新一代在线智能设计平台·变设龙

在线海报设计用新一代在线智能设计平台·变设龙

宣传海报用于产品和品牌信息的传递、宣传。宣传海报又称招贴画,贴在街头墙上,挂在橱窗里的大幅画作,以其醒目的画面来吸引路人的注意,起到产品及品牌的宣传、广而告之的作用。宣传海报常用于艺演出、新品推荐、运动会、故事会、展览会、家长会、节庆日、竞赛游戏、电影宣传等。

在线工作证设计用新一代在线智能设计平台·变设龙

工作证,也称胸牌、员工证,是个人工作证件之一,代表着个人在某单位工作的凭证,也是一个公司形象和认证的标志。工作证设计的标准尺寸是85.5mm*54mm,大一点的有70mm*100mm。工作证设计内容一般包括单位名称、持证人姓名、职位、照片、工号等。

在线banner图设计用新一代在线智能设计平台·变设龙

世界看脸,网站看Banner,门面当然要漂亮,不过很多同学以为做Banner是门技术活儿,自己学艺不精做不了。如果你看了今天这篇文,就会明白,技术于Banner,就像刀法于人,虽有招式,但无内功支撑,久战必败。而这篇好文,就是Banner的内外兼修的神功秘籍!

变设龙设计好的图片下载到电脑哪去了?

变设龙做为一款简单方便的免费在线智能设计平台,已经有很多新媒体、电商运营、初入设计界的小伙伴在使用了,但MAC苹果系统的小伙伴在使用过程中总是遇到一个问题,那就是我在变设龙的设计的图片点击保存下载后到底下到哪里去了?

通过这几点正确的选择一家靠谱的网站建设公司

每个企业对要做的网站的需求不同,需求可能来自于网站类型的差异,是一般企业展示型网站还是电商或是社区,不同的网站类型会产生不同的价格。另外,不同设计、功能或者交互体验上的要求不同,也会影响最终的价格。各网站建设公司的技术水平和服务水平不同。

网站建设市场混乱如何从中正确抉择?

一个网站的重要性不言而喻,而如何选择一家专业靠谱的建站公司却是多数需求方为之苦恼的问题。纵观目前建站市场的整体发展,网站建设的业务已经趋于饱和,各类网站建设公司包括小型工作室以及个人服务商的数量却在逐年增加。

深圳大腕互联2018劳动节放假通知

  根据国务院办公厅通知并结合我司考勤规定,现公司决定2018年劳动节放假安排如下:  2018年4月29日至5月1日放假调休,共3天。4月28日(星期六)上班。  工作项目安排请提前做好工作对接,放假期间无人员值班安排,如项目有紧急情况请联系项目负责人进行沟通并协助处理,给您带

你的抠图神器已上线,请签收!

抠图难,抠图难,抠图难于上青天

复制添加微信好友

18617196506

关闭

电话咨询

周一至周日 9:00-18:00

公司地址

深圳市福田区福年广场B1栋506-511室

电话咨询

400-788-9809

周一至周日 9:00-18:00

总部地址

深圳市福田区福年广场B1栋506-511室

图片

深圳大腕互联信息科技有限公司    粤ICP备14028157号

免费电话咨询

图片
图片
图片
图片