深圳易捷网络科技财税咨询网-neatmaster518.com 返回首页

企业网站中robots.txt的重要性

信息来源:深圳市易捷网络科技有限公司
信息发布时间:2025/4/4
Robots.txt是搜索引擎在访问网站时需要查看的首要文件。这个文件用来告诉蜘蛛程序哪些文件可以在服务器上被访问,哪些不能。

当一个搜索蜘蛛访问一个网站时,它首先会检查该网站的根目录下是否存在robots.txt。如果存在,搜索机器人会按照该文件中的内容来确定其访问范围;如果不存在,所有的搜索蜘蛛将能够访问网站上所有未被口令保护的页面。

Robots.txt必须被放置在一个网站的根目录下,并且文件名必须全部小写。

Robots.txt的使用误区
误区一:我的网站上的所有文件都需要蜘蛛抓取,那我就没必要添加robots.txt文件了。实际上,如果该文件不存在,所有的搜索蜘蛛将默认能够访问网站上所有没有被口令保护的页面,但在服务器日志中,每当用户试图访问某个不存在的URL时,都会记录404错误(无法找到文件)。同样的,每当搜索蜘蛛来寻找并不存在的robots.txt文件时,服务器也会在日志中记录一条404错误,所以你应该在网站中添加一个robots.txt文件。

误区二:在robots.txt文件中设置所有的文件都可以被搜索蜘蛛抓取,这样可以增加网站的收录率。但是,即使蜘蛛收录了网站中的程序脚本、样式表等文件,也不会增加网站的收录率,还只会浪费服务器资源。因此必须在robots.txt文件里设置不要让搜索蜘蛛索引这些文件。具体哪些文件需要排除,在robots.txt的使用技巧一文中有详细介绍。

误区三:
搜索蜘蛛抓取网页太浪费服务器资源,所以在robots.txt文件中设置所有的搜索蜘蛛都不能抓取全部的网页。然而,如果这样的话,会导致整个网站不能被搜索引擎收录。

Robots.txt的使用技巧
在网站的根目录下添加一个robots.txt文件可以避免服务器记录不必要的404错误。每当用户试图访问某个不存在的URL时,服务器都会在日志中记录404错误(无法找到文件)。每当搜索蜘蛛来寻找并不存在的robots.txt文件时,服务器也将在日志中记录一条404错误,所以应该在网站中添加一个robots.txt文件。
网站管理员必须使蜘蛛程序远离某些服务器上的目录-——保证服务器性能。比如:大多数网站服务器都有程序储存在“cgi-bin”目录下,因此在robots.txt文件中加入“Disallow: /cgi-bin”是个好主意,这样能够避免将所有程序文件被蜘蛛索引,可以节省服务器资源。一般网站中不需要蜘蛛抓取的文件有:后台管理文件、程序脚本、附件、数据库文件、编码文件、样式表文件、模板文件、导航图片和背景图片等等。

下面是VeryCMS里的robots.txt文件示例:
User-agent: * Disallow: /admin/ 后台管理文件
Disallow: /require/ 程序文件
Disallow: /attachment/ 附件
Disallow: /images/ 图片
Disallow: /data/ 数据库文件
Disallow: /template/ 模板文件
Disallow: /css/ 样式表文件
Disallow: /lang/ 编码文件
Disallow: /script/ 脚本文件

如果你的网站是动态网页,并且你为这些动态网页创建了静态副本以供搜索蜘蛛更容易抓取。那么你需要在robots.txt文件中设置避免动态网页被蜘蛛索引,以保证这些网页不会被视为含重复内容。目前支持这一做法的搜索引擎公司有Google, Yahoo, Ask和 MSN。中文搜索引擎公司目前还没有加入这个圈子。通过在Robots.txt文件中添加这样的链接,站长不用到每个搜索引擎的站长工具或者相似的站长部分去提交自己的sitemap文件,搜索引擎的蜘蛛自己就会抓取Robots.txt文件,读取其中的sitemap路径并接着抓取其中相连的网页。

合理使用Robots.txt还能够避免访问时出错。比如,你可以设置阻止搜索者直接进入购物车页面因为购物车没有必要被收录所以可以在Robots.txt里阻止搜。

相关行业资讯

1、深圳企业官网建设有哪些基本步骤
2、怎么自己制作网页步骤是什么
3、优化移动网站应注意的10点建议
4、做网站设计怎样提前做好预算
5、常用的网络推广方法集锦
6、比较国内外企业国内企业网站普遍缺少这些东西
7、网站规划
8、一分钟带你了解公司应该怎样做好网络营销
9、网络营销3步走每一个细节都至关重要
10、SEO中如何利用分享提高工作效率
11、外包网站设计是最佳选择的八大原因(二)
12、优化搜索引擎需要做好的几件事
13、结交人脉实现网站梦想
14、一个好的网站制作应该具备以下几点
15、社交媒体正在损害你的网页设计业务吗
16、新站如何减少页面加载时间
17、海外邮件不畅通怎么办专业的腾讯企业邮箱可以帮你解除烦恼
18、怎么挑选深圳做的比较好的网站设计公司
19、央企网站建设的意义和应该注意的方面
20、2016年的推广优化是否还有发展前景你怎么看
21、地方网站推广运维思路
22、网络推广有哪些有效途径
23、如何提高网站流量
24、网站建设行业乱象根源在于灰色心态
25、网站建设浅谈免费的搜索引擎推广
26、判断深圳网站设计报价
27、新闻页面的设计要遵循的原则
28、竞争对手分析
29、运营技巧:沟通,运营者与用户沟通过程的距离
30、iOS8HTML5性能测试:苹果有多爱HTML5
31、地方门户分析报告(一):地方门户还有没有市场
32、深圳网站设计首页,企业网站建设中网站首页应该如何设计?
33、博物馆网站建设基本栏目分析
34、网站设计如何确保设计新颖
35、网站制作制作成功要注意哪些
36、站长成长的必经之路:博客被黑的好处
37、网站设计如何做seo优化
38、2016年新站上线推广优化建设方案
39、打开网站发生网络故障时如何友善提示用户
40、SEO优化的四个技巧
41、站长们还能“活”多久
42、分析网站不被百度收录的4点原因
43、微网站制作不可小觑发展前景相当乐观
44、SEO优化哪些细节影响搜索引擎的抓取频率
45、T检验和卡方检验
46、怎样判断企业网站建设是否优秀?
47、如何让网站发布的文章被百度收录
48、哪些因素会影响响应式网站的布局
49、百度快照为什么不更新,原因在这里
50、网站运营:为何很多网站文章喜欢分页显示
深圳市易捷网络科技有限公司版权所有    粤ICP备2022153140号