深圳易捷网络科技财税咨询网-neatmaster518.com 返回首页

搜索引擎蜘蛛爬行规律探秘(一)蜘蛛如何抓取链接

信息来源:深圳市易捷网络科技有限公司
信息发布时间:2024/12/22

搜索引擎蜘蛛,对于我们来说非常神秘,本文的配图使用蜘蛛侠的原因就在于此。当然我们也不是百度的也不是Google的,所以只能说探秘,而不是揭秘。本文内容比较简单,只是给不知道的朋友一个分享的途径,高手和牛人请绕行吧。

传统意义上,我们感觉搜索引擎蜘蛛(spider)爬行,应该类似于真正的蜘蛛在蜘蛛网上爬行。也就是比如百度蜘蛛找到一个链接,顺着这个链接爬行到一个页面,然后再顺着这个页面里面的链接继续爬……这个类似于蜘蛛网,也类似于一棵大树。这个理论虽然正确,但是不准确。

搜索引擎内部是有一个网址索引库的,所以搜索引擎蜘蛛是从搜索引擎的服务器出发,顺着搜索引擎已有的网址爬行一个网页,并将网页内容抓取回来。页面采集回来之后,搜索引擎会对其进行分析,将内容和链接分开,内容暂时先不说。分析出来链接之后,搜索引擎并不会马上去派蜘蛛进行抓取,而是把链接和锚文本记录下来交给网址索引库进行分析、对比和计算,最后放入网址索引库。进入了网址索引库之后,才会有蜘蛛去抓取。

也就是如果出现了某个网页的外链,并不一定会立刻有蜘蛛去抓取这个页面,而是会有一个分析计算的过程。即便是这个外链在蜘蛛抓取之后被删除了,这个链接也有可能已经被搜索引擎记录,以后还有抓取的可能。而且下次如果蜘蛛再去抓取这个外链所在页面,发现链接不存在了,或者外链所在页面出现了404,那么只是减少了这个外链的权重,应该不会去网址索引库删除这个链接。

所以说已经不存在的页面上的链接,也有作用。今天就分享这些,以后继续跟大家分享我自己分析的内容,如果有不准确的地方,请大家批评指正。

相关行业资讯

1、建站程序选择之论坛和CMS如何选择与搭配
2、企业网站网页设计第一印象的重要性
3、SEO优化之网站内链的注意事项
4、内容营销如何影响搜索排名
5、企业网站移动端建设要注意哪几点
6、深圳网站设计中的五个核心交互设计原则
7、flash动画在做网站时是否还有存在的必要
8、网站制作具备的三大特点
9、优化教程取材自查找引擎
10、Enomcentral域名操作说明
11、改版后如何提升排名
12、搜索引擎中利用seo进行推广
13、浅析以新闻源做网站优化需要规避的问题
14、公司网站的建设需要多方配合
15、软文推广广告成分多少才合适
16、网络营销对消费者心理因素分析
17、企业网站推广优化的五个技巧
18、网站设计规范:我们应该做什么
19、医疗网络营销:网站运营重要的是什么
20、网站建设在建站前需要注意的问题
21、网站制作成现代企业的必备真正用途你真的知道吗
22、决定企业网站制作的价格的因素分析
23、地方站运营的几种方法和途径
24、提高用户体验的SEO优化的几个方法
25、网站建设中这些现象容易毁掉公司的心血
26、企业网站图片的优化方式
27、新公司要怎么制作网站
28、企业网站需求分析步骤
29、2018最新企业网站优化技巧新攻略
30、深圳网站制作公司浅谈出门在外如何维护网站
31、企业建网站弹幕视频网站
32、网站优化就是优化用户体验
33、网站改版更换服务器空间的注意事项
34、SEO最难做的7个行业
35、如何建设与推广地方旅游网站
36、这样的内容才能够让你网站发展更迅速
37、普通企业搭建邮件服务器的目的
38、企业网站站建设完善配套的软硬件设施
39、网站的产品页面怎么设计吸引消费者
40、网站运营之如何优化关键词
41、最全的伪静态规则和设置方法
42、影响百度关键词排名的因素有什么
43、网页中的安全色是什么
44、论坛建设要把握好广告的清理
45、石家庄网站建设—方法包含什么
46、企业邮箱的收费标准是什么
47、网站建设对企业发展有哪些优势
48、做网站优化不可忽视图片的优化
49、怎样才能提高百度权重
50、怎样看待企业网站建设
深圳市易捷网络科技有限公司版权所有    粤ICP备2022153140号