什么是搜索引擎蜘蛛抓取？

ID:473 / 打印

抓取是搜索引擎蜘蛛从待抓地址库中提取要抓的URL，访问这个URL，把读取的HTML代码存入数据库。蜘蛛的抓取就是像浏览器一样打开这个页面，和用户浏览器访问一样，也会在服务器原始日志中留下记录。

每家独立的搜索引擎都会有自己的网页抓取程序爬虫。爬虫蜘蛛顺着网页中的超链接分析连续访问抓去更多网页。被抓取的网页被称之为网页快照，另外搜索引擎蜘蛛抓取网页是有一定规律的。如下：

1、权重优先：先参照链接的权重，再综合深度优先和宽度优先策略抓取。打个比方，如果这条链接的权重还不错，就采用深度优先；如果权重很低，则采用宽度优先。

2、重访抓取：这个就可以直接字面上理解。因为搜索引擎使用单个重访与全部重访结合的居多。所以我们做网站内容要记得定期维护日常更新，让蜘蛛多来访多抓取才能收录快。

作者：站长天下 2018-05-23

站长天下专题栏目提供 SEO 相关知识和问题解答。

如对此文章有疑问？请在底部留言，小编及时改正。