搜索引擎如何工作

@高效码农  August 30, 2023

第1部分 搜索引擎基础知识 

让我们首先探讨什么是搜索引擎、它们为何存在以及它们如何赚钱。 

什么是搜索引擎?

搜索引擎是可搜索的网络内容数据库。它们由两个主要部分组成: 

  1. 搜索索引。有关网页的数字信息库。 
  2. 搜索算法。负责匹配搜索索引结果的计算机程序。

搜索引擎的目的是什么?

每个搜索引擎都旨在为用户提供最好、最相关的结果。这在一定程度上是他们获得市场份额的方式。

搜索引擎如何赚钱?

搜索引擎有两种类型的搜索结果: 

  1. 来自搜索索引的有机结果。你不能花钱来这里。
  2. 来自广告商的付费结果。你可以付费来到这里。

每当有人点击付费搜索结果时,广告商就会向搜索引擎付费。这就是所谓的按点击付费 (PPC) 广告,这就是市场份额如此重要的原因。更多的用户意味着更多的广告点击和更多的收入。

搜索引擎如何赚钱

How search engines make money

    • *

第2部分 搜索引擎如何建立索引 

每个搜索引擎都有自己的构建搜索索引的过程。以下是 Google 使用流程的简化版本。

谷歌如何构建搜索索引

How Google builds its search index

让我们来分解一下。

网址

一切都从已知的 URL 列表开始。Google 通过多种方式发现这些问题,但最常见的三种是: 

  • 来自反向链接。谷歌拥有数千亿个网页的索引。如果有人从已知页面链接到新页面,Google 可以从那里找到它。
  • 来自站点地图。站点地图告诉 Google 您认为网站上哪些页面和文件很重要。
  • 来自 URL 提交。Google 允许网站所有者请求在Google Search Console中抓取各个网址。

爬虫

爬虫是指称为蜘蛛的计算机机器人访问并下载已知 URL 的过程。Google 的抓取工具是Googlebot

处理和渲染

处理是谷歌从抓取的页面中理解和提取关键信息的过程。为此,它必须呈现页面,这是它运行页面代码以了解用户的外观的地方。 

谷歌之外没有人知道这个过程的每一个细节。但没关系。我们真正需要知道的是,它涉及提取链接和存储索引内容。 

索引

索引是将已爬网页面的处理信息添加到搜索索引的地方。

搜索索引是您使用搜索引擎时搜索的内容。这就是为什么在 Google 和 Bing 等主要搜索引擎中建立索引如此重要。除非您在索引中,否则用户无法找到您。 

你可知道?

谷歌拥有91.43%的搜索引擎市场份额。它可以为您带来比其他搜索引擎更多的流量,因为它是大多数人使用的搜索引擎。

第三部分 搜索引擎如何对页面进行排名 

发现、爬行和索引内容只是这个难题的第一部分。搜索引擎还需要一种在用户执行搜索时对匹配结果进行排名的方法。这是搜索算法的工作。

什么是搜索算法?

搜索算法是对索引中的相关结果进行匹配和排名的公式。谷歌在其算法中使用了许多因素。

Google 排名的关键因素

没有人知道谷歌排名的每一个因素,因为谷歌还没有披露它们。但我们确实知道一些关键的。让我们看一下其中的几个。

反向链接

反向链接是从一个网站的页面到另一个网站的页面的链接。它们是谷歌最强大的排名因素之一。这可能就是为什么我们在超过十亿个页面的研究中看到链接域和自然流量之间存在很强的相关性。

引用域与搜索流量之间的相关性

The correlation between referring domains and search traffic

不过,这并不完全取决于数量。质量也很重要。具有一些高质量反向链接的页面通常比具有许多低质量反向链接的页面排名更高。

你可知道?

您可以在 Ahrefs 中免费检查指向您网站的反向链接。 

注册免费的Ahrefs 网站管理员工具帐户,在“站点资源管理器”中输入您的域名然后转到“反向链接”报告。

Ahrefs 站点资源管理器中的反向链接报告

Backlinks report in Ahrefs' Site Explorer

我们的爬虫是网络上第五活跃的爬虫,因此您将在这里看到反向链接的完整视图。 

关联

相关性是给定结果对搜索者的有用性。谷歌有很多方法来确定这一点。在最基本的层面上,它会查找包含与搜索查询相同的关键字的页面。它还会查看交互数据,看看其他人是否认为结果有用。

新鲜

新鲜度是一个依赖于查询的排名因素。对于需要新鲜结果的搜索来说,它的作用更强。这就是为什么您会看到最近发布的“Netflix 新系列”的最高结果,而不是“如何解魔方”。 

新鲜度是一个依赖于查询的 Google 排名因素

Freshness is a query-dependant Google ranking factor

页面速度

页面速度是桌面和移动设备上的排名因素。但这更多的是一个负面的排名因素,而不是一个积极的因素。这是因为它对最慢的页面产生负面影响,而不是对快如闪电的页面产生正面影响。

你可知道?

您可以在 Ahrefs 中免费检查页面速度。

注册免费的Ahrefs 网站管理员工具帐户,使用 Ahrefs 的网站审核抓取您的网站,然后转到性能报告。一般来说,你看到的红色越少越好。 

Ahrefs 现场审核中的绩效报告

Performance report in Ahrefs' Site Audit

移动设备友好性

自 Google于 2019 年转向移动优先索引以来,移动友好性一直是移动和桌面上的排名因素。

第4部分 搜索引擎如何个性化结果

谷歌为每个用户定制搜索结果。它使用您的位置、语言和搜索历史记录等信息来执行此操作。让我们仔细看看这些事情。

地点

Google 使用您的位置来个性化具有本地意图的搜索结果。这就是为什么“意大利餐厅”的所有结果都来自或关于当地餐厅的原因。Google 知道您不太可能飞越半个地球来吃午餐。

语言

谷歌知道向西班牙语用户显示英语结果是没有意义的。这就是为什么它会为使用不同语言的用户对内容的本地化版本(如果有)进行排名。

Google 对不同语言的不同版本的页面进行排名

Google ranks different versions of pages for different languages

搜索历史记录

Google 会保存您所做的事情和去过的地方,以便为您提供更加个性化的搜索体验。您可以选择退出,但大多数人可能不会。 

要点

  • 搜索引擎由两个主要部分组成:索引和算法。
  • 为了构建索引,它会爬行已知页面并通过链接查找新页面。 
  • 搜索算法的目的是返回最好、最相关的结果。
  • 搜索结果质量对于建立市场份额非常重要。
  • 没有人知道 Google 有机结果的所有排名因素。
  • 关键排名因素包括反向链接、相关性和新鲜度。 
  • Google 根据您的位置、语言和搜索历史记录来个性化其结果。 


评论已关闭