人工智能创新:对 546,000 多个人工智能概述的分析

来源:六安市叶集区金利木业有限责任公司

AI Overviews 是自移动时代以来最重要的 SEO 变革推动者——或许是永远如此。

到目前为止,我们还缺少一个具有代表性的数据集来彻底分析 AIO(AI 概述)的工作原理。

感谢 Surfer的独家数据,我进行了迄今为止最大规模的 AI 概览分析,涉及超过 546,000 行和 +44 GB 的数据。

数据以惊人的清晰度回答了谁、为什么以及如何在 AIO 中排名。在其他情况下,它提出了我们可以寻求回答的新问题,并完善了我们对如何在 AIO 中取得成功的理解。

风险很高:AIO 可能导致流量大幅下降 -10%(根据我的初步 分析),具体取决于引用设计和用户意图——而且这是无法避免的。

自从AIO 在 5 月底首次推出两周后撤回以来,他们一直在缓慢地加大力度。

图片来源:Lyna™

数据

该数据集涵盖 546,513 行、44.4 GB 和超过 1200 万个域。目前尚无可比的数据集可供探索。

  • 85%的查询和结果都是英文的。
  • 253,710 个结果为实时结果(不属于 SGE,即 Google 的测试环境),285,000 个结果属于 SGE 的一部分。
  • 8,297 个查询显示了 SGE 和非 SGE 的 AIO。
  • 数据包含查询、有机结果、引用域和 AIO 答案。
  • 该数据集于六月份被提取。

限制:

  • 由于 AIO 一直在变化,因此可能不会包含新功能。
  • 数据集尚未包含最近添加的葡萄牙语或西班牙语等语言。

我将在几份备忘录中分享见解,敬请关注第二部分。

答案

在首次探索中我试图回答五个问题。

  1. 哪些领域在 AIO 中最显眼?
  2. 每个 AIO 都有引文吗?
  3. 有机位置是否决定 AIO 可见性?
  4. 有多少 AIO 包含搜索查询?
  5. SGE 内部和外部的 AIO 有何不同?

哪些域在 AIO 中最显眼?

我们可以假设引用最多的域名也会从 AIO 获得最多的流量。

在我之前的分析中,维基百科和 Reddit 是被引用次数最多的来源。这次,我们看到了不同的情况。

AIO 中引用次数最多的 10 个域名:

  • youtube.com。
  • wikipedia.com。
  • linkedin.com。
  • NIH(国家医学图书馆)。
  • 支持.google.com。
  • healthline.com。
  • webmd.com。
  • support.microsoft.com。
  • mayoclinic.org。

经典搜索结果中排名前 10 的域名:

  • www.google.com。
  • www.youtube.com。
  • www.reddit.com。
  • www.quora.com。
  • wikipedia.org。
  • www.linkedin.com。
  • 支持.google.com。
  • www.healthline.com。
  • www.ncbi.nlm.nih.gov。
  • www.webmd.com。

最大的区别是什么? Reddit、Quora 和 Google 在 AIO 引用中完全没有代表性,这完全违反直觉,也与我们过去看到的趋势相反。我只在这三个领域发现了一些 AIO 引用:

  • Reddit:130。
  • 定量:398。
  • 谷歌:612。

谷歌在这里有意识地做出了改变吗?

我们可以看到,AIO 可以显示引用的 URL 和经典搜索结果中的排名 URL 之间的巨大差异。

YouTube 和 LinkedIn 这两个社交网络位列被引用次数最多的前三大域名,这一事实引出了一个问题:我们是否可以通过 YouTube 和 LinkedIn 上的内容而不是我们自己的内容来影响 AIO 的答案。

与 LinkedIn 答案相比,制作视频需要付出更多努力,但它们也可能更能抵御模仿者。AIO 优化策略应包括社交和视频内容。

每个 AIO 都有引文吗?

我们假设每个 AIO 都有引用,但情况并非总是如此。

具有非常简单的用户意图的查询,例如“文章的元描述是什么?”或“1.5 是一个整数吗?”不会显示任何引用。

我统计了数据集中的 4,691 个零引用查询(0.85%)——不到 1%(0.85%)。

首先,这些流量到底有多大价值是值得怀疑的。

然而,谷歌愿意显示不带引用的人工智能答案,这一事实引发了一个问题:我们是否还会看到更复杂、更有价值的无来源查询。

其影响将是毁灭性的,因为引用是从 AIO 获取点击的唯一途径。

有机位置是否决定 AIO 可见性?

最近,更多的数据显示,AIO 中引用的页面与同一查询排名靠前的页面之间存在很高的重叠。

潜在的问题是:与传统搜索结果相比,您是否需要采取不同的措施来优化 AIO?

早期,Google 会引用 AIO 中未排在前 10 个结果中的 URL。有些甚至来自受惩罚或未编入索引的域。

令人担心的是,系统会选择远离传统搜索结果排名的引用,这使得 AIO 难以优化并导致可疑的答案。

在过去的一到两个月里,这种趋势似乎有所改变,但数据并未显示出好转。

我发现:

  • 前 20 个搜索结果中共有 920 万个唯一 URL。
  • AIO 引用中总共有 270 万个 URL。
  • 在前 20 个搜索结果位置和 AIO 引用中都有 110 万个唯一 URL。

排名前 20 位的搜索结果中,12.1% 的 URL 也是 AIO 引用。相反,59.6% 的 AIO 引用并非来自排名前 20 位的搜索结果。

该观察结果得到了谷歌专利的支持,该专利展示了如何在总结1之后选择链接,以及搜索结果排名和 AIO 引用之间的弱相关性:总计为 -0.19,前 3 个搜索结果为 -0.21。

在搜索结果中排名越高,在 AIO 中被看到的机会就越大,但这绝不是唯一的因素。Google 的目标是让 AIO 引用更加多样化。

在搜索结果中,无论 URL 是否在前 10 位,其平均排名为 ~15.7 个关键词。在 AIO 引用中,该数字几乎正好是前者的一半:8.7 倍。

因此,更多的网站可以从 AIO 获得点击。然而,更多的多样性被 AIO 中引用的 URL 减少和由于更深入的答案而导致的点击者减少所抵消。搜索结果中出现的 URL 略多于 1200 万个,而 AIO 中出现的数量为 270 万个(23.1%)。

有多少 AIO 包含搜索查询?

目前尚不清楚 AIO 答案是否包含搜索查询。由于查询实际上代表了用户意图,而这种意图是隐含的而非明确的,因此它们可能不包含。

因此,如果内容过于针对明确的查询而缺少意图,Google 可能不会将其选为 AI 答案的引用或来源。数据显示,只有 6% 的 AIO 包含搜索查询。

在 SGE 中,这一数字略高,为 7%,而在实时 AIO 中,这一数字较低,为 5.1%。

因此,满足用户内容意图比我们想象的要重要得多。

这并不奇怪,因为 多年来用户意图一直是 SEO 中的一个关键排名要求,但看到这些数据却令人震惊。

SGE 内部和外部的 AIO 有何不同?

SGE 是 Google 针对新搜索功能推出的 Beta 测试环境。它并不像人们通常认为的那样等同于 AI 概览。

由于 Google 已在 SGE 中试验了新的 AI 功能,因此出现了一个问题:SGE 内部和外部的 AIO 有何不同。我们能从 SGE 中的 AIO 中了解到未来的发展吗?

我查看了 SGE 内外的 8,000 多个 AIO,发现 30% 的 AIO 在 SGE 中的内容与实际内容有很大不同。SGE 结果可能还不能预示未来会发生什么,至少目前如此。

SGE 与实时 AIO 的长度各不相同,但平均长度相同:SGE 为 1,019,实时为 996。

例如,搜索查询“营销经理”的 AIO 在 SGE 中有 347 个字符,而实时中有 1,473 个字符。

但大多数 AIO 答案看起来像“P&L”,在 SGE 中有 1,188 个,在实时结果中有 1,124 个。

我们不能断定 SGE 的结果(以及 AIO 的潜在未来)是更长(更简洁)还是更短(更详细)。我将进一步分析结果。

在域名级别,如果 SGE 可以预测未来的表现,那么以下 10 个域名将获得最大的相对可见度增幅:

  • byjus.com。
  • geeksforgeeks.org。
  • timesofindia.indiatimes.com。
  • amazon.com。
  • ahrefs.com。
  • github.com。
  • medium.com。
  • pcmag.com。
  • techtarget.com。
  • coursera.org。

最有可能失去 AIO 可见性的十大域名是:

  • support.squarespace.com。
  • knowledge.hubspot.com。
  • quickbooks.intuit.com。
  • allrecipes.com。
  • bhg.com。
  • bankrate.com。
  • cnbc.com。
  • nerdwallet.com。
  • thespruce.com。
  • 抖音。

意义

这一切意味着三件事:

1. 针对 AI 概览进行优化与精选片段类似,但不同之处在于更注重用户意图。

精选摘要优化非常依赖精确匹配 - 您需要匹配问题并明确指出答案与问题相关。不适用于 AIO。

对于 AIO,我们可以调整我们的内容以匹配 AIO 答案或给出更好的答案,但在搜索查询上下文中反映“有用”的信息比准确的措辞更为重要。

有三个挑战:

  • 了解并定位 AIO 中出现的部分,例如列表、比较、“什么是...”或“如何...”解释等。
  • 跟踪 AIO,因为它们往往会经常更改,这意味着我们必须相应地调整内容和影响预期。就在最近,谷歌开始测试带有链接的侧边栏,而不是轮播。2
  • 对于查询来说,排名在前 10 位,最好是前 3 位,这不是先决条件,但可以增加您的机会。

2. SGE 可用于监控潜在的 AIO 设计变化,但无法预测 AIO 答案可能如何变化。需要注意的一个威胁是无引用的 AIO。

3. 社交可能会卷土重来!许多年前,社交信号被炒作成 SEO 排名因素。如今,YouTube 和 LinkedIn 等社交网络在引用量中的突出地位为利用社交和视频内容影响 AIO 提供了机会。

前瞻性思考

AIO 的作用与公平竞争相反。它们造成了一种不平衡,少数被引用的网站比其他网站获得了更多的曝光率。

然而,与精选摘要相比,它们能够更好、更频繁地回答用户的问题,从而缩小了竞争空间。

随着 AIO 答案的改善,点击次数减少的风险也会增加,但广告点击次数减少的风险也随之增加。自然搜索结果和付费搜索结果始终保持平衡。一方的质量会影响另一方。除非 Google 嵌入新的广告模块(这是有可能的),否则更好的自然搜索结果将以牺牲广告收入为代价。

与此同时,谷歌也从 OpenAI 和 Perplexity 等竞争对手那里获得了优势,这些竞争对手不断推出更好的模型,增加了搜索者不再使用谷歌寻找答案的可能性。谷歌很难不在搜索结果中的人工智能上进行迭代和创新。

欧盟和非欧盟国家之间可能会出现 AIO 设计差异。新法规和罚款将降低 Alphabet、Meta 或 Apple 等科技公司在欧盟推出 AI 功能的兴趣。

其结果可能是两个互联网,让我们可以比较美国等国家人工智能的影响和变化格局。