Comparthing Logo
谷歌搜索引擎知识图谱人工智能语义搜索技术

谷歌搜索与知识图谱搜索

谷歌搜索是大多数人日常使用的通用网络索引引擎,而知识图谱搜索则是谷歌的结构化实体数据库,为直接答案和信息面板提供支持。了解它们的区别有助于解释为什么有些查询会返回丰富的资料,而另一些查询则会返回传统的蓝色链接。

亮点

  • Google 搜索对开放网络进行索引;知识图谱搜索则从精心整理的实体数据库中提取信息。
  • 知识图谱为许多谷歌搜索结果旁边的信息面板提供支持。
  • 传统搜索返回排名链接,而知识图谱直接返回结构化事实。
  • 知识图谱包含数千亿条事实,但涵盖的主题比整个互联网要少。

谷歌搜索是什么?

全球领先的网络搜索引擎,索引数十亿个网页,并使用 PageRank、RankBrain 和 BERT 等算法对搜索结果进行排名。

  • 谷歌搜索平均每天处理超过 85 亿次搜索查询,使其成为全球使用最广泛的搜索引擎。
  • 它是由拉里·佩奇和谢尔盖·布林于 1997 年在斯坦福大学攻读博士学位期间创立的。
  • 该系统使用谷歌的网络爬虫 Googlebot 抓取并索引数千亿个网页。
  • 排名取决于数百个信号,包括反向链接、内容相关性、页面加载速度、移动设备友好性和用户位置。
  • Google 搜索采用了 RankBrain(2015 年推出)和 BERT(2019 年推出)等机器学习模型,以更好地解释自然语言查询。

知识图谱搜索是什么?

谷歌于 2012 年推出的语义知识库,它组织有关现实世界实体及其关系的信息,以提供直接答案。

  • 知识图谱于 2012 年 5 月 16 日正式上线,最初包含约 35 亿条事实和 5 亿个实体。
  • 它为谷歌的知识面板提供支持,知识面板是显示在人物、地点和事物搜索结果旁边的信息框。
  • 信息来源于值得信赖的合作伙伴,例如维基百科、Freebase、CIA世界概况和授权数据库。
  • 实体通过“出生地”、“配偶”或“总部所在地”等类型关系连接起来,从而实现语义推理。
  • 根据谷歌自己披露的数据,到 2020 年,知识图谱已经增长到包含超过 5000 亿条事实,涵盖大约 700 亿个实体。

比较表

功能 谷歌搜索 知识图谱搜索
主要功能 返回与查询匹配的网页排名列表 返回有关实体及其关系的结构化事实
发布年份 1997 年(当时名为 BackRub,1998 年更名为 Google) 2012
数据来源 从互联网上抓取并索引网页 精选数据库、维基百科、授权资源和可信赖的合作伙伴
输出格式 十个蓝色链接、摘要、图片、视频和精选摘要 知识面板、实体卡片和直接回答框
底层技术 PageRank、RankBrain、BERT 和神经匹配 基于语义三元组(主语-谓语-宾语)的图数据库
最合适的查询类型 宽泛的、探索性的或导航性的查询 关于特定人物、地点、组织或事物的客观性查询
数据规模 已索引数千亿个网页 超过5000亿条事实,涵盖约700亿个实体
用户交互 点击进入外部网站查看完整信息 无需点击,即可直接在结果页面查看答案。

详细对比

核心宗旨及其运作方式

谷歌搜索就像一个庞大的图书馆目录,它会抓取开放网络并根据相关性和权威性信号对页面进行排名。当你输入查询时,它会将你的关键词与索引进行匹配,并返回看起来最有用的页面。知识图谱搜索的工作方式则不同。它不是将关键词与文档进行匹配,而是理解你的查询指的是某个特定实体,例如人、城市或化学元素,并从结构化数据库中提取关于该实体的已验证信息。

数据源和信任模型

传统的谷歌搜索几乎会从所有公开可访问的网页中提取内容,这意味着它涵盖的内容范围极其广泛,但也包含一些质量较低或不可靠的来源。知识图谱则采取了相反的方法,它从一组经过筛选的可信来源中提取信息,例如维基百科、政府数据库和授权的商业数据集。这使得知识图谱的搜索结果在事实查询方面更加可靠,但也限制了其涵盖的主题范围。

用户如何查看结果

标准的谷歌搜索结果页面会显示十个蓝色链接,以及精选摘要、图片和广告。知识图谱结果则以信息面板的形式出现在页面右侧(或移动设备上的顶部),其中包含摘要、关键事实、图片和相关实体。实际上,这两个系统在大多数查询中协同工作,知识面板是对传统搜索结果的补充,而不是取代它们。

不同查询类型的优势

谷歌搜索擅长处理模糊、探索性或长尾查询,帮助用户在网络上发现各种内容。知识图谱搜索则在用户想要快速获得关于某个知名实体的确切答案时表现出色,例如东京的人口或某个名人的出生日期。对于小众话题、冷门事实或近期发生的事件,传统搜索通常优于知识图谱,因为结构化数据库中并不包含这些信息。

演化与人工智能融合

这两个系统都随着人工智能的发展而显著演进。谷歌搜索整合了 BERT 和最新的 MUM 模型,以更好地理解自然语言和复杂查询。知识图谱本身也为谷歌最新的人工智能功能提供支持,例如 AI 概览和 Gemini 驱动的答案,这些功能将图数据与生成式语言模型相结合。从这个意义上讲,知识图谱正在成为谷歌更广泛的人工智能搜索计划的基础层,而不是一个独立的产品。

优点与缺点

谷歌搜索

优点

  • + 大规模网络报道
  • + 处理任何类型的查询
  • + 不断更新
  • + 丰富的搜索结果格式

继续

  • 质量因来源而异
  • 可以返回SEO垃圾邮件
  • 需要点击进入
  • 事实方面不太直接

知识图谱搜索

优点

  • + 直接的事实性回答
  • + 可信来源数据
  • + 丰富的实体关系
  • + 知识库小组

继续

  • 主题覆盖范围有限
  • 可能包含错误
  • 对近期事件的参考价值较低
  • 并非总是透明的

常见误解

神话

知识图谱与谷歌搜索是一回事。

现实

它们是两个独立但协同工作的系统。谷歌搜索负责索引网页,而知识图谱则是一个包含实体和事实的结构化数据库。大多数搜索结果会结合两者,但它们各自服务于不同的目的。

神话

知识图谱的结果始终来自维基百科。

现实

维基百科是一个主要信息来源,但知识图谱也参考了美国中央情报局世界概况、Freebase、授权商业数据库以及许多其他可信赖的合作伙伴。谷歌并不依赖任何单一信息来源。

神话

如果一个事实存在于知识图谱中,那么它必须100%准确。

现实

知识图谱可能包含错误,因为它汇总了来自多个来源的数据,而这些来源的数据有时存在差异或已过时。谷歌允许用户提出更正建议,但无法保证准确性。

神话

谷歌搜索仅使用关键词匹配。

现实

现代谷歌搜索使用包括 RankBrain、BERT 和神经匹配在内的复杂机器学习模型来理解查询背后的意图和上下文,而不仅仅是输入的字面关键词。

神话

知识图谱可以回答任何问题。

现实

知识图谱是为针对定义明确的实体的客观查询而设计的。它无法回答主观问题、执行计算,也无法检索尚未添加到数据库中的最新信息。

常见问题解答

谷歌搜索和知识图谱搜索有什么区别?
Google 搜索是一个网页索引引擎,它会返回来自互联网各处的网页排名列表。知识图谱搜索是一个结构化的实体和事实数据库,它为直接答案和信息面板提供支持。它们是两个独立的系统,但经常同时出现在同一个搜索结果页面上。
谷歌何时推出知识图谱?
谷歌于 2012 年 5 月 16 日推出了知识图谱。发布时,它包含了约 5 亿个实体的约 35 亿条事实,此后它已经迅速增长到超过 5000 亿条事实。
知识图谱的数据来自哪里?
知识图谱的数据来源于多种可信来源,包括维基百科、Freebase、CIA世界概况、谷歌地图以及授权的商业数据库。谷歌整合并协调这些来源的数据,构建其实体记录。
为什么谷歌在某些搜索结果中会显示知识面板,而在其他搜索结果中则不会?
当 Google 能够准确识别查询中的特定实体(例如名人、城市、公司或概念)时,它会显示知识面板。对于含义模糊或较为小众的查询,知识图谱可能没有足够的可靠数据来生成知识面板。
知识图谱能否回答有关近期事件的问题?
通常情况下,答案是否定的。知识图谱针对的是关于实体的稳定、可靠的事实信息进行了优化。对于突发新闻或最新动态,传统的谷歌搜索结果通常更有用,因为它们会抓取最新网页的内容。
知识图谱与人工智能概述相关吗?
是的。谷歌的AI概览和Gemini驱动的搜索功能都使用知识图谱作为其基础数据源之一。结构化的实体信息有助于将生成式答案建立在经过验证的事实之上。
谷歌知识图谱如今规模有多大?
根据谷歌自身披露的信息,知识图谱包含超过5000亿条事实,涵盖约700亿个实体。随着谷歌不断添加新的数据源并完善现有实体记录,知识图谱仍在持续增长。
我可以编辑或更正知识图谱中的信息吗?
谷歌不允许用户直接编辑知识图谱,但接受通过知识面板上的“建议修改”或“反馈”按钮提交的反馈意见。经审核通过的建议可能会被采纳。
如果没有知识图谱,谷歌搜索还能正常工作吗?
是的。谷歌搜索可以独立于知识图谱运行,根据其网络索引返回传统的蓝色链接结果。知识图谱可以增强搜索结果,但并非搜索运行的必要条件。
哪些类型的查询最适合使用知识图谱?
关于知名事物的事实性查询效果最佳,例如“埃菲尔铁塔有多高”、“特斯拉的创始人是谁”或“日本的首都是哪里”。主观性、探索性或非常新的查询则更适合使用传统的谷歌搜索。

裁决

当您需要广泛探索、获取最新信息或从网络各处获取多元视角时,请选择 Google 搜索。当您想要快速查找关于特定实体(例如名人、地点或组织)的权威信息时,请选择知识图谱搜索。实际上,大多数用户都能从两者结合使用中获益,因为 Google 会在每个搜索结果页面上将它们融合在一起。

相关比较

AI 错误检测与人工审核对比

人工智能质量检测利用机器学习模型大规模标记低质量或人工智能生成的内容,而人工审核则依靠训练有素的编辑通过判断和上下文来评估内容质量。每种方法各有优势,许多组织现在都将两者结合起来以获得最佳效果。

AI管道中的迭代检索与一次性检索系统

人工智能流程中的迭代检索通过多次搜索和推理循环来优化结果,而一次性检索系统则只需一次遍历即可获取信息。迭代方法擅长处理复杂的多跳查询,而一次性方法则优先考虑速度和简洁性,适用于简单的查询。

AI伙伴 vs 人类友谊

人工智能伴侣是旨在模拟对话、情感支持和临场感的数字系统,而人类友谊则建立在共同的生活经验、信任和情感互惠之上。本文将对比探讨这两种连接方式如何在日益数字化的世界中塑造沟通、情感支持、孤独感和社会行为。

AI计算排放与传统云排放对比

人工智能计算产生的排放主要来自训练大型模型的高能耗GPU集群,而传统云的排放则来自运行日常工作负载的通用数据中心。人工智能工作负载的单次任务耗电量远高于传统云,但传统云的运行规模要大得多。

AI检测与基于规则的检测

现代数字环境需要强大的防御机制,但其底层方法却截然不同,威胁、欺诈或异常情况的检测方式也大相径庭。基于规则的系统依赖于严格的预配置条件来标记已知威胁,而人工智能模型则通过分析行为来发现不常见的异常情况。在两者之间做出选择意味着需要在绝对确定性和适应性灵活性之间取得平衡。