知识图谱与谷歌搜索是一回事。
它们是两个独立但协同工作的系统。谷歌搜索负责索引网页,而知识图谱则是一个包含实体和事实的结构化数据库。大多数搜索结果会结合两者,但它们各自服务于不同的目的。
谷歌搜索是大多数人日常使用的通用网络索引引擎,而知识图谱搜索则是谷歌的结构化实体数据库,为直接答案和信息面板提供支持。了解它们的区别有助于解释为什么有些查询会返回丰富的资料,而另一些查询则会返回传统的蓝色链接。
全球领先的网络搜索引擎,索引数十亿个网页,并使用 PageRank、RankBrain 和 BERT 等算法对搜索结果进行排名。
谷歌于 2012 年推出的语义知识库,它组织有关现实世界实体及其关系的信息,以提供直接答案。
| 功能 | 谷歌搜索 | 知识图谱搜索 |
|---|---|---|
| 主要功能 | 返回与查询匹配的网页排名列表 | 返回有关实体及其关系的结构化事实 |
| 发布年份 | 1997 年(当时名为 BackRub,1998 年更名为 Google) | 2012 |
| 数据来源 | 从互联网上抓取并索引网页 | 精选数据库、维基百科、授权资源和可信赖的合作伙伴 |
| 输出格式 | 十个蓝色链接、摘要、图片、视频和精选摘要 | 知识面板、实体卡片和直接回答框 |
| 底层技术 | PageRank、RankBrain、BERT 和神经匹配 | 基于语义三元组(主语-谓语-宾语)的图数据库 |
| 最合适的查询类型 | 宽泛的、探索性的或导航性的查询 | 关于特定人物、地点、组织或事物的客观性查询 |
| 数据规模 | 已索引数千亿个网页 | 超过5000亿条事实,涵盖约700亿个实体 |
| 用户交互 | 点击进入外部网站查看完整信息 | 无需点击,即可直接在结果页面查看答案。 |
谷歌搜索就像一个庞大的图书馆目录,它会抓取开放网络并根据相关性和权威性信号对页面进行排名。当你输入查询时,它会将你的关键词与索引进行匹配,并返回看起来最有用的页面。知识图谱搜索的工作方式则不同。它不是将关键词与文档进行匹配,而是理解你的查询指的是某个特定实体,例如人、城市或化学元素,并从结构化数据库中提取关于该实体的已验证信息。
传统的谷歌搜索几乎会从所有公开可访问的网页中提取内容,这意味着它涵盖的内容范围极其广泛,但也包含一些质量较低或不可靠的来源。知识图谱则采取了相反的方法,它从一组经过筛选的可信来源中提取信息,例如维基百科、政府数据库和授权的商业数据集。这使得知识图谱的搜索结果在事实查询方面更加可靠,但也限制了其涵盖的主题范围。
标准的谷歌搜索结果页面会显示十个蓝色链接,以及精选摘要、图片和广告。知识图谱结果则以信息面板的形式出现在页面右侧(或移动设备上的顶部),其中包含摘要、关键事实、图片和相关实体。实际上,这两个系统在大多数查询中协同工作,知识面板是对传统搜索结果的补充,而不是取代它们。
谷歌搜索擅长处理模糊、探索性或长尾查询,帮助用户在网络上发现各种内容。知识图谱搜索则在用户想要快速获得关于某个知名实体的确切答案时表现出色,例如东京的人口或某个名人的出生日期。对于小众话题、冷门事实或近期发生的事件,传统搜索通常优于知识图谱,因为结构化数据库中并不包含这些信息。
这两个系统都随着人工智能的发展而显著演进。谷歌搜索整合了 BERT 和最新的 MUM 模型,以更好地理解自然语言和复杂查询。知识图谱本身也为谷歌最新的人工智能功能提供支持,例如 AI 概览和 Gemini 驱动的答案,这些功能将图数据与生成式语言模型相结合。从这个意义上讲,知识图谱正在成为谷歌更广泛的人工智能搜索计划的基础层,而不是一个独立的产品。
知识图谱与谷歌搜索是一回事。
它们是两个独立但协同工作的系统。谷歌搜索负责索引网页,而知识图谱则是一个包含实体和事实的结构化数据库。大多数搜索结果会结合两者,但它们各自服务于不同的目的。
知识图谱的结果始终来自维基百科。
维基百科是一个主要信息来源,但知识图谱也参考了美国中央情报局世界概况、Freebase、授权商业数据库以及许多其他可信赖的合作伙伴。谷歌并不依赖任何单一信息来源。
如果一个事实存在于知识图谱中,那么它必须100%准确。
知识图谱可能包含错误,因为它汇总了来自多个来源的数据,而这些来源的数据有时存在差异或已过时。谷歌允许用户提出更正建议,但无法保证准确性。
谷歌搜索仅使用关键词匹配。
现代谷歌搜索使用包括 RankBrain、BERT 和神经匹配在内的复杂机器学习模型来理解查询背后的意图和上下文,而不仅仅是输入的字面关键词。
知识图谱可以回答任何问题。
知识图谱是为针对定义明确的实体的客观查询而设计的。它无法回答主观问题、执行计算,也无法检索尚未添加到数据库中的最新信息。
当您需要广泛探索、获取最新信息或从网络各处获取多元视角时,请选择 Google 搜索。当您想要快速查找关于特定实体(例如名人、地点或组织)的权威信息时,请选择知识图谱搜索。实际上,大多数用户都能从两者结合使用中获益,因为 Google 会在每个搜索结果页面上将它们融合在一起。
人工智能质量检测利用机器学习模型大规模标记低质量或人工智能生成的内容,而人工审核则依靠训练有素的编辑通过判断和上下文来评估内容质量。每种方法各有优势,许多组织现在都将两者结合起来以获得最佳效果。
人工智能流程中的迭代检索通过多次搜索和推理循环来优化结果,而一次性检索系统则只需一次遍历即可获取信息。迭代方法擅长处理复杂的多跳查询,而一次性方法则优先考虑速度和简洁性,适用于简单的查询。
人工智能伴侣是旨在模拟对话、情感支持和临场感的数字系统,而人类友谊则建立在共同的生活经验、信任和情感互惠之上。本文将对比探讨这两种连接方式如何在日益数字化的世界中塑造沟通、情感支持、孤独感和社会行为。
人工智能计算产生的排放主要来自训练大型模型的高能耗GPU集群,而传统云的排放则来自运行日常工作负载的通用数据中心。人工智能工作负载的单次任务耗电量远高于传统云,但传统云的运行规模要大得多。
现代数字环境需要强大的防御机制,但其底层方法却截然不同,威胁、欺诈或异常情况的检测方式也大相径庭。基于规则的系统依赖于严格的预配置条件来标记已知威胁,而人工智能模型则通过分析行为来发现不常见的异常情况。在两者之间做出选择意味着需要在绝对确定性和适应性灵活性之间取得平衡。