首頁 » 用于解释查询的方法、系统和媒体

用于解释查询的方法、系统和媒体

该项专利最初由谷歌于2011年8月签署,并于2017年10月以新名称重新签署。这非常令人兴奋,因为发明者之一是深度学习专家Thomas Strohmann,他在 Rankbrain 的开发中发挥了主导作用。

该专利没有提及实体,但它描述了另一种方法,即谷歌根据来自初始文档子集的信息重写或细化初始搜索查询,以便最终返回更相关释查询的搜索结果。该专利主要涉及搜索查询中的首字母缩略词的解释。然而,所描述的过程是处理细化或解释搜索查询的许多其他方法的蓝图。

专利中描述的首字母缩略词和同义词引擎可以被知识图谱取代。

谷歌于2015 年签署的这项专利描述了搜索引擎解释搜索查询的各种方法。它令人兴奋,因为它将Rankbrain 的方法与自然语言处理(BERT 和MUM )相结合。

该专利描述了根本问题以 电报数据 及应对挑战的方法。

例如,当搜索查询“汤姆·克鲁斯的释查询动作片”时,这些搜索引擎可以提供不相关的搜索结果,如“最后的动作英雄”和“猫和老鼠”,仅仅是因为搜索查询的一部分包含在内容的标题中。因此,了解搜索查询可以产生更有意义的搜索结果。

这里描述的方法将搜索查询分解为 二.社交媒体上的网络 单独的子术语。检查这些术语以查看它们是否与已知实体相关。实体分数用于确定术语与相应实体的接近程度。搜索查询的上下文也起着一定的作用,即搜索词中没有直接实体引用的术语。然后根据最相关的实体根据实体类型进行搜索并提供相应的搜索结果。

 

这是一个例子。诸如“汤姆·克鲁斯主 粉絲數據 演的动作片”这样的搜索查询将分解为各个部分“动作”、“电影”、“汤姆”和“克鲁斯”。术语“动作”可以是实体类型“电影”、“类型”或“系列”的实体。可以确定这些实体类型中哪一个最受欢迎,例如,根据出现的频率或受欢迎程度使用实体分数。

 

根据搜索引擎的释查询类型(图像搜索、视频搜索等),将会提供与搜索的实体类型“动作片”和实体“汤姆·克鲁斯”匹配的相应媒体格式。该专利涉及各种形式的搜索,例如图像搜索中的搜索查询或通过数字助理的语音搜索。

使用文档间结构相似性生成查询

该专利于2016年9月签署。这项专利令人兴奋的是,两位重要的深度学习工程师 Paul Haahr 和 Yonhui Wu 是发明人之一。此外,吴永辉是Rankbrain开发的领军人物之一。

该专利描述了一种方法,搜索引擎可以为实体生成补充搜索查询并将其存储在查询存储中。然后可以使用这些搜索查询来改进或解释原始搜索词。

可以根据类似释查询文档的内容结构来抽象搜索查询细化。例如,一篇关于作家约瑟夫·海勒的文档包含这样的句子:“约瑟夫·海勒写了一本具有影响力的小说释查询《第二十二条军规》,讲述了二战期间美国士兵的故事。”可以提取搜索查询“joseph heller catch”。

 

识别搜索查询中的实体(命名实体识别)

Google 想要找出问题涉及哪个实体。这个过程也被称为“命名实体识别”。如果实体本身没有出现在搜索词中,这并不容易。通过使用搜索词中出现的实体以及实体之间的关系上下文,Google 可以识别正在搜索的实体。

Scroll to Top