什么是语义搜索?
在进入语义搜索的一般定义之前,请参见语义本身的概念:
语义学是一个语言学和逻辑学系,不仅处理口头信息的逻辑含义,而且在文化,社信息和关系。
可以猜测,在搜索引擎的上下文中,看到这种类型的连接非常宝贵。将这两个区域链接在一起 语义搜索,即使用意图和上下文含义的数据搜索技术 在引入的查询后面以提供准确的结果。
这个高级查询解释过程超出了简单的关键字匹配分析的范围。通过使用自 塞内加尔电话数据 然语言处理(NLP)和机器学习(ML),语义搜索可以更深入地了解关键字布局背后的用户确切问题和意图。
什么是短语搜索?
使用短语/关键字进行搜索是关于返回坚持连接的结果:
- 字词。
- 同义词。
- 一个类似单词的单词。
第一个互联网搜索引擎仅使用此技术。 随着时间的流逝,引入了其他改进:
- 扩展查询 –自动丰富同义词查询或相关术语,以增加找到准确结果的机会。当用户使用与所寻求目标内容中含义相似的单词时,该方法特别有用;
- 放松查询 –通过从查询中跳过一些单词来软化搜索条件。当确切的短语匹配不能带来预期的结果时,这很有用;
- 错误的记录公差 –对输入查询的准确识别,
- 即使它包含拼写错误,错别字,重复等。;
- 象征化 –将文本分成较小的单位(例如单词或短语)的过程,以促进查询与内容的分析和匹配;
- 正常化 –单词形式的基本形式标准化,例如将动词转换为不定式形式或将大写字母转换为小写。
语义搜索如何工作?
搜索短语意味着找到准确或相似的匹配项,并得到
前面讨论的技术的支持。为了改变 向量是语义搜索的基础, 允许您以数字形式包含单词,句子和整个文档,这极大地促进了Google搜索引擎对它们的分析和比较。
整个过程可以包括在以下步骤中:
- 语义表示 –查询中的每个单词或短语在多维空间中转换为向量。此空间中的点表示单词的语义含义。具有相似含义的单词(即现在的向量)具有相似的长度,并且彼此之间保持较小的角度(换句话说,它们彼此靠近放置)。因此,关键字的含义以数学方式表示。
- 进一步转换为矢量 –经过初步分析后,使用广泛的自然语言处理技术将文本 玻利维亚电话号码清单 转换为矢量的高级过程发生了。这些例如。Word2Vec,GloVe和基于变压器的模型(例如由Google BERT或最近流行的OpenAI GPT开发)。
- 向量操作 –当查询已经转换为向量时,算法将执行各种数学运算,例如计算余弦相似性,以识别哪些单词,短语和文档在语义上与用户的查询最相关。
- 与数据库的比较 –以Google索引为例。从技术角度来看,这是一组大量的矢量符号文档和页面。因此,语义搜索引擎可以使用所谓的k-closest邻居算法(kNN – k-near邻居)来查找与查询的数字表示最匹配的那些数字集。通过此分析,可以更轻松地找到最相关的内容。
- 选择最佳答案 –通过计算相似性,算法能够精确地确定哪些页面或文档最符合用户的要求。即使答案源不包含查询中使用的确切短语,这也可能是由于语义关键字而引起的。
语义搜索示例
Google搜索如何将语义搜索问题付诸实践? 它在哪些方面有所改善? 考虑一些例子。
-
用户意图
根据下面的示例,Google开发人员希望说明通过语义搜索,搜索引擎如何识别语言细微差别和一些语法上不正确的心理快捷方式。
您可以为某人药房买药吗”
多年来,Google在识别此类查询时遇到了问题。它主要集中在„获得”药物部分,并返回有关如何在药房完成处方的说明结果。相反,语义搜索引擎了解到,这是为某人处理处方的一种选择。最后添加的单词„药房”不会误导算法, 或者提供有关用户意图的其他上下文。
-
一般概念
有时,输入的关键字不是指明确的内容,而是指一般类别/概念。借助语义搜索,Google能够识别用户何时表示这种含义。