搜索引擎关键词分词概念解析

2018年1月8日08:00:04 发表评论 221 views
广告也精彩

一、分词的概念

中文的分词指的是将一个较长的汉语词语切分成一个一个单独的词语,再按照一定的规格重新组合成词序的过程,也被称为中文的切词。

搜索引擎关键词分词概念解析

但是搜索引擎会这样来分:会分成7个词

搜索引擎关键词分词概念解析

二、分词的方式

分词的方式有3种

2.1基于字典匹配的分词方法

是指目标词或句与已有字典中的词条进行匹配处理,扫描之后匹配成句,词,字形式。

A:按照扫描方向不同,可分为正向匹配和逆向匹配

B:按照片扫描方向和长度优先混合匹配,可分为正向最大匹配和逆向最大匹配

搜索引擎关键词分词概念解析

搜索引擎关键词分词概念解析

C:混合匹配

搜索引擎关键词分词概念解析

2.2基于统计匹配的分词方法

是指分析大量数据样本,扫描计算出字或词出现的统计概率,几个字相邻出现越多,就越能形成一个词,同样的可以形成句。

2.3基于理解匹配的分词方法

搜索引擎逐渐做到去模拟中文语法,富春江理解句子:

例:深圳婚庆租车公司分词组合:

搜索引擎关键词分词概念解析

三、案例说明

在百度搜索搜索:欧莱雅活性炭先面奶 会找到

搜索引擎关键词分词概念解析

由于搜索引擎的博大精深,目前的搜索引擎还是很难做到基于理解的分词技术。

  • 我的微信
  • 这是我的微信扫一扫
  • weinxin
  • 站长技术资源群
  • 群号:431710796
  • weinxin

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: