关灯
开启左侧

[SEO经验] 深入百度分词算法的核心(实战)

[复制链接]
swmozowtfl 发表于 2015-5-7 23:48:47 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
 
大家好,我是朋少,今天依然为大家带来百度分词算法,注意本文绝对不是采集或是抄袭网上的一些教科书里的文章,而是朋少花了近两个星期才得到一些感悟,现在在这里写给我最亲爱的喜欢我的同志们,也请你们记住–风一样的男子,朋少!
8 N! M2 [8 i" q, C, L
一、百度分词算法(切词)概念
. |6 V! Q- W. {" ^9 j4 \
就是将词组打乱,按照一定的规则重组,然后搞成新的词,对新词进行匹配。
  e. N) x' R, A
二、百度分词的算法三种方式

1 Z/ W3 Q8 ^. f. Z5 G
Ⅰ基本字典的匹配分词

) w5 S, }  I6 i1 }: p1 P
根据目标词与已经有的字典里的词组匹配,扫描后匹配成字、词、句的形式
. \- a7 H: P+ L& u+ Y" Y' J
1、按照方式、可分为正向匹配和反向匹配

0 V/ P3 S: ]3 t$ z& n
2、如果按方向和长度的匹配可以分为:正向最大匹配和逆向最大匹配
4 y# r7 T5 I; u7 F# X- d" a2 ]' K
3、还有一种就是双向匹配,双向匹配就是从正向和反向两个来匹配。
' @. [2 N6 Y$ t4 }
讲完上面两点之后,我们以“济南seo朋少最帅”为例,讲解一下正向匹配和逆向匹配

& ]) w  @# \" V

深入百度分词算法的核心(实战)

深入百度分词算法的核心(实战)

  |$ m4 B1 `. \
3、混合匹配

, O5 b& g; u; i- c
深圳蚂蚁搬家公司 可以匹配成深圳搬家公司 三个词并不连续,就是混合。
( X; N' G' |, U/ \8 G, G! R
Ⅱ基于统计的匹配分词
& y" Q1 o$ u/ a: c1 f
基本统计的匹配其实可以举一个很简单的例子来说明,比如在没有iphone之前,我们搜“苹果多少钱”的时候,基本上来说是我们平时吃的苹果,而有了苹果手机之的呢,大量的人也人搜这个词,但是呢,他们都是找的苹果手机多少钱,这个时候,百度就会统计出苹果手机这个占的比例是比较大的,因而把苹果手机排在前面。以“最新苹果多少钱”为例子:
  T, |" H; [( T' g

深入百度分词算法的核心(实战)

深入百度分词算法的核心(实战)
- i" j! ~# i; N9 A  l: e$ z
  R6 ?  m) P# B$ s. U: ?( T
Ⅲ基于理解的匹配分词
- G9 @2 d3 `+ x4 J8 S3 E: v8 o
这个基本上来说到现在为止,还没有真正的成熟,那么什么是基于理解的分词呢,就是搜索引擎通过大量的积累,然后可以找相近的词来进行匹配,这种情况下,可能匹配一些较少的词。大家看下面这个例子,基于理解的分词:
) |% X2 d6 M2 A; I) `3 k3 D! t

深入百度分词算法的核心(实战)

深入百度分词算法的核心(实战)
/ J4 R$ Z9 u7 N  L& ]* ]* S. ~2 @
教程到这里了,还会继续出百度分词算法的教程,因为一个人的标题写的怎么样,会决定他的排名以及以后的优化。请大家继续关注!
; {' K" v+ y% J; M

+ d# S4 R) v  {+ }* U# E4 n- h% h; F
原文地址:http://www.niubseo.com/201412506.html
# D+ r0 l2 C3 S6 l8 h
搜外原创作者:kongdesen

7 \( G: \) l- {* V2 v7 t
日期:2014-12-17
* B0 {! y- P; Z! }8 l
谢谢管理!
2 D% \- ]+ ^. O: [5 Z3 q

$ x4 e1 n! [7 p好的标题加上好的关键词
大家好,我是朋少,今天依然为大家带来百度分词算法,注意本文绝对不是采集或是抄袭网上的一些教科书里的文章,而是朋少花了近两个星期才得到一些感悟,现在在这里写给我最亲爱的喜欢我的同志们,也请你们记住–风一样的男子,朋少!

9 _1 J5 C5 Q5 s( B6 K# P6 f
一、百度分词算法(切词)概念

3 i9 G! B/ g0 q$ b8 Q
就是将词组打乱,按照一定的规则重组,然后搞成新的词,对新词进行匹配。
% i* ]- l+ u& m( m. t
二、百度分词的算法三种方式

: r, d5 c6 V. F
Ⅰ基本字典的匹配分词
9 L$ E6 m+ W& Z" ?' I
根据目标词与已经有的字典里的词组匹配,扫描后匹配成字、词、句的形式

  I$ I! p( S2 q# d( z9 K
1、按照方式、可分为正向匹配和反向匹配

9 d! \% G$ p" E* Q7 r7 X# o& _
2、如果按方向和长度的匹配可以分为:正向最大匹配和逆向最大匹配

1 n6 [  k9 h% i: P. }# v
3、还有一种就是双向匹配,双向匹配就是从正向和反向两个来匹配。
5 r5 ]! k/ u5 v/ r2 G9 i* X, |. {
讲完上面两点之后,我们以“济南SEO朋少最帅”为例,讲解一下正向匹配和逆向匹配
5 E3 p+ Y6 R/ H: @  c+ [; ?; }
* S$ t$ P2 n& f. y7 Q; _4 c7 v
                               
登录/注册后可看大图
& m) S/ L% X1 B8 w1 e" Q2 O
3、混合匹配

1 q+ p) F6 h# F+ f% B$ N* ?
深圳蚂蚁搬家公司 可以匹配成深圳搬家公司 三个词并不连续,就是混合。
8 x# S# \+ d4 v8 q! C( ]$ Q4 G/ P
Ⅱ基于统计的匹配分词

$ X( W. f: v9 {% W! T
基本统计的匹配其实可以举一个很简单的例子来说明,比如在没有iphone之前,我们搜“苹果多少钱”的时候,基本上来说是我们平时吃的苹果,而有了苹果手机之的呢,大量的人也人搜这个词,但是呢,他们都是找的苹果手机多少钱,这个时候,百度就会统计出苹果手机这个占的比例是比较大的,因而把苹果手机排在前面。以“最新苹果多少钱”为例子:

% e3 |- o  G; [" I4 G1 u+ o
4 F. ]6 T; a5 y- P  G) H
                               
登录/注册后可看大图
2 h9 m4 h* O( h& l

" [- K; _& H4 R+ N* a
Ⅲ基于理解的匹配分词

1 Q& l# }! W. Q7 Y
这个基本上来说到现在为止,还没有真正的成熟,那么什么是基于理解的分词呢,就是搜索引擎通过大量的积累,然后可以找相近的词来进行匹配,这种情况下,可能匹配一些较少的词。大家看下面这个例子,基于理解的分词:

# m2 N! p* }7 x7 o
  X8 w( n0 W* k2 i: n1 g
                               
登录/注册后可看大图

1 o3 T& O( u( W8 c
教程到这里了,还会继续出百度分词算法的教程,因为一个人的标题写的怎么样,会决定他的排名以及以后的优化。请大家继续关注!

2 u$ ?/ P% y/ ^  @( m! F6 T: O/ k7 o
原文地址:http://www.niubseo.com/201412506.html

+ f+ ~1 |  \* D& w% O% h# [- `2 b! Y
搜外原创作者:kongdesen

5 n" Z0 Y4 J2 D
日期:2014-12-17
8 ]6 X" P. d; ?% p: D+ V
谢谢管理!
6 V# ?! J3 ^9 D( ~

3 i6 C1 `! k% Y) |起标题和选词斟酌的重要性百度真难捉摸  时时刻刻在变动 优化真难呢扫描后匹配成字、词、句的形式
 

精彩评论9

正序浏览
Mqokjdvq 发表于 2016-1-5 21:02:57 | 显示全部楼层
 
刚才我还看见了呢.
 
buingeEvineus 发表于 2016-1-5 21:03:22 | 显示全部楼层
 
既然你诚心诚意地发贴了,那我就大发慈悲地回复你。为了防止此贴被秒沉,为了维护此楼的繁荣!贯彻爱与真实的邪恶,可爱又迷人的顶贴角色! 穿梭在贴吧之间的顶贴队!喵~就是这样
 
wwdu926a 发表于 2016-1-5 21:03:36 | 显示全部楼层
 
呵呵~~~~你怎么老这样说~~~
 
Mqokjdvq 发表于 2016-1-5 21:03:38 | 显示全部楼层
 
baidu是相当能折腾我了
 
tohme 发表于 2016-3-22 21:07:24 | 显示全部楼层
 
楼主,你要继续努力啊!你是bbs的希望啊!你是网络文学的希望啊!你是整个网络界的希望文学界的希望啊!你是整个人类的希望啊!你是整个太阳系的希望啊!你是整个异次元空间的希望啊!
 
wwdu926a 发表于 2016-3-22 21:07:43 | 显示全部楼层
 
你可是难得来坐坐啊~~~
 
Acropozelan 发表于 2016-3-22 21:07:48 | 显示全部楼层
 
这就是我斗胆的一点粗略分析,每天睡觉以前,我都会把您的帖子再三拜读,拜读。
 
alapScady 发表于 2016-3-22 21:07:51 | 显示全部楼层
 
楼上的话等于没说~~~
 
alapScady 发表于 2016-3-22 21:08:26 | 显示全部楼层
 
回来了 呵呵刚才在斗地主那 ~~~~
 
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


0关注

1粉丝

2503帖子

热门图文
热门帖子
排行榜
作者专栏

关注我们:微信订阅号

官方微信

APP下载

全国服务Q Q:

956130084

中国·湖北

Email:956130084@qq.com

Copyright   ©2015-2022  站长技术交流论坛|互联网技术交流平台Powered by©Discuz!技术支持:得知网络  

鄂公网安备 42018502006730号

  ( 鄂ICP备15006301号-5 )