关灯
开启左侧

[SEO经验] 深入百度分词算法的核心(实战)

[复制链接]
swmozowtfl 发表于 2015-5-7 23:48:47 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
 
大家好,我是朋少,今天依然为大家带来百度分词算法,注意本文绝对不是采集或是抄袭网上的一些教科书里的文章,而是朋少花了近两个星期才得到一些感悟,现在在这里写给我最亲爱的喜欢我的同志们,也请你们记住–风一样的男子,朋少!

$ i6 g) K2 [+ r- m6 W
一、百度分词算法(切词)概念

% @7 S+ a* M; \4 Q6 {8 J
就是将词组打乱,按照一定的规则重组,然后搞成新的词,对新词进行匹配。
' Z/ |" i$ [7 F( A! f/ b7 r. Q% `
二、百度分词的算法三种方式
. @7 R( ]3 {  c- p7 m, y
Ⅰ基本字典的匹配分词

- M7 V1 i- F* h% t
根据目标词与已经有的字典里的词组匹配,扫描后匹配成字、词、句的形式
1 ]& @9 y9 L( E- M' j2 D* ]
1、按照方式、可分为正向匹配和反向匹配

& Y) `- W$ L& F1 t9 A/ ~1 H
2、如果按方向和长度的匹配可以分为:正向最大匹配和逆向最大匹配

. ]) d/ u' e2 N
3、还有一种就是双向匹配,双向匹配就是从正向和反向两个来匹配。
8 R8 D& w+ a0 _5 P* t
讲完上面两点之后,我们以“济南seo朋少最帅”为例,讲解一下正向匹配和逆向匹配
4 F) i+ ?7 d" [

深入百度分词算法的核心(实战)

深入百度分词算法的核心(实战)

; V" @6 }0 Y% e" n" S
3、混合匹配

; t4 J7 p+ _$ m3 o
深圳蚂蚁搬家公司 可以匹配成深圳搬家公司 三个词并不连续,就是混合。
4 V1 p$ o" g$ `! W, ?4 H
Ⅱ基于统计的匹配分词
' G$ T4 l, a/ D! j
基本统计的匹配其实可以举一个很简单的例子来说明,比如在没有iphone之前,我们搜“苹果多少钱”的时候,基本上来说是我们平时吃的苹果,而有了苹果手机之的呢,大量的人也人搜这个词,但是呢,他们都是找的苹果手机多少钱,这个时候,百度就会统计出苹果手机这个占的比例是比较大的,因而把苹果手机排在前面。以“最新苹果多少钱”为例子:

/ j. F( i2 Y& H# S

深入百度分词算法的核心(实战)

深入百度分词算法的核心(实战)

: W; D" N* z* K* X; j! S+ h6 f

/ H* ?/ o& i* H: L$ @; r
Ⅲ基于理解的匹配分词
" B$ @* Q/ G' C+ p
这个基本上来说到现在为止,还没有真正的成熟,那么什么是基于理解的分词呢,就是搜索引擎通过大量的积累,然后可以找相近的词来进行匹配,这种情况下,可能匹配一些较少的词。大家看下面这个例子,基于理解的分词:
& ~  h7 }  C' S3 l7 {; J0 D

深入百度分词算法的核心(实战)

深入百度分词算法的核心(实战)

! [5 R, {0 T! K& d, P
教程到这里了,还会继续出百度分词算法的教程,因为一个人的标题写的怎么样,会决定他的排名以及以后的优化。请大家继续关注!
( p0 ?* ?& q" W! c1 W- _4 Q$ E" ]3 o

0 M' g2 ~4 \0 @  S* j
原文地址:http://www.niubseo.com/201412506.html
1 l6 Y: V% m8 u% \. I8 g" @
搜外原创作者:kongdesen
% J' x7 W. u! u; k
日期:2014-12-17

% C+ {/ |8 e* `' j% Q9 n9 `, |
谢谢管理!
4 E% L3 X  A; ^/ ^
; d- D9 {3 M1 \7 f- i
好的标题加上好的关键词
大家好,我是朋少,今天依然为大家带来百度分词算法,注意本文绝对不是采集或是抄袭网上的一些教科书里的文章,而是朋少花了近两个星期才得到一些感悟,现在在这里写给我最亲爱的喜欢我的同志们,也请你们记住–风一样的男子,朋少!

9 X9 v. R! \" @4 A( M
一、百度分词算法(切词)概念
" k' k0 \0 n; E5 v/ i( @
就是将词组打乱,按照一定的规则重组,然后搞成新的词,对新词进行匹配。

# N2 ]# D$ G4 n+ R2 I8 ?
二、百度分词的算法三种方式

* ]$ W  ~- l0 D
Ⅰ基本字典的匹配分词
" t7 p, V/ S& T8 @0 K
根据目标词与已经有的字典里的词组匹配,扫描后匹配成字、词、句的形式
' u" m' w# L4 x! W7 y
1、按照方式、可分为正向匹配和反向匹配

+ h0 v1 U, U0 F$ I
2、如果按方向和长度的匹配可以分为:正向最大匹配和逆向最大匹配

. _2 h7 u' V2 [, v0 g8 p
3、还有一种就是双向匹配,双向匹配就是从正向和反向两个来匹配。

3 V& ?* Q. z7 y
讲完上面两点之后,我们以“济南SEO朋少最帅”为例,讲解一下正向匹配和逆向匹配
1 N) H) `0 p0 v( \6 M) m- B
/ o( X- x6 k- Y0 {3 `: U. I
                               
登录/注册后可看大图

7 ~( a* `+ t4 v7 W! |3 s/ \
3、混合匹配

+ U+ x8 |1 D, J3 z6 _1 V$ l
深圳蚂蚁搬家公司 可以匹配成深圳搬家公司 三个词并不连续,就是混合。
' H1 @( T% d: W9 f* a: V# u
Ⅱ基于统计的匹配分词
1 O$ c4 h  I1 y% Q' U
基本统计的匹配其实可以举一个很简单的例子来说明,比如在没有iphone之前,我们搜“苹果多少钱”的时候,基本上来说是我们平时吃的苹果,而有了苹果手机之的呢,大量的人也人搜这个词,但是呢,他们都是找的苹果手机多少钱,这个时候,百度就会统计出苹果手机这个占的比例是比较大的,因而把苹果手机排在前面。以“最新苹果多少钱”为例子:

, Q% H$ U( r- g2 [4 g5 J( w, f1 a
: t9 \/ F* r. N: {  H. m3 P
                               
登录/注册后可看大图

: M5 i. b0 Q6 {
1 q$ j7 b' [$ x2 a! V0 C" B- r+ d
Ⅲ基于理解的匹配分词

0 ~5 |8 r# p. {* s5 e
这个基本上来说到现在为止,还没有真正的成熟,那么什么是基于理解的分词呢,就是搜索引擎通过大量的积累,然后可以找相近的词来进行匹配,这种情况下,可能匹配一些较少的词。大家看下面这个例子,基于理解的分词:
* ~  v3 @" t4 m5 a
- y+ v- @0 K  R0 Q- R5 G
                               
登录/注册后可看大图
7 i9 c& a. L7 E/ G! V: P
教程到这里了,还会继续出百度分词算法的教程,因为一个人的标题写的怎么样,会决定他的排名以及以后的优化。请大家继续关注!

2 D0 d6 Q5 L+ S2 K# D4 e' X) G7 N9 {
原文地址:http://www.niubseo.com/201412506.html

1 H) s4 I" Q! B/ O9 Q6 \) I
搜外原创作者:kongdesen
7 X, w1 ]9 t7 o/ N% F6 a, Q
日期:2014-12-17

6 Y! p% W9 z* ?( V: u
谢谢管理!
" G" ?2 n0 K6 x7 p; v. o+ U
* n+ M  K& l: j) a& e5 G
起标题和选词斟酌的重要性百度真难捉摸  时时刻刻在变动 优化真难呢扫描后匹配成字、词、句的形式
 

精彩评论9

正序浏览
Mqokjdvq 发表于 2016-1-5 21:02:57 | 显示全部楼层
 
刚才我还看见了呢.
 
buingeEvineus 发表于 2016-1-5 21:03:22 | 显示全部楼层
 
既然你诚心诚意地发贴了,那我就大发慈悲地回复你。为了防止此贴被秒沉,为了维护此楼的繁荣!贯彻爱与真实的邪恶,可爱又迷人的顶贴角色! 穿梭在贴吧之间的顶贴队!喵~就是这样
 
wwdu926a 发表于 2016-1-5 21:03:36 | 显示全部楼层
 
呵呵~~~~你怎么老这样说~~~
 
Mqokjdvq 发表于 2016-1-5 21:03:38 | 显示全部楼层
 
baidu是相当能折腾我了
 
tohme 发表于 2016-3-22 21:07:24 | 显示全部楼层
 
楼主,你要继续努力啊!你是bbs的希望啊!你是网络文学的希望啊!你是整个网络界的希望文学界的希望啊!你是整个人类的希望啊!你是整个太阳系的希望啊!你是整个异次元空间的希望啊!
 
wwdu926a 发表于 2016-3-22 21:07:43 | 显示全部楼层
 
你可是难得来坐坐啊~~~
 
Acropozelan 发表于 2016-3-22 21:07:48 | 显示全部楼层
 
这就是我斗胆的一点粗略分析,每天睡觉以前,我都会把您的帖子再三拜读,拜读。
 
alapScady 发表于 2016-3-22 21:07:51 | 显示全部楼层
 
楼上的话等于没说~~~
 
alapScady 发表于 2016-3-22 21:08:26 | 显示全部楼层
 
回来了 呵呵刚才在斗地主那 ~~~~
 
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


0关注

1粉丝

2503帖子

热门图文
热门帖子
排行榜
作者专栏

关注我们:微信订阅号

官方微信

APP下载

全国服务Q Q:

956130084

中国·湖北

Email:956130084@qq.com

Copyright   ©2015-2022  站长技术交流论坛|互联网技术交流平台Powered by©Discuz!技术支持:得知网络  

鄂公网安备 42018502006730号

  ( 鄂ICP备15006301号-5 )