关灯
开启左侧

[SEO经验] 深入百度分词算法的核心(实战)

[复制链接]
swmozowtfl 发表于 2015-5-7 23:48:47 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
 
大家好,我是朋少,今天依然为大家带来百度分词算法,注意本文绝对不是采集或是抄袭网上的一些教科书里的文章,而是朋少花了近两个星期才得到一些感悟,现在在这里写给我最亲爱的喜欢我的同志们,也请你们记住–风一样的男子,朋少!

* Z3 M) Q9 U( S& A2 O8 i
一、百度分词算法(切词)概念
. t+ e& v+ D6 ~. v7 c5 f, I2 \
就是将词组打乱,按照一定的规则重组,然后搞成新的词,对新词进行匹配。

5 G  X9 B* B) {- B9 N8 P) E
二、百度分词的算法三种方式
0 d# V- M5 y; w9 p+ t; t) s
Ⅰ基本字典的匹配分词
2 z, o( B: U) F  b- {4 o
根据目标词与已经有的字典里的词组匹配,扫描后匹配成字、词、句的形式

8 Q. l5 A( {8 H
1、按照方式、可分为正向匹配和反向匹配
& z0 A- I! D: C) J' p0 _
2、如果按方向和长度的匹配可以分为:正向最大匹配和逆向最大匹配

; ~. S* d4 P; b( J
3、还有一种就是双向匹配,双向匹配就是从正向和反向两个来匹配。
+ k2 [' V2 p  ?
讲完上面两点之后,我们以“济南seo朋少最帅”为例,讲解一下正向匹配和逆向匹配

% _8 _$ A0 k/ v

深入百度分词算法的核心(实战)

深入百度分词算法的核心(实战)

3 q5 R1 x3 j8 O4 T
3、混合匹配

. v- s4 y, B( @3 n
深圳蚂蚁搬家公司 可以匹配成深圳搬家公司 三个词并不连续,就是混合。
/ N, I  g* y# O6 \  p
Ⅱ基于统计的匹配分词
# }2 S4 d/ ?) d  P6 |) {9 |
基本统计的匹配其实可以举一个很简单的例子来说明,比如在没有iphone之前,我们搜“苹果多少钱”的时候,基本上来说是我们平时吃的苹果,而有了苹果手机之的呢,大量的人也人搜这个词,但是呢,他们都是找的苹果手机多少钱,这个时候,百度就会统计出苹果手机这个占的比例是比较大的,因而把苹果手机排在前面。以“最新苹果多少钱”为例子:

% s3 V( m7 s. F5 R1 P$ I

深入百度分词算法的核心(实战)

深入百度分词算法的核心(实战)

$ u/ G2 s! N" ?" a: u

! A3 M" q" M% `" P' d
Ⅲ基于理解的匹配分词
1 A, L6 S8 R/ X5 F
这个基本上来说到现在为止,还没有真正的成熟,那么什么是基于理解的分词呢,就是搜索引擎通过大量的积累,然后可以找相近的词来进行匹配,这种情况下,可能匹配一些较少的词。大家看下面这个例子,基于理解的分词:
/ i$ D1 S# q1 x

深入百度分词算法的核心(实战)

深入百度分词算法的核心(实战)
) D9 X/ h- H) h% n. p
教程到这里了,还会继续出百度分词算法的教程,因为一个人的标题写的怎么样,会决定他的排名以及以后的优化。请大家继续关注!
8 z9 |" Z6 Z. @( ]
1 `. e/ _  F4 h+ I1 N3 \! \
原文地址:http://www.niubseo.com/201412506.html
( _- h2 P  w' K3 q( y1 |& R% N
搜外原创作者:kongdesen

: T* c( p- ?- r0 v7 F
日期:2014-12-17
+ \4 Y* T# e1 H( A
谢谢管理!
: t3 B& Y9 S3 \# M" Y' P
* [- p2 v' q( Z$ m7 _
好的标题加上好的关键词
大家好,我是朋少,今天依然为大家带来百度分词算法,注意本文绝对不是采集或是抄袭网上的一些教科书里的文章,而是朋少花了近两个星期才得到一些感悟,现在在这里写给我最亲爱的喜欢我的同志们,也请你们记住–风一样的男子,朋少!
0 U. d4 \: }$ o$ G
一、百度分词算法(切词)概念
- Z# Y: N/ }9 R9 f
就是将词组打乱,按照一定的规则重组,然后搞成新的词,对新词进行匹配。
( w! A+ ]0 `1 F: a6 r; f
二、百度分词的算法三种方式

4 p- s/ |! m& e3 M/ J
Ⅰ基本字典的匹配分词

9 c  ]3 a1 D; Q; o) t9 W
根据目标词与已经有的字典里的词组匹配,扫描后匹配成字、词、句的形式

5 Z3 T* u/ |0 a: Q. i
1、按照方式、可分为正向匹配和反向匹配
4 @/ F9 S/ L! k3 O. r! Z
2、如果按方向和长度的匹配可以分为:正向最大匹配和逆向最大匹配
8 {0 U% t  h$ b7 g- [- {3 n
3、还有一种就是双向匹配,双向匹配就是从正向和反向两个来匹配。
' a7 G) ^. c9 T! w- u" O/ L
讲完上面两点之后,我们以“济南SEO朋少最帅”为例,讲解一下正向匹配和逆向匹配

7 K* G) ]* X1 w$ w/ p9 O
6 P; D9 |7 x' @
                               
登录/注册后可看大图
, ^5 c! w+ l( m3 g1 X; K7 }
3、混合匹配
7 i" D: P% @% u% ?6 D, Z
深圳蚂蚁搬家公司 可以匹配成深圳搬家公司 三个词并不连续,就是混合。
3 {  @7 Z; `2 a* W8 X, C) `
Ⅱ基于统计的匹配分词

* R+ L$ q  `" @0 H& V3 h
基本统计的匹配其实可以举一个很简单的例子来说明,比如在没有iphone之前,我们搜“苹果多少钱”的时候,基本上来说是我们平时吃的苹果,而有了苹果手机之的呢,大量的人也人搜这个词,但是呢,他们都是找的苹果手机多少钱,这个时候,百度就会统计出苹果手机这个占的比例是比较大的,因而把苹果手机排在前面。以“最新苹果多少钱”为例子:
+ F( U8 ?( K6 R4 u& ^8 C
" o; ?1 ~! Y# T2 H: q* _
                               
登录/注册后可看大图
( g" q* q& Y. E4 ]

% z- `* K# R0 N, H. A3 A1 p9 W
Ⅲ基于理解的匹配分词

) j  C' ]7 h9 X$ l. V. c
这个基本上来说到现在为止,还没有真正的成熟,那么什么是基于理解的分词呢,就是搜索引擎通过大量的积累,然后可以找相近的词来进行匹配,这种情况下,可能匹配一些较少的词。大家看下面这个例子,基于理解的分词:
* K1 u* C% |! L! i: t

: d& J) l9 d+ m- y; l* d) Q  F9 Z; l                               
登录/注册后可看大图

2 i% |2 c7 E( _! k+ `
教程到这里了,还会继续出百度分词算法的教程,因为一个人的标题写的怎么样,会决定他的排名以及以后的优化。请大家继续关注!
+ C3 i( P* v+ B

8 L" |) _9 n# A' R) ?, h: d) p
原文地址:http://www.niubseo.com/201412506.html
# S" y1 w" r0 ~! W
搜外原创作者:kongdesen

% E, k8 l" R8 I5 i
日期:2014-12-17
( w& C5 V6 y  B
谢谢管理!
, S. B# P8 U$ q9 @' h
" \) n0 ~7 f# I; l! @5 c$ J* U
起标题和选词斟酌的重要性百度真难捉摸  时时刻刻在变动 优化真难呢扫描后匹配成字、词、句的形式
 

精彩评论9

正序浏览
Mqokjdvq 发表于 2016-1-5 21:02:57 | 显示全部楼层
 
刚才我还看见了呢.
 
buingeEvineus 发表于 2016-1-5 21:03:22 | 显示全部楼层
 
既然你诚心诚意地发贴了,那我就大发慈悲地回复你。为了防止此贴被秒沉,为了维护此楼的繁荣!贯彻爱与真实的邪恶,可爱又迷人的顶贴角色! 穿梭在贴吧之间的顶贴队!喵~就是这样
 
wwdu926a 发表于 2016-1-5 21:03:36 | 显示全部楼层
 
呵呵~~~~你怎么老这样说~~~
 
Mqokjdvq 发表于 2016-1-5 21:03:38 | 显示全部楼层
 
baidu是相当能折腾我了
 
tohme 发表于 2016-3-22 21:07:24 | 显示全部楼层
 
楼主,你要继续努力啊!你是bbs的希望啊!你是网络文学的希望啊!你是整个网络界的希望文学界的希望啊!你是整个人类的希望啊!你是整个太阳系的希望啊!你是整个异次元空间的希望啊!
 
wwdu926a 发表于 2016-3-22 21:07:43 | 显示全部楼层
 
你可是难得来坐坐啊~~~
 
Acropozelan 发表于 2016-3-22 21:07:48 | 显示全部楼层
 
这就是我斗胆的一点粗略分析,每天睡觉以前,我都会把您的帖子再三拜读,拜读。
 
alapScady 发表于 2016-3-22 21:07:51 | 显示全部楼层
 
楼上的话等于没说~~~
 
alapScady 发表于 2016-3-22 21:08:26 | 显示全部楼层
 
回来了 呵呵刚才在斗地主那 ~~~~
 
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


0关注

1粉丝

2503帖子

热门图文
热门帖子
排行榜
作者专栏

关注我们:微信订阅号

官方微信

APP下载

全国服务Q Q:

956130084

中国·湖北

Email:956130084@qq.com

Copyright   ©2015-2022  站长技术交流论坛|互联网技术交流平台Powered by©Discuz!技术支持:得知网络  

鄂公网安备 42018502006730号

  ( 鄂ICP备15006301号-5 )