关灯
开启左侧

[SEO经验] 深入百度分词算法的核心(实战)

[复制链接]
swmozowtfl 发表于 2015-5-7 23:48:47 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
 
大家好,我是朋少,今天依然为大家带来百度分词算法,注意本文绝对不是采集或是抄袭网上的一些教科书里的文章,而是朋少花了近两个星期才得到一些感悟,现在在这里写给我最亲爱的喜欢我的同志们,也请你们记住–风一样的男子,朋少!
" q; `8 a2 O5 x4 v; A
一、百度分词算法(切词)概念
& S- a% c/ {# @) \: P3 n
就是将词组打乱,按照一定的规则重组,然后搞成新的词,对新词进行匹配。
4 P7 E& V; C2 o" s
二、百度分词的算法三种方式
9 ^2 ^; E8 g7 R$ j; C! K
Ⅰ基本字典的匹配分词
" h# D3 O( M  Q- e
根据目标词与已经有的字典里的词组匹配,扫描后匹配成字、词、句的形式

5 B& C6 L' @1 J  o+ r
1、按照方式、可分为正向匹配和反向匹配
  q9 i8 O& V( G. x4 X
2、如果按方向和长度的匹配可以分为:正向最大匹配和逆向最大匹配

/ v6 V" N7 _/ q4 N' q% R$ M9 D# `
3、还有一种就是双向匹配,双向匹配就是从正向和反向两个来匹配。

& a% p: m9 A8 k& O% f0 R1 C
讲完上面两点之后,我们以“济南seo朋少最帅”为例,讲解一下正向匹配和逆向匹配

) i6 j! y+ s6 H2 J! h# C7 N8 u

深入百度分词算法的核心(实战)

深入百度分词算法的核心(实战)
" z+ Q( m( C3 A+ K
3、混合匹配

0 A3 d/ f8 U5 L! P
深圳蚂蚁搬家公司 可以匹配成深圳搬家公司 三个词并不连续,就是混合。

! p: \4 D7 r7 A% w2 G
Ⅱ基于统计的匹配分词

: U& h6 `) g1 N- y& v" K# w
基本统计的匹配其实可以举一个很简单的例子来说明,比如在没有iphone之前,我们搜“苹果多少钱”的时候,基本上来说是我们平时吃的苹果,而有了苹果手机之的呢,大量的人也人搜这个词,但是呢,他们都是找的苹果手机多少钱,这个时候,百度就会统计出苹果手机这个占的比例是比较大的,因而把苹果手机排在前面。以“最新苹果多少钱”为例子:
- w* y9 F" s  l  P. k, _9 j2 [

深入百度分词算法的核心(实战)

深入百度分词算法的核心(实战)

8 c- ^* I& E0 o, S

5 [- _9 f! x- k! v/ S8 d
Ⅲ基于理解的匹配分词

8 |& a: P8 N, \" D! q4 h5 N7 Z" j4 m
这个基本上来说到现在为止,还没有真正的成熟,那么什么是基于理解的分词呢,就是搜索引擎通过大量的积累,然后可以找相近的词来进行匹配,这种情况下,可能匹配一些较少的词。大家看下面这个例子,基于理解的分词:
  X8 P! w5 E: P( i* f) J4 N/ b

深入百度分词算法的核心(实战)

深入百度分词算法的核心(实战)

% T6 f1 ], X+ b( p  w! j
教程到这里了,还会继续出百度分词算法的教程,因为一个人的标题写的怎么样,会决定他的排名以及以后的优化。请大家继续关注!

/ T( Q, B- w8 x; I9 s" y
- X4 f$ N$ m" l/ p: F
原文地址:http://www.niubseo.com/201412506.html
4 v  K+ G0 M+ O2 f
搜外原创作者:kongdesen

4 Z9 u! a, |7 x) s8 U
日期:2014-12-17

% c( \5 C+ G% Y9 G% e
谢谢管理!
8 I& x# z2 C$ Q
: t" @( s$ @: k3 f) Q' _
好的标题加上好的关键词
大家好,我是朋少,今天依然为大家带来百度分词算法,注意本文绝对不是采集或是抄袭网上的一些教科书里的文章,而是朋少花了近两个星期才得到一些感悟,现在在这里写给我最亲爱的喜欢我的同志们,也请你们记住–风一样的男子,朋少!

$ U$ O7 u! R2 B8 P
一、百度分词算法(切词)概念

' I3 M2 s& _7 u- E% R0 P
就是将词组打乱,按照一定的规则重组,然后搞成新的词,对新词进行匹配。

  P: l, N& C& Y6 e( j
二、百度分词的算法三种方式

- _0 L2 E3 T- [4 U2 u4 K! i! h8 m% o$ [
Ⅰ基本字典的匹配分词
7 Z& k1 _/ g8 O+ }+ g* ^  z
根据目标词与已经有的字典里的词组匹配,扫描后匹配成字、词、句的形式

. b# Z9 F0 w, G
1、按照方式、可分为正向匹配和反向匹配
4 T; H3 p/ d* r: K) u
2、如果按方向和长度的匹配可以分为:正向最大匹配和逆向最大匹配

0 q' T/ E( U8 I) L- O& N( s
3、还有一种就是双向匹配,双向匹配就是从正向和反向两个来匹配。
) ~3 \" c/ l; z5 p& y& Q, |' t
讲完上面两点之后,我们以“济南SEO朋少最帅”为例,讲解一下正向匹配和逆向匹配

# o% N! z' {3 E* r5 Y' m5 [
2 R6 F: }+ c& ?9 A- W
                               
登录/注册后可看大图

5 W9 ~+ }" n6 }; R3 Y- K/ z
3、混合匹配
0 B7 a* ^8 q8 L
深圳蚂蚁搬家公司 可以匹配成深圳搬家公司 三个词并不连续,就是混合。

& R7 c: B" z8 o& H" p- ?. |
Ⅱ基于统计的匹配分词
/ n" y$ Q4 c4 H) U0 {* w: n3 B
基本统计的匹配其实可以举一个很简单的例子来说明,比如在没有iphone之前,我们搜“苹果多少钱”的时候,基本上来说是我们平时吃的苹果,而有了苹果手机之的呢,大量的人也人搜这个词,但是呢,他们都是找的苹果手机多少钱,这个时候,百度就会统计出苹果手机这个占的比例是比较大的,因而把苹果手机排在前面。以“最新苹果多少钱”为例子:
' T7 Z- X) r/ T* V! E
6 B! J6 \+ }. C7 e! L
                               
登录/注册后可看大图
- X. X% Y9 n  u6 B# V8 C0 i0 j" C' |1 [

! g: Z, l- o9 U6 t- [
Ⅲ基于理解的匹配分词
5 k9 G% w" y- J# `8 H" _3 V0 ~; I
这个基本上来说到现在为止,还没有真正的成熟,那么什么是基于理解的分词呢,就是搜索引擎通过大量的积累,然后可以找相近的词来进行匹配,这种情况下,可能匹配一些较少的词。大家看下面这个例子,基于理解的分词:
8 x/ V* H2 N" u+ a
1 c+ ^9 }, H3 G: V7 c
                               
登录/注册后可看大图

% d$ H: p# P9 W' A, a8 `. S
教程到这里了,还会继续出百度分词算法的教程,因为一个人的标题写的怎么样,会决定他的排名以及以后的优化。请大家继续关注!
1 D) S2 Y2 t+ H- j4 O6 r) Z

1 ?9 v4 u0 K8 T0 p- C; H
原文地址:http://www.niubseo.com/201412506.html

  v( H( {/ E/ u4 G7 o
搜外原创作者:kongdesen
5 E- g+ W0 T8 B+ Y
日期:2014-12-17

1 ]! P+ ^. d9 I. N
谢谢管理!

) s' ?, z' q; {4 _( z. s8 l- ~" _; @( m8 E' E( D
起标题和选词斟酌的重要性百度真难捉摸  时时刻刻在变动 优化真难呢扫描后匹配成字、词、句的形式
 

精彩评论9

正序浏览
Mqokjdvq 发表于 2016-1-5 21:02:57 | 显示全部楼层
 
刚才我还看见了呢.
 
buingeEvineus 发表于 2016-1-5 21:03:22 | 显示全部楼层
 
既然你诚心诚意地发贴了,那我就大发慈悲地回复你。为了防止此贴被秒沉,为了维护此楼的繁荣!贯彻爱与真实的邪恶,可爱又迷人的顶贴角色! 穿梭在贴吧之间的顶贴队!喵~就是这样
 
wwdu926a 发表于 2016-1-5 21:03:36 | 显示全部楼层
 
呵呵~~~~你怎么老这样说~~~
 
Mqokjdvq 发表于 2016-1-5 21:03:38 | 显示全部楼层
 
baidu是相当能折腾我了
 
tohme 发表于 2016-3-22 21:07:24 | 显示全部楼层
 
楼主,你要继续努力啊!你是bbs的希望啊!你是网络文学的希望啊!你是整个网络界的希望文学界的希望啊!你是整个人类的希望啊!你是整个太阳系的希望啊!你是整个异次元空间的希望啊!
 
wwdu926a 发表于 2016-3-22 21:07:43 | 显示全部楼层
 
你可是难得来坐坐啊~~~
 
Acropozelan 发表于 2016-3-22 21:07:48 | 显示全部楼层
 
这就是我斗胆的一点粗略分析,每天睡觉以前,我都会把您的帖子再三拜读,拜读。
 
alapScady 发表于 2016-3-22 21:07:51 | 显示全部楼层
 
楼上的话等于没说~~~
 
alapScady 发表于 2016-3-22 21:08:26 | 显示全部楼层
 
回来了 呵呵刚才在斗地主那 ~~~~
 
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


0关注

1粉丝

2503帖子

热门图文
热门帖子
排行榜
作者专栏

关注我们:微信订阅号

官方微信

APP下载

全国服务Q Q:

956130084

中国·湖北

Email:956130084@qq.com

Copyright   ©2015-2022  站长技术交流论坛|互联网技术交流平台Powered by©Discuz!技术支持:得知网络  

鄂公网安备 42018502006730号

  ( 鄂ICP备15006301号-5 )