关灯
开启左侧

[SEO经验] 深入百度分词算法的核心(实战)

[复制链接]
swmozowtfl 发表于 2015-5-7 23:48:47 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
 
大家好,我是朋少,今天依然为大家带来百度分词算法,注意本文绝对不是采集或是抄袭网上的一些教科书里的文章,而是朋少花了近两个星期才得到一些感悟,现在在这里写给我最亲爱的喜欢我的同志们,也请你们记住–风一样的男子,朋少!
7 o1 o6 A0 O/ \; z1 P/ Q$ d
一、百度分词算法(切词)概念

( W$ w- s# H9 [3 O, h
就是将词组打乱,按照一定的规则重组,然后搞成新的词,对新词进行匹配。

. z" V$ V% |7 {1 h
二、百度分词的算法三种方式

5 N* g: n: Y$ z
Ⅰ基本字典的匹配分词
- y$ ^/ N$ j, Y7 `, q
根据目标词与已经有的字典里的词组匹配,扫描后匹配成字、词、句的形式
/ C6 H! X) t4 a' b7 `) u( K, T
1、按照方式、可分为正向匹配和反向匹配
/ k" v' c/ p7 Q* C# \" C* `
2、如果按方向和长度的匹配可以分为:正向最大匹配和逆向最大匹配

1 S  U/ [7 }. v+ I: B+ n; C& p
3、还有一种就是双向匹配,双向匹配就是从正向和反向两个来匹配。
$ E0 E& K8 [6 y* `( P2 M
讲完上面两点之后,我们以“济南seo朋少最帅”为例,讲解一下正向匹配和逆向匹配
- X' H; R- B: o+ U4 l, e

深入百度分词算法的核心(实战)

深入百度分词算法的核心(实战)
4 `# V6 ]; `& K! V% C1 J
3、混合匹配

  P( c% K7 a# \' _) I
深圳蚂蚁搬家公司 可以匹配成深圳搬家公司 三个词并不连续,就是混合。

; {6 H, J7 F  q/ w+ H  K1 E
Ⅱ基于统计的匹配分词
% Y- m( l) q1 _. l0 N4 o
基本统计的匹配其实可以举一个很简单的例子来说明,比如在没有iphone之前,我们搜“苹果多少钱”的时候,基本上来说是我们平时吃的苹果,而有了苹果手机之的呢,大量的人也人搜这个词,但是呢,他们都是找的苹果手机多少钱,这个时候,百度就会统计出苹果手机这个占的比例是比较大的,因而把苹果手机排在前面。以“最新苹果多少钱”为例子:
5 w: z; X' W" f; R

深入百度分词算法的核心(实战)

深入百度分词算法的核心(实战)

0 M- |1 z6 I  C
4 k- z) g) U' [! P' @
Ⅲ基于理解的匹配分词

1 `7 i$ D- n, P1 `
这个基本上来说到现在为止,还没有真正的成熟,那么什么是基于理解的分词呢,就是搜索引擎通过大量的积累,然后可以找相近的词来进行匹配,这种情况下,可能匹配一些较少的词。大家看下面这个例子,基于理解的分词:

% c, M. B* i: Q

深入百度分词算法的核心(实战)

深入百度分词算法的核心(实战)
9 Q. Z% A7 u, ^
教程到这里了,还会继续出百度分词算法的教程,因为一个人的标题写的怎么样,会决定他的排名以及以后的优化。请大家继续关注!
( w$ t5 u4 d% j& s' k1 I& M0 \
1 u: U; x& j, w6 r7 \! V* h1 r) _
原文地址:http://www.niubseo.com/201412506.html
4 F, }3 a" Z5 e' s3 f$ s6 ]7 c
搜外原创作者:kongdesen

$ }2 a7 H$ o+ @: F* L3 a
日期:2014-12-17

8 Y4 x2 [5 }- [  ]
谢谢管理!

- a% _2 Y( v- [1 C1 ]3 @' u% x9 ~0 t5 D
好的标题加上好的关键词
大家好,我是朋少,今天依然为大家带来百度分词算法,注意本文绝对不是采集或是抄袭网上的一些教科书里的文章,而是朋少花了近两个星期才得到一些感悟,现在在这里写给我最亲爱的喜欢我的同志们,也请你们记住–风一样的男子,朋少!

# _. m9 @7 T6 A0 M* s+ f! e3 p
一、百度分词算法(切词)概念
6 v# d2 K9 `6 U
就是将词组打乱,按照一定的规则重组,然后搞成新的词,对新词进行匹配。

, ?5 v; J0 |+ u  K& ?8 H
二、百度分词的算法三种方式
, ]" t% a, C3 `5 d
Ⅰ基本字典的匹配分词
: q+ \+ e; U& z2 C( P0 C! X
根据目标词与已经有的字典里的词组匹配,扫描后匹配成字、词、句的形式

) O8 g5 k, ]8 t! D
1、按照方式、可分为正向匹配和反向匹配

5 h8 D/ I6 e" {! `2 p% i
2、如果按方向和长度的匹配可以分为:正向最大匹配和逆向最大匹配
" L$ ]5 |  T! K$ r
3、还有一种就是双向匹配,双向匹配就是从正向和反向两个来匹配。
) k' x2 c+ D4 F3 |6 Z7 E
讲完上面两点之后,我们以“济南SEO朋少最帅”为例,讲解一下正向匹配和逆向匹配

7 s  {8 ?" G* U4 k

, P1 j( Q) j6 v2 Z% i# y0 s. `                               
登录/注册后可看大图

! _5 @* f0 G8 C& D  i! B8 l2 J# `
3、混合匹配
+ l* T2 @, F& Q- ~, M
深圳蚂蚁搬家公司 可以匹配成深圳搬家公司 三个词并不连续,就是混合。

0 h7 d6 I5 t) `, q) O! W* `
Ⅱ基于统计的匹配分词
/ B, H* f3 S. o, X0 J5 m' V
基本统计的匹配其实可以举一个很简单的例子来说明,比如在没有iphone之前,我们搜“苹果多少钱”的时候,基本上来说是我们平时吃的苹果,而有了苹果手机之的呢,大量的人也人搜这个词,但是呢,他们都是找的苹果手机多少钱,这个时候,百度就会统计出苹果手机这个占的比例是比较大的,因而把苹果手机排在前面。以“最新苹果多少钱”为例子:

) K* `" j- j5 I( y; w& _7 Y- b. p
& Y0 M& C- k) z
                               
登录/注册后可看大图
9 D' o, C* h# T( R
( m  v0 V* w# F/ H4 a
Ⅲ基于理解的匹配分词

6 e' n: @, `& F5 |& t4 d# @1 }
这个基本上来说到现在为止,还没有真正的成熟,那么什么是基于理解的分词呢,就是搜索引擎通过大量的积累,然后可以找相近的词来进行匹配,这种情况下,可能匹配一些较少的词。大家看下面这个例子,基于理解的分词:

  o/ B- F* R6 c, q, ~% L- _

& U- @( `; ?( O8 U4 N* |                               
登录/注册后可看大图

0 n. L0 J) \( v' N! `2 E+ U
教程到这里了,还会继续出百度分词算法的教程,因为一个人的标题写的怎么样,会决定他的排名以及以后的优化。请大家继续关注!

# Z5 j9 _8 ^2 V3 L. p( N1 E" _; y+ o# ^9 {4 H
原文地址:http://www.niubseo.com/201412506.html

0 S' q3 g: L- L4 }7 N9 F  R* Z' V
搜外原创作者:kongdesen

  h; h3 }. L. C
日期:2014-12-17

3 S. c9 X' k5 L* [& G
谢谢管理!
2 S! p- S( ?% e
" v0 w5 y& G" `1 R) Z& L+ v
起标题和选词斟酌的重要性百度真难捉摸  时时刻刻在变动 优化真难呢扫描后匹配成字、词、句的形式
 

精彩评论9

正序浏览
Mqokjdvq 发表于 2016-1-5 21:02:57 | 显示全部楼层
 
刚才我还看见了呢.
 
buingeEvineus 发表于 2016-1-5 21:03:22 | 显示全部楼层
 
既然你诚心诚意地发贴了,那我就大发慈悲地回复你。为了防止此贴被秒沉,为了维护此楼的繁荣!贯彻爱与真实的邪恶,可爱又迷人的顶贴角色! 穿梭在贴吧之间的顶贴队!喵~就是这样
 
wwdu926a 发表于 2016-1-5 21:03:36 | 显示全部楼层
 
呵呵~~~~你怎么老这样说~~~
 
Mqokjdvq 发表于 2016-1-5 21:03:38 | 显示全部楼层
 
baidu是相当能折腾我了
 
tohme 发表于 2016-3-22 21:07:24 | 显示全部楼层
 
楼主,你要继续努力啊!你是bbs的希望啊!你是网络文学的希望啊!你是整个网络界的希望文学界的希望啊!你是整个人类的希望啊!你是整个太阳系的希望啊!你是整个异次元空间的希望啊!
 
wwdu926a 发表于 2016-3-22 21:07:43 | 显示全部楼层
 
你可是难得来坐坐啊~~~
 
Acropozelan 发表于 2016-3-22 21:07:48 | 显示全部楼层
 
这就是我斗胆的一点粗略分析,每天睡觉以前,我都会把您的帖子再三拜读,拜读。
 
alapScady 发表于 2016-3-22 21:07:51 | 显示全部楼层
 
楼上的话等于没说~~~
 
alapScady 发表于 2016-3-22 21:08:26 | 显示全部楼层
 
回来了 呵呵刚才在斗地主那 ~~~~
 
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


0关注

1粉丝

2503帖子

热门图文
热门帖子
排行榜
作者专栏

关注我们:微信订阅号

官方微信

APP下载

全国服务Q Q:

956130084

中国·湖北

Email:956130084@qq.com

Copyright   ©2015-2022  站长技术交流论坛|互联网技术交流平台Powered by©Discuz!技术支持:得知网络  

鄂公网安备 42018502006730号

  ( 鄂ICP备15006301号-5 )