关灯
开启左侧

[SEO杂谈] 浅谈百度搜索引擎分词技术

[复制链接]
swmozowtfl 发表于 2015-5-6 20:43:25 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
 
搜索引擎面对的用户大部分是通过关键词返回一个列表页面,这个结构页面是大量的搜索索引库而建立起来的。当然这里这个页面是指自然搜索结果。那么搜索引擎是如何完成排名这以环节的呢?
5 T/ r$ Y. P# K6 w% \$ M* D
, a& C* h4 M0 `4 d. E4 l- c! h1 \

3 k7 o, \: q: \2 z+ U" q0 j0 R+ f$ _/ g   1 v7 J2 t, S( P$ [$ W& j7 k. Y
一、对提交的搜索请求分析
3 e( H- l. ~6 I8 h
. ]" L8 E( j  X  S/ \2 y( z   
, Y! \. L$ a4 T4 \搜索用户在搜索引擎上键入关键词,提交搜索请求,一步一步找到匹配的网页显示出来。当我们键入关键词提交(按下回车)给搜索引擎时,搜索引擎便会对这次搜索请求进行详细分析。- z% s% `% R; C5 c0 P

+ C- N- T1 v/ B2 |
  A' {6 e0 j2 d+ e! b7 Y
   ! [3 L$ q# y; M( z& N7 X
1、中文分词
. B! m8 P# W) q+ G
' q1 B6 j" w. [' K
8 S5 _5 q0 H+ l; a  w1 P& Q! Y9 {
   
8 ?) d3 g$ T- j* y9 o, H3 M1 j: c中文分词是各大搜索引擎中重要的环节,中文分词能够更加明确掌握搜索请求的重点所在,时期更好地页面展示给搜索用户。
: [. g1 `/ R- b2 t- d/ R( i: M
& J* ?% @5 k1 Z0 B9 f

5 @, S$ u4 p8 h; p1 C! ?   " [0 W) ~$ p7 K5 {( k6 X
百度中文分词常见的以下三种:
! y6 C# J: N+ y& Q5 I0 o4 L  L3 O- r- H. l
9 q% D/ _9 t2 W! S5 J3 Q
   
! z& i) Q- r( K3 e8 G4 g0 o1 oa、基于字符串匹配
) |  [/ m1 {" a$ U$ v7 t0 q4 ]# Z/ ?3 w

, n7 C" Z; B# _% }" ~   9 C5 C! h6 M$ f
在基于字符串匹配中正向最大匹配法、逆向最大匹配法、最少切分这三种又比较常见。
- T: f% c! G9 d
" A( k6 p6 E: D& z. k

; n( \9 E" P. X  \& u! ^! w; w   ' ]8 ^- r% z* L0 Q! D7 d% P0 [
正向最大匹配法:利用关键词查询的时候,在百度排名第一位的是以标题和搜索的长尾词相符合,说明在网站条件相当的情况下,先显示标题匹配的网页。+ G- q% _" B( Q

9 C2 i: a& {- y4 Q% {

, C8 s) p# k; k9 s$ [3 z   % n' d5 M  N* s$ P4 J7 v  |7 }
逆向最大匹配法:刚刚是正向最大匹配法相反的规则,即从右往左反向进行拆分和组合。% g9 O+ n/ t9 `+ e1 X9 @& B/ O

' ]0 v; F) I$ @, ~/ G7 E+ `
. i( [4 K2 w) D( P8 }* [/ |; X
   
% x+ R/ U- M, q% J) c最少切分:最小切分就是将一个个词组切分为最细化,甚者会一个字出现。6 x0 ]) A/ C7 z5 W
; q2 u1 A! l5 G5 i

$ k& Y7 p' Q$ V, ^4 E   $ i- X1 Q* X0 Y5 m) v
b、理解分词方法
8 j2 ?1 r4 I; m7 u- M3 f9 r6 P7 S* \. `- v$ y  t, D

! `9 u$ ~& u% ]2 O* ^% V9 E   
: y0 H$ \2 V5 H- o6 ]理解分词方法:搜索引擎模拟人的思维,对其语句的理解进行分词技术。通过对存储的词语和语句的整合,进行分词理解。其基本思想就是在分词的同时进行句法、语义分析,利用句法信息和语义信息来处理歧义现象。它通常包括三个部分:分词子系统、句法语义子系统、总控部分。在总控部分的协调下,分词子系统可以获得有关词、句子等的句法和语义信息来对分词歧义进行判断,即它模拟了人对句子的理解过程。3 w1 b' k; b$ [1 T. o
) O3 @5 H/ v# V7 t- `

3 P2 M' U3 t% w! |   
2 E5 q0 N! @5 D5 Q  P. a$ ic、统计分词方法
1 i) G/ p/ u: L* a, K/ `
1 S; ?- {: j9 \9 u- a
/ f7 X3 [/ O1 Q, T' O% a5 e& u0 q
   . G+ U* n) z$ M; A. m8 ]
相邻的字同时出现的次数越多,中文分词就会可能把出现相邻的字当成你一个词。我们常常不是使用粗体,女包批发黑体这些吗?原因还在于这对于搜索引擎理解同样有利。4 h4 `2 a) A" o2 F

1 f7 v" J9 B4 s. {. V
8 c3 @6 H5 d6 L$ T1 o
   ' y2 }% D$ V) |" ?
2、去掉停止词
2 i/ q& W2 }& x1 S+ R4 n
" t; w6 U/ ^; O8 e1 p: J

! f! Y, Z6 t+ j! h   
% Y8 G  ^5 |* q$ M% S  G搜索用户在键入关键词时,或多或少会出现不少停止词,像“的”“吗”,这样才能最大限度的显示最相关,最能够满足用户体验的结果页面。% h! r$ ^, a0 L9 C" z3 F9 T
. @3 v/ W5 \7 \' P7 U3 A- F
$ ~  E; i) b5 f: `" S# h0 e1 S
   
. k, j( Q) B* s) z7 p" l3、处理符号
1 C" v! P4 n' b! V7 A  b! u: u/ l
) y- p0 u2 \  }
. W6 i: {9 Z* M( P) T% S
   
; v8 B4 M+ h. g' |搜索引擎还是很看重标点符号的,因此我们seoer在编辑文章的时候,应当注意标点符号的合理使用,尤其是在文章标题上。
) S/ q! c& C9 d( f. }  v' O( f
  k* g+ \7 {3 E3 z
- M) E) P$ g# ]. M* `, ?, z
   * Q( n0 d) d. @6 l
二、匹配搜索请求( r5 n! K3 e, r1 V
5 u& n2 n) d% O6 O
   ( S& i; z1 x; f
当搜索引擎接收到搜索请求详细分析之后,便会匹配URL(当然重点是标题和摘要片段),匹配的URL成千上万个,怎样才能有序显示出来了,这就需要搜索引擎按URL的匹配程度排序。! y0 B0 R& v3 U) [9 ?2 Y7 J

/ l- @7 H% i% N% Q1 t0 h/ X
, |' x1 Q& o# k) k
   
! }/ {9 ?6 b5 t) }三、对匹配网页排名
) |3 Q, n2 x4 C' n4 @1 L) S1 _! `6 w7 M% b
   
2 D, d+ u& a0 e8 Z! T为匹配的网页排序,其实就是搜索引擎对匹配的网页进行筛选,挑选的过程,然后按照一定的顺序整理出结构的行为。当然搜索引擎都会给每个网页一个值,即权重(SEOer们自我定义),通过判断该网页对搜索引擎和用户体验的价值进行排序排名。提高排名的因素多种多样,目前基本上是参考HITS算法,TrustRank信任指数算法、PR值等等。
5 B' r# O* W6 L; k' M( l, N; W2 T$ p% V5 U& ]( X$ _
# u" W4 Q$ d& r6 }) _9 `  g
: D7 l4 Z/ T! d
/ _! h; V% m( d5 o$ y: }+ C
百度词库是由无数个小词库构成的,也就是程序中所说的数据库,通过对词库的分解我们能了解我们标题的正确优化法则!词库是否存在最简单的法则就是通过百度指数查找。* a# P* T& q; h' i8 ?
* [4 A0 |, S9 l( ^: @
0 ?, `+ T5 J; Y. t" z: e' P

$ x% x" |4 H% P* n: V
7 x. ?% N1 D* z+ a
下面江西SEO就来举例加以说明% r! H. P6 c- ^3 ~3 p/ O
) c' u; q7 L1 F

& T7 C; `/ e) ]; L9 i

$ \) I, Z) r; r2 f$ N- B假设:我们设定的分词为:湖北武汉长江大桥;那么分词的顺序应该为:湖北武汉长江大、湖北武汉长江、湖北武汉长、湖北武汉& V/ m1 P% {. z, b0 [( @

' i. }) {1 c$ Q9 P- @6 U8 U% K, D
7 [" w! ], h3 H) f8 b
. N3 g' Z  Q6 L$ z3 P

- a, \1 s8 a+ K根据百度指数显示:‘湖北武汉’这个词语是存在的,那么我们下一步就是对‘长江大桥’进行分词的。% l% }- V( {, r! o

" X' G2 y/ j* n# C: i& N
( ?& s1 G2 Q3 M- h8 _. }

, F. H* o1 v8 w
& t' v" ?+ t- E9 E2 q: f
根据百度指数:长江大桥 也是存在百度词库中的,那么湖北武汉长江大桥的分词应该是:湖北武汉、长江大桥这两个词库的交集。* w1 K3 r% A- `4 \: [0 U) f" G
2 \2 B0 m3 M$ x2 q

$ R  }0 [! h! [7 G
$ p; A% e( s( c) R) ~0 L

$ ]& \  H6 Q0 `% L0 D9 \现在我们来对:“武汉装修公司、武汉装饰公司”   进行分词
. Q2 I) C  X! p; V4 S1 b# H9 l& Q: m% T

2 ~! B  g, u! g! f7 `1 j
4 W) y0 C( s+ ^' n! a
, u  @0 t8 i: h6 f7 b/ c/ h3 M
根据上文中提到的分词原理!那么我们可以很容易的把上面的两个词语分解成为:武汉  装修公司   武汉   装饰公司
) h. X4 S4 v. {9 r9 V. t: a0 I/ M) G9 s

( {9 P; f* {0 }: y; Z
4 ^6 b- v+ l5 b* l3 L
) f4 U9 W+ |- W) {* l2 T
很多人做标题优化会写出:武汉装修装饰公司怎么样?2 b' J& A% M( |& O
; J* K  n5 |' v: W( E
, S% ^2 G9 o1 S  R* |+ U( T

# ]7 p3 {+ V) v! P

, l- ?( v! a; m7 N  V) M: \8 i我们对标题进行分解可以得到的词语应该是  武汉  装修  装饰公司  怎么样?0 L/ r" m, W- E- \1 W" B

3 i1 U% t' @- V& w' f3 g

$ \4 D$ M* g0 R$ j: q1 t: K4 F
$ W) T' X: m/ u* e, y' j' P

3 e, o$ K' b" F# Z这样分词的结果很明显  我们其实这样是把  装修公司  这个词语进行了遗漏!只是把词语做成了  装修  这无疑是增加了网站的优化难度  也导致我们关键词的优化遗漏
  ?$ z. y# w5 e3 \* }" c% K9 u1 n$ n, X1 ~% |/ f, Y

! E8 Y. y* {" l; V1 N# O! M
1 V' U% V9 o/ Q8 r

- I- W; p; O0 h, s2 R( l其实我们在考虑一个版本:武汉装修公司 装饰公司怎么样?
1 X! s8 Y+ J! {$ v( y5 t. R8 s: Y: S- E- T

. I: a, J$ j/ B$ @( l$ n' F. s, w: U1 ^) ~, I% Q

9 U2 S; y  F8 L6 a7 ~9 _; n7 ~" A* h同样分词,结果应该为:武汉  装修公司  装饰公司  怎么样 ?# o1 |& e, u& D  x* P

0 \; u$ q8 g6 j/ G, G

5 V8 K$ D- P. ^  K
0 ~! r- U4 `: W$ I$ X
" e7 l' x* j; v( `) D
效果是怎么样的,以及标题优化关键词的效果不言而语?
( I- }3 G; P6 N8 u0 z( c5 V- e# J: L) G) K! n6 f

1 W' q& w: D7 A, n4 H$ G$ Z. U" z

  O/ t, |2 \" \) Q, z这个词语的更多版本大家也可以去尝试,总之一句话,大家得考虑到百度的算法的分词次数和词库的大小!做标题优化不能单单只靠自己的感觉去做!
: I7 u. e5 P1 T* Z# D
8 G" s; [' i; G. p$ A2 ]5 s" m* A- J
: h$ x+ C0 V, x& y& s9 [2 k- u
文章来源于曾庆平博客:http://blog.sina.com.cn/s/blog_e7c75bd30102vfib.html

! N: J" `: J* I2 p' R

, |( a! n: A. B+ ^7 V* K: N; K9 u) ?搜外论坛原创作者:戏笑☆醉红颜
5 |* L9 y6 i6 J1 h- e日期:2015.1.12
7 z& f- F8 A# ?/ ^  ]

) P+ q$ \) Z: m4 j  R  E
# X' O2 E( d8 U3 K% x. p5 ^) S) h) i3 m1 ^2 o5 [
3 a0 h8 L  ~/ @, j3 \! Z/ T
. H+ \- L( J" \) }. `; E
+ L4 K7 N0 l6 T+ ?; |8 j/ T

0 P  N+ }# @0 s! g5 a7 u- L4 s/ }9 J9 O- S谢谢,好的见解搜索引擎面对的用户大部分是通过关键词返回一个列表页面,这个结构页面是大量的搜索索引库而建立起来的。当然这里这个页面是指自然搜索结果。那么搜索引擎是如何完成排名这以环节的呢?
. X/ h8 H2 w2 B
8 N. ^1 [* v& q) _3 @  G$ q
& p$ h5 i( h( e3 ~% X$ s
   
3 p- y0 ]! u! |& F% J7 l一、对提交的搜索请求分析2 W" q; ~* `( C5 L
1 P+ E6 I4 l, a) o& j; t
   
, ~( G9 H; e# H- {搜索用户在搜索引擎上键入关键词,提交搜索请求,一步一步找到匹配的网页显示出来。当我们键入关键词提交(按下回车)给搜索引擎时,搜索引擎便会对这次搜索请求进行详细分析。
# ]% \9 H1 U8 r/ a
3 E: R  J! m' |& c* w

; b% ?# S. q9 g9 x; K0 w7 B$ r   6 g4 F9 W, f. K6 w+ T! z2 q) [- _
1、中文分词
& Y. O0 h0 u4 X! T# |- x- W( G  n4 D* E' j1 k3 t

, z' e7 {$ u, n   ! _; r: c  u1 r" G8 e5 D( E8 B, T
中文分词是各大搜索引擎中重要的环节,中文分词能够更加明确掌握搜索请求的重点所在,时期更好地页面展示给搜索用户。, P6 E: R) V9 ^2 }. O: T

/ C: D; u$ @0 D% n7 I4 i
8 I2 m. x9 T7 [
   8 ~2 ?' W" l3 Y0 c
百度中文分词常见的以下三种:
- ?3 t4 e' d- [2 U. a0 _- E& z. J3 H
$ o3 U# b! |+ J  F2 y
   
' C' u. s3 T! ?% h* na、基于字符串匹配
' H0 q  m$ o/ O3 C* r& p3 z9 W+ F3 w) g/ n9 d; A
0 K% |6 w/ T9 N! D
   
0 r$ ]! [( ?8 D. V9 k在基于字符串匹配中正向最大匹配法、逆向最大匹配法、最少切分这三种又比较常见。
9 d6 ~% [& w0 a/ D, w' {! e2 S! |3 @+ ^. l* [1 g4 \2 D- A9 G

" Q% V  L& W+ D, T. ?: ]   
. g, Z4 v: g) a: W/ \. P! r正向最大匹配法:利用关键词查询的时候,在百度排名第一位的是以标题和搜索的长尾词相符合,说明在网站条件相当的情况下,先显示标题匹配的网页。
5 d# L3 q2 E& z9 v! x- O- ?8 o+ Q1 Z( H3 e
5 `) \9 q$ ]8 h# W0 }8 Q
   6 P5 d2 l* G' T) _( x- m2 S
逆向最大匹配法:刚刚是正向最大匹配法相反的规则,即从右往左反向进行拆分和组合。0 ^3 H2 G0 a: U; v7 O( }; [

$ l& T8 Q  K8 o+ r- L% E
7 p: P2 ^( r5 L' i  ^* j) S' {! c
   
9 H  K9 D) {0 F! ?4 t: N最少切分:最小切分就是将一个个词组切分为最细化,甚者会一个字出现。
$ e& r1 z- F/ M& K& ~: s2 n
) r" X9 j# a/ m
  I2 k% {0 v% U3 Y( M
   
$ M5 L, O7 Y- Q; g" y& C0 w) N6 i) x* g1 Pb、理解分词方法$ H/ c5 X9 Y$ S% n% f* R

5 X- Y# j3 K1 P/ o1 m, N' V

: \$ |% W1 |9 u& B8 }% {, y& D9 P   # e+ Z( l2 {3 v8 C
理解分词方法:搜索引擎模拟人的思维,对其语句的理解进行分词技术。通过对存储的词语和语句的整合,进行分词理解。其基本思想就是在分词的同时进行句法、语义分析,利用句法信息和语义信息来处理歧义现象。它通常包括三个部分:分词子系统、句法语义子系统、总控部分。在总控部分的协调下,分词子系统可以获得有关词、句子等的句法和语义信息来对分词歧义进行判断,即它模拟了人对句子的理解过程。
4 |2 t8 s2 t" W$ D$ R" A5 Q  g4 I# T- e2 |

& j, `" b, P& m# B   9 L& W# s8 ?  `9 u9 i. v  n
c、统计分词方法
3 U& T9 N; g; N3 f3 Y8 b2 s
0 [& S4 a: J5 W1 C

4 i% h' g% [; @6 e4 \& B4 k   
" ]1 ~, |0 [  g  r$ ~8 j相邻的字同时出现的次数越多,中文分词就会可能把出现相邻的字当成你一个词。我们常常不是使用粗体,女包批发黑体这些吗?原因还在于这对于搜索引擎理解同样有利。
' S% D! K9 u* J/ o3 U. E4 H8 e9 w) J) k7 n: z4 Y

8 t4 Z$ r, K, j8 N* g( G   
& @+ G9 q0 }' ^+ G2、去掉停止词. J" @! S, r, j2 l  `

& H- Q! |5 e; [% @3 F# d

. O7 ]  U+ C6 G5 Y+ c# R1 ^   ) H. r+ t5 O9 n+ ]
搜索用户在键入关键词时,或多或少会出现不少停止词,像“的”“吗”,这样才能最大限度的显示最相关,最能够满足用户体验的结果页面。
: O8 s$ I: W  T& @# l0 M
$ L% x1 n" r' ]4 `3 b) K

9 }* @( F% `) v, G   . M, _" ^0 \* C) z# q9 b2 z
3、处理符号7 @+ o: h. c& i! z- m1 L3 x" c
' g* A. f+ ], A, g8 W
& t) K5 _, j, N+ u3 q6 T: {
   2 l# ^3 |' A& \1 L, A
搜索引擎还是很看重标点符号的,因此我们SEOer在编辑文章的时候,应当注意标点符号的合理使用,尤其是在文章标题上。
" D1 Q) }; |* \& \) z+ C4 M. ^% w! F4 D2 p4 @9 y
# G9 y# m7 w$ c$ U) V% l
   
% X4 @' F1 e0 U5 J: A二、匹配搜索请求( I' S/ z, B; F9 n! C% X/ F
: o4 ]( t+ g+ q/ C( s
   9 ]: z9 H- `4 Z, s5 f
当搜索引擎接收到搜索请求详细分析之后,便会匹配URL(当然重点是标题和摘要片段),匹配的URL成千上万个,怎样才能有序显示出来了,这就需要搜索引擎按URL的匹配程度排序。
5 O( k# a4 F' A& |6 |9 F  W. |- e& y2 ]

5 k, H: z& V% `( [1 x   
6 n3 P0 U3 N+ I8 D' Q7 Q+ E  B三、对匹配网页排名
3 l  j: q  p" `+ O
$ k; Y4 G, v$ c   
- i8 X, b) ?6 M( O9 t! H9 D为匹配的网页排序,其实就是搜索引擎对匹配的网页进行筛选,挑选的过程,然后按照一定的顺序整理出结构的行为。当然搜索引擎都会给每个网页一个值,即权重(SEOer们自我定义),通过判断该网页对搜索引擎和用户体验的价值进行排序排名。提高排名的因素多种多样,目前基本上是参考HITS算法,TrustRank信任指数算法、PR值等等。1 N* i8 f! q5 ]2 V% A
0 o5 Q. S, S5 C5 c
1 }5 C8 P: _* h$ L! w! v9 |

/ F/ ~6 d8 r; A& w& V. G

( m$ u% @$ c1 N$ E3 i5 B百度词库是由无数个小词库构成的,也就是程序中所说的数据库,通过对词库的分解我们能了解我们标题的正确优化法则!词库是否存在最简单的法则就是通过百度指数查找。( R( D8 `# `( T" s* M3 y$ _
  l5 a: ?! f/ J9 k9 k* [' j. B9 Q
) B; [  C" i6 I' C! h! p
. \8 g* F. R' ?

4 ?4 |: m( u2 n6 X. x! K' O1 V下面江西SEO就来举例加以说明( q0 R$ c4 F# e$ D3 v

: @* C' S; S  Q1 g) y9 J0 C; {3 R$ m4 Y, u! T

% j# T+ A) C1 W假设:我们设定的分词为:湖北武汉长江大桥;那么分词的顺序应该为:湖北武汉长江大、湖北武汉长江、湖北武汉长、湖北武汉6 ~% \2 [- m% o/ t  h, E
, Y6 ~2 @) p" K
1 S( F/ b+ I2 N0 Z
; G. M( d; k( [: e' l
# e: ~8 F& J& b. s/ C. W
根据百度指数显示:‘湖北武汉’这个词语是存在的,那么我们下一步就是对‘长江大桥’进行分词的。
9 e9 F/ P6 ?2 \! A
2 {$ @' b/ q% j5 w7 @  `/ T% m
5 s6 @; x! Q: k! r

) b% `( ]1 B5 X4 g% ]5 Y
9 }: Y: X& [& x  J: `  u) _
根据百度指数:长江大桥 也是存在百度词库中的,那么湖北武汉长江大桥的分词应该是:湖北武汉、长江大桥这两个词库的交集。8 @8 Z) k# j, Z3 m& W) Z" l' n
; \  e: h, ~7 L: l" U% k

$ u- K" u& M. J2 ^' s6 a) e- b" A* Q% H% m

3 e+ D1 v, G$ A; Q现在我们来对:“武汉装修公司、武汉装饰公司”   进行分词
1 ~+ d+ D1 ?) A. L$ @/ h
; B" i" \6 p' N0 ^0 d
; x' R) u- _  x. V: v/ y

& S0 {9 L! t: s: l) C  c$ \3 W

* D. \% D! D/ y$ G5 U根据上文中提到的分词原理!那么我们可以很容易的把上面的两个词语分解成为:武汉  装修公司   武汉   装饰公司, O; n4 ~8 o- |' d" B- }

) F9 \' U3 K9 R$ E+ J  ?/ l
+ a/ ?7 J4 l, W* @% z" N3 w% ~1 E
( f+ u/ j0 P! W( [

- V7 e% K! q0 M. C很多人做标题优化会写出:武汉装修装饰公司怎么样?
, K0 e0 x) d# m' H
/ r+ N* L/ ^0 u8 r' _
; U) G' `' G" z& ^' e- K
4 ]+ S4 q% R4 Q7 b) a
$ i2 C: ^5 d7 p3 c' C/ M9 ?
我们对标题进行分解可以得到的词语应该是  武汉  装修  装饰公司  怎么样?+ q4 h8 g' Y) \! Y$ S& W0 q( R

/ g3 V/ {# Z1 j

. `3 X0 B2 f% `. I% r+ J: s* J6 J- i1 e& g
: Y2 A: y* V" ?6 b6 `* H; y( B# C
这样分词的结果很明显  我们其实这样是把  装修公司  这个词语进行了遗漏!只是把词语做成了  装修  这无疑是增加了网站的优化难度  也导致我们关键词的优化遗漏
) W7 _# P1 z5 U" }! X; A; D
+ U: |- R/ _  l( I! }
9 s2 E0 i$ ?0 O& O9 ?3 O( [5 M

$ ^7 [2 E# l" A( _, _! M* Y

' N0 ]5 C; r  F! \) x6 X! n其实我们在考虑一个版本:武汉装修公司 装饰公司怎么样?& \! M/ \4 B% x, q

& r- `# i' r- R' D6 e

9 C( ], C5 A4 K: J4 U% ~) Y8 b) i" A5 q" z3 k

9 d; B, ]/ Q+ A5 {6 C同样分词,结果应该为:武汉  装修公司  装饰公司  怎么样 ?
$ a2 l: _' `4 \# I9 [5 ~1 Q. t, D6 j- ]
( |& i- V$ v7 R, ]
: `* P8 A  H- u( p- j& ]" L+ P
7 c' g3 f6 g6 g7 Z3 N" Y
效果是怎么样的,以及标题优化关键词的效果不言而语?& _: p3 V+ L5 s1 \0 E) i

" L! Z+ ~# ~3 t, w

  L! Q9 |$ J( I! j) v4 _
! g) |$ h+ n7 Z) p5 ~" e- z1 O3 D! o/ p

: W8 o6 Q! z* m1 T这个词语的更多版本大家也可以去尝试,总之一句话,大家得考虑到百度的算法的分词次数和词库的大小!做标题优化不能单单只靠自己的感觉去做!
' G' L4 T3 E% j  w& w$ q3 w% k4 E8 k4 u% ?5 {% y! c* R1 [# D' m/ G
) T, s( _+ H) @
文章来源于曾庆平博客:http://blog.sina.com.cn/s/blog_e7c75bd30102vfib.html
& C3 V7 O1 S+ X1 Q
( a) [. q- j1 e( X
搜外论坛原创作者:戏笑☆醉红颜 3 ?5 t6 f" X8 y$ u
日期:2015.1.12
$ u& G9 l) j2 L2 {
; `. i$ h1 P- o8 p6 X8 d6 S
# {. G3 o, f' n* ]* i
; p3 n. k0 b" }- M# n- U

! ?3 J* t) E2 |& \
8 d* a$ r- H7 z: }; T# y- K' g1 [' T. n
9 q! _! X3 }. J2 t
分词同正则表达式一直都是大家比较关心的核心内容,估计这些东西没有人会研究得那么透彻写得不错,就是排版是不是应该调整一下
 

精彩评论10

正序浏览
kwjvtwzx 发表于 2015-7-14 23:01:18 | 显示全部楼层
 
女人啊真是那句话~~~无理占三分~~忘记怎么说了 呵呵 ~~你帮我想想
 
xiaoye 发表于 2015-7-14 23:02:35 | 显示全部楼层
 
你这样的表现,就只配这几个字:窝囊废
 
kwjvtwzx 发表于 2015-7-14 23:01:14 | 显示全部楼层
 
去干吗啊~~~伤心啊~~~
 
efiew 发表于 2015-7-14 22:50:04 | 显示全部楼层
 
我.......伤心
 
亮凌庚 发表于 2015-7-14 22:42:07 | 显示全部楼层
 
疯了.........
 
buingeEvineus 发表于 2016-1-24 18:03:31 | 显示全部楼层
 
我在顶贴~!~
 
wwzcdenleclv 发表于 2016-1-24 18:04:50 | 显示全部楼层
 
哦~~~明白了....
 
GoodyFouppy 发表于 2016-1-24 18:05:00 | 显示全部楼层
 
我率天兵天将 将你打回原形~~~
 
gevaemaidovef 发表于 2016-1-24 18:03:40 | 显示全部楼层
 
宁死不屈.....
 
seazvyt 发表于 2016-1-24 18:03:59 | 显示全部楼层
 
其实今天baidu 又 抽风了
 
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


0关注

1粉丝

2503帖子

热门图文
热门帖子
排行榜
作者专栏

关注我们:微信订阅号

官方微信

APP下载

全国服务Q Q:

956130084

中国·湖北

Email:956130084@qq.com

Copyright   ©2015-2022  站长技术交流论坛|互联网技术交流平台Powered by©Discuz!技术支持:得知网络  

鄂公网安备 42018502006730号

  ( 鄂ICP备15006301号-5 )