12下一页
返回列表 发新帖

搜索引擎工作原理:网页关键词排名机制

8.5k 16
swmozowtfl 发表于 2015-9-9 21:17:40|湖北 | 查看全部 阅读模式
       前面我们分享了搜索引擎工作原理:预处理和索引与链接关系的计算,当搜索引擎蜘蛛爬行和抓取网页之后,会对得到的网页进行一系列的预处理,最后得到关于网页的反向索引集合,这时搜索引擎就可以根据用户输入的搜索词对网页做出排名了。
4 e* E' @& T7 ]$ O, P: I7 o$ L/ ?  X. J" @1 F% {7 _- H- s5 L% z

7 F2 S. y  ?4 ~4 y

搜索引擎工作原理:网页关键词排名机制

搜索引擎工作原理:网页关键词排名机制

" G2 g, t& @4 P% H" M* k" C7 h! c$ Y1 A
: H6 H; Q, l* ]/ Z( D: c
       当然,从用户输入搜索词到搜索引擎展示出相关的网页排名结果,中间还要经过相当复杂的计算过程,听我为大家慢慢道来!首先搜索引擎会对用户输入的搜索词进行分词处理和去噪,如果对分词处理和去噪还不是很了解的小伙伴,大家可以到我的个人网站狄吉堂网站优化博客中参考搜索引擎工作原理:预处理这篇文章,这里就不多做介绍了,当搜索引擎分词和去噪完毕之后,会得到几个关键词,然后按照这几个关键词的逻辑“与”关系到反向索引集合中去进行匹配,比如网友输入“狄吉堂网站优化”最后会被搜索引擎分词成“狄吉堂”,“网站”,“优化”这三个关键词,然后再去爬行和抓取的网页反向索引库中查找同时包含这三个关键词的页面,因为这样得到的网页相关性更高。
9 \1 I" K2 e* \# m$ \, a. ~) O7 ?) M7 X0 X9 K

5 t$ U9 n$ e1 u: |, J       当搜索引擎得到这些网页之后会发现,这些网页的数量是相当庞大的,而用于展示在用户面前的搜索结果页面不超过1000个,百度也只展示了760个页面,所以搜索引擎会对这些页面进行相关性之外的计算,其中影响较大的一个因素就是网页的权重,根据网页权重的高低排序会筛选出一批页面,至于筛选出多少页面,这里不得而知,但肯定大于1000个页面。& p6 O, t; U3 l4 L. N" q- L
: j9 K8 U' S  K+ b
7 X7 l, l0 l) ~% z
       在选出这些权重较高相关性较强的页面之后,接下来搜索引擎会对这些页面进行更加细微的相关性计算,这个过程也是我们seoer更为关心的一个过程,因为这个过程中的很多因素是我们这些seoer可以控制的。
, h# T4 h) X+ u% @4 U( U* _( Y  o0 R# F4 H: Y8 E8 b
* f: H# M* H6 _' m/ m* V  K( V
       首先是关键词的常见指数,比如用户搜索“五台山旅游”,经过搜索引擎分词可以分成“五台山”,“旅游”,我们可以很明显的看出“旅游”这个词在我们生活中经常会出现,而“五台山”就出现的比较少了,针对都包含“五台山”和“旅游”关键词的两个页面,显然在标题中出现关键词“五台山”比内容中出现“五台山”的相关性更强。- F- p: t$ k$ n5 }
+ Q3 h9 I4 H& u4 F( X- W
$ P# @1 P8 T; E* _
       关键词的频率及密度,这个比较好理解,如果关键词在页面中的出现的频率很高,密度也很大(这里不考虑关键词的堆砌),那么这个页面和这个关键词的相关性很强。
! Q$ ]! s* y- o( h2 Q" |6 E8 O4 Q: `3 `+ O% W

3 m0 r! a8 G/ _* s* H: G       关键词的位置和表现形式,就像在狄吉堂网站seo博客中搜索引擎工作原理:索引与链接关系的计算这篇文章中提到的,关键词的位置和表现形式都会被列入相关性计算中,比如一些标题标签的使用,文字加粗和颜色变化,H1标签等。  y, t2 n( }# ?/ s, X7 b- j9 u

6 l9 e% l8 C( ?; \  R" ^
) Y; `/ V# t, }
       关键词是否完整匹配,如果关键词能够完整匹配用户的搜索词,则相关性高,即使没能完整匹配,但是关键词之间距离很短,这样也会被认为相关性较高。
' P1 _2 _5 p) n6 q) r
0 O- C) H$ H4 J2 C# \. l
  k+ f5 E& l' l% P% S6 [5 y* s/ {: Y
       锚文本和权重,页面的权重对关键词的相关性影响非常大,而锚文本的重要性与页面的权重几乎相当,如果锚文本的锚点采用的是用户搜索的关键词,那么这个锚文本会给这个关键词带来很大的链接权重,包括锚文本周围的文字也需要重点布局。# y; H1 E- X8 Q) y

! \; H7 @* {/ l8 K' T# K* ?
$ N" ?8 r9 ~$ u9 ?  Z$ ~
       经过以上这些关于页面与关键词之间相关性计算之后,网页的排名结果页就浮出水面了,接下来的工作就是搜索引擎调用页面的标题,页面描述,网址,快照等数据显示在搜索结果页面中。, X$ n! `% C% g$ F

# t4 h1 o! N6 ]% Y- [' r/ \$ t3 l, h
, J/ }# X4 x" \# |, d1 w7 {! @
       我们通过四篇文章介绍了搜索引擎的工作原理,要想做好网站优化,理解搜索引擎的工作原理还是非常重要的,这样我们的优化才会更有目的性,希望能对大家有所帮助!
0 F0 k, f8 e, z: h/ |4 M0 b0 J$ M8 \1 ^; y1 q. c0 O& Z
2 r' F) j) s0 X7 E( H
       原文出处链接:http://www.dijitang.com/youhua/380.html
+ f: ]& h; Q- `       得知论坛原创作者:狄吉堂网络营销4 E( A3 i( @4 h; a, e5 U$ \
       日期:2015-08-294 \9 O7 R9 O0 K, C  c( Q

% D$ i8 x- {# k3 y, V不错不错,学习了 感谢楼主的分享,辛苦了       前面我们分享了搜索引擎工作原理:预处理和索引与链接关系的计算,当搜索引擎蜘蛛爬行和抓取网页之后,会对得到的网页进行一系列的预处理,最后得到关于网页的反向索引集合,这时搜索引擎就可以根据用户输入的搜索词对网页做出排名了。
& |# w& G( D- f- X! K* c1 l% [9 P6 T9 R! Q! b/ w8 u4 e

: x" {  w  p5 a: o2 [$ h

搜索引擎工作原理:网页关键词排名机制

搜索引擎工作原理:网页关键词排名机制

/ L1 }0 t* y( U, Q: b
& O. ^; j) Z4 N8 Q+ @6 y% f
: `: W* w; x+ l- @/ R
       当然,从用户输入搜索词到搜索引擎展示出相关的网页排名结果,中间还要经过相当复杂的计算过程,听我为大家慢慢道来!首先搜索引擎会对用户输入的搜索词进行分词处理和去噪,如果对分词处理和去噪还不是很了解的小伙伴,大家可以到我的个人网站狄吉堂网站优化博客中参考搜索引擎工作原理:预处理这篇文章,这里就不多做介绍了,当搜索引擎分词和去噪完毕之后,会得到几个关键词,然后按照这几个关键词的逻辑“与”关系到反向索引集合中去进行匹配,比如网友输入“狄吉堂网站优化”最后会被搜索引擎分词成“狄吉堂”,“网站”,“优化”这三个关键词,然后再去爬行和抓取的网页反向索引库中查找同时包含这三个关键词的页面,因为这样得到的网页相关性更高。* h% S+ k0 }1 q& Y8 O
1 }; h8 p0 `3 M* n4 Z* k
) ?) e- j. V3 t
       当搜索引擎得到这些网页之后会发现,这些网页的数量是相当庞大的,而用于展示在用户面前的搜索结果页面不超过1000个,百度也只展示了760个页面,所以搜索引擎会对这些页面进行相关性之外的计算,其中影响较大的一个因素就是网页的权重,根据网页权重的高低排序会筛选出一批页面,至于筛选出多少页面,这里不得而知,但肯定大于1000个页面。
" U9 m5 K6 X# i! O% o# d; K7 U
1 L% ]- T) d' S" x4 B

9 r- v* O9 j$ G* N$ X( i       在选出这些权重较高相关性较强的页面之后,接下来搜索引擎会对这些页面进行更加细微的相关性计算,这个过程也是我们seoer更为关心的一个过程,因为这个过程中的很多因素是我们这些seoer可以控制的。( u2 X! |* E' q- y) m+ F8 O" }

/ ]8 ]. |' M2 |( K
+ x; s0 z% {/ W7 d
       首先是关键词的常见指数,比如用户搜索“五台山旅游”,经过搜索引擎分词可以分成“五台山”,“旅游”,我们可以很明显的看出“旅游”这个词在我们生活中经常会出现,而“五台山”就出现的比较少了,针对都包含“五台山”和“旅游”关键词的两个页面,显然在标题中出现关键词“五台山”比内容中出现“五台山”的相关性更强。" f1 V! ~# M9 O$ M4 ~

, S/ H2 L6 w6 _! U

# @0 e! a2 k5 J7 `2 q. R       关键词的频率及密度,这个比较好理解,如果关键词在页面中的出现的频率很高,密度也很大(这里不考虑关键词的堆砌),那么这个页面和这个关键词的相关性很强。2 [0 j; N& Y$ a! N. b9 y
) i* X: N2 D9 K5 k# [# j* g
6 c, |& \* Y: J% @( t
       关键词的位置和表现形式,就像在狄吉堂网站seo博客中搜索引擎工作原理:索引与链接关系的计算这篇文章中提到的,关键词的位置和表现形式都会被列入相关性计算中,比如一些标题标签的使用,文字加粗和颜色变化,H1标签等。, `( m) u! B; [. T; U3 Q

" T( Z; T! n" a2 O, G

9 n2 D' E2 x0 X7 x4 {       关键词是否完整匹配,如果关键词能够完整匹配用户的搜索词,则相关性高,即使没能完整匹配,但是关键词之间距离很短,这样也会被认为相关性较高。
7 Q) D. D* i; |' h, @* n
9 |! x$ S; K- a8 C) C' c7 W/ }

- z- Z' P6 t3 i; \) E0 X  p. V7 A1 }       锚文本和权重,页面的权重对关键词的相关性影响非常大,而锚文本的重要性与页面的权重几乎相当,如果锚文本的锚点采用的是用户搜索的关键词,那么这个锚文本会给这个关键词带来很大的链接权重,包括锚文本周围的文字也需要重点布局。' c& I) e# ]" b+ N0 O
0 H  [& V2 _8 X9 D
( ]; {7 m  ^, h# s% Z
       经过以上这些关于页面与关键词之间相关性计算之后,网页的排名结果页就浮出水面了,接下来的工作就是搜索引擎调用页面的标题,页面描述,网址,快照等数据显示在搜索结果页面中。, s3 a' K: \/ P& Z. N+ M, b$ [1 C! h  B
" c% A7 c  d% w3 ], I3 N+ T0 x

- P: F5 v: }9 r  G$ l       我们通过四篇文章介绍了搜索引擎的工作原理,要想做好网站优化,理解搜索引擎的工作原理还是非常重要的,这样我们的优化才会更有目的性,希望能对大家有所帮助!
5 a: f( H+ Z& t& ]/ z
, N' @' |& h/ w. o9 z0 R# }
1 M3 v+ _0 l& h. }- l/ C
       原文出处链接:http://www.dijitang.com/youhua/380.html
" ~$ t8 b, _$ a. M( \; e; Q. U       得知论坛原创作者:狄吉堂网络营销( L2 B) ~+ s% K9 D
       日期:2015-08-29( Y3 [4 \% r: g$ r: t6 _

0 |( k9 D( i! d$ n2 p$ |* p' G: L谢谢楼主分享然后再去爬行和抓取的网页反向索引库中查找同时包含这三个关键词的页面,因为这样得到的网页相关性更高。

回复|共 16 个

jlpmtey Lv.8 发表于 2015-9-10 08:53:35|北京 | 查看全部
楼上的话等于没说~~~
zqdhfrtgso 发表于 2015-9-10 18:44:07|北京 | 查看全部
苍天之下,厚土之上,竟有如此奇人异士、文人墨客!讥讽于谈笑间,笑骂于无形中,层次之高,境界之深,非我等所能匹及,偶像啊!
GoodyFouppy 发表于 2015-9-10 23:48:30|北京 | 查看全部
一个个全都骑到老大头上来了...
zqdhfrtgso 发表于 2015-9-11 06:27:46|俄罗斯 | 查看全部
照你这么说真的有道理哦 呵呵 不进沙子馁~~~
vhzvcacjtk Lv.8 发表于 2015-9-11 16:31:13|北京 | 查看全部
女人啊真是那句话~~~无理占三分~~忘记怎么说了 呵呵 ~~你帮我想想
Rxareexm 发表于 2015-9-11 17:22:30|北京 | 查看全部
好吧...那你说...
tohme 发表于 2015-9-11 17:46:03|中国 | 查看全部
老天不公啊.....
我可以的咧 发表于 2015-9-11 20:57:00|北京 | 查看全部
哈 你逗逗他啊
AlobeAttept 发表于 2015-9-11 21:15:36|北京 | 查看全部
好吧...那你说...
mwxny 发表于 2017-4-11 11:56:13|美国 | 查看全部
激动了就不好办了..
wwdu926a 发表于 2017-4-11 11:56:33|加拿大 | 查看全部
既然你诚心诚意地发贴了,那我就大发慈悲地回复你。为了防止此贴被秒沉,为了维护此楼的繁荣!贯彻爱与真实的邪恶,可爱又迷人的顶贴角色! 穿梭在贴吧之间的顶贴队!喵~就是这样
wwzcdenleclv 发表于 2017-4-11 11:57:43|加拿大 | 查看全部
做为新人!在这里不敢大声说话!送完经验我就走!
wwzcdenleclv 发表于 2017-4-11 11:57:43|罗马尼亚 | 查看全部
感谢党和人民的关爱~~~
wwdu926a 发表于 2017-4-11 12:02:30|INNA | 查看全部
今天统计好像出了问题

回复

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

得知互动是一个融创意、设计、开发、营销、生活、互联网于一体的专业交流分享平台。
Copyright © 2026 站长技术交流论坛|互联网技术交流平台 版权所有 All Rights Reserved. Powered by Discuz! X5.0 鄂ICP备15006301号-5|鄂公网安备 42018502006730号
关灯 在本版发帖 扫一扫添加QQ客服 返回顶部
快速回复 返回顶部 返回列表