关灯
开启左侧

[SEO杂谈] 什么是爬虫以及爬虫的发展史

[复制链接]
swmozowtfl 发表于 2015-5-20 12:43:41 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
 
难得的星期天,在家窝了一天。看了看搜索引擎原理这本书。主要讲的是搜索引擎的原理和发展,如果还没有看到这本书的朋友,那么今天就给大家分享下之中的一个知识点—什么是爬虫以及爬虫的发展史。之所以选择看这本书也是受到了朋友的启发。做seo这一行,要想做好seo技术,就必须了解搜索引擎。正所谓知己知彼,才能百战不殆啊。扯远了,如正题。# C! z& o, Z3 A( r

什么是爬虫以及爬虫的发展史

什么是爬虫以及爬虫的发展史
( J5 w$ ]  i, _5 V- z4 o
什么是爬虫?搜索引擎原理中是这样说的:爬虫也称为“Wanderers”(漫步者)或者“Robots”(机器人),我们常说的百度爬虫经常用后者代替。它首先是一组运行在计算机的程序,在搜索引擎中负责抓取时新的且公共可访问的web网页、图片和文档等资源。这种抓取的过程为通过下载一个网页,分析其中的链接,继而漫游到其他链接指向的网页,循环往返。: G7 M% i( e: B, i
爬虫的发展史要从第一个爬虫开始讲起。那么下面给大家介绍下世界上第一个爬虫,爬虫简称是一种自动抓取网页信息的机器人。世界上第一个爬虫是由麻省理工学院的学生马休·格雷在1993年写的,并给他起了一个名字“万维网漫步者”。尽管其编写目的不是为了做搜索引擎,但正是这我们这一生我们这一生我们这一生革命的创新,为以后的搜索引擎发展和今天的广泛应用提供了坚实的基础。" [- e' S; ^6 A3 S
现代搜索引擎的思路源于Wanderes,不少人改进了马休·格雷的蜘蛛程序。1994年7月,Michael Mauldin将John Leavitt的蜘蛛程序接入到其索引程序中,创建了当时著名的搜索引擎Lycos。这应该也算是第一个搜索引擎了。其后无数的搜索引擎促使了爬虫越写越复杂,并逐渐向多策略、负载均衡及大规模增量抓取等方向发展。爬虫的工作成果是的搜索引擎能够渐叟几乎全部的万维网页,甚至被删除的网页也可以通过”网页快照“的功能访问。
& G1 ~- ]* X% u! y4 a以上就是互联网那些事今天给大家介绍的关于什么是爬虫以及爬虫的发展史问题,我们只有了解了爬虫以及他的发展史,才能更好地 做好SEO技术。同时欢迎广大朋友继续关注互联网那些事,平台就继续为大家提供SEO技术分享等一些资讯。
* ^. w- a4 f0 P4 P/ P! K' ~) M$ Z0 `' {6 N  V! M
+ ]1 {4 o* g" P2 N, [, t3 X
! Z  a; A, C6 G
原文出处链接http://www.itnaxieshi.com/pachong.html
0 p& ?5 }8 |5 s7 R, B5 K3 c2 w搜外论坛原创作者:哈哈王子3136. ?# ^0 U6 E6 n  _5 w
日期:2014.12.229 q  e5 k4 U, {! J

1 E/ f# L; r) D1 O  H                                                                                       3 R/ ~; N0 J8 s. V
1 Q" y  D+ g+ O! O
  M* K1 x2 v, E) r% t
lol.gif 这只是早期的,现在的复杂多了。                                                难得的星期天,在家窝了一天。看了看搜索引擎原理这本书。主要讲的是搜索引擎的原理和发展,如果还没有看到这本书的朋友,那么今天就给大家分享下之中的一个知识点—什么是爬虫以及爬虫的发展史。之所以选择看这本书也是受到了朋友的启发。做SEO这一行,要想做好SEO技术,就必须了解搜索引擎。正所谓知己知彼,才能百战不殆啊。扯远了,如正题。
$ Q2 Z9 \. l3 b4 i8 u- ^$ f<img id="aimg_C52Aw"  class="zoom" width="300" height="129" pold="http://www.itnaxieshi.com/wp-content/uploads/2014/12/2141150%E5%89%AF%E6%9C%AC-300x129.jpg" border="0" alt="" />' `% f7 V& [# z+ q" X
什么是爬虫?搜索引擎原理中是这样说的:爬虫也称为“Wanderers”(漫步者)或者“Robots”(机器人),我们常说的百度爬虫经常用后者代替。它首先是一组运行在计算机的程序,在搜索引擎中负责抓取时新的且公共可访问的web网页、图片和文档等资源。这种抓取的过程为通过下载一个网页,分析其中的链接,继而漫游到其他链接指向的网页,循环往返。9 w, ~( X0 l; d/ ^; e2 z
爬虫的发展史要从第一个爬虫开始讲起。那么下面给大家介绍下世界上第一个爬虫,爬虫简称是一种自动抓取网页信息的机器人。世界上第一个爬虫是由麻省理工学院的学生马休·格雷在1993年写的,并给他起了一个名字“万维网漫步者”。尽管其编写目的不是为了做搜索引擎,但正是这我们这一生我们这一生我们这一生革命的创新,为以后的搜索引擎发展和今天的广泛应用提供了坚实的基础。
4 r* N+ `; d- J* \+ J- m现代搜索引擎的思路源于Wanderes,不少人改进了马休·格雷的蜘蛛程序。1994年7月,Michael Mauldin将John Leavitt的蜘蛛程序接入到其索引程序中,创建了当时著名的搜索引擎Lycos。这应该也算是第一个搜索引擎了。其后无数的搜索引擎促使了爬虫越写越复杂,并逐渐向多策略、负载均衡及大规模增量抓取等方向发展。爬虫的工作成果是的搜索引擎能够渐叟几乎全部的万维网页,甚至被删除的网页也可以通过”网页快照“的功能访问。
2 c6 v0 T$ h; ^- y& _( o1 C3 S以上就是互联网那些事今天给大家介绍的关于什么是爬虫以及爬虫的发展史问题,我们只有了解了爬虫以及他的发展史,才能更好地 做好SEO技术。同时欢迎广大朋友继续关注互联网那些事,平台就继续为大家提供SEO技术分享等一些资讯。
0 q$ S$ e2 T2 r9 g+ g1 y  Z2 O) j* l: Y( c

' H0 G: l0 ?* x3 b" W& z+ i8 O7 A) O
4 U4 e; _& L9 H+ e原文出处链接http://www.itnaxieshi.com/pachong.html
0 Y! C1 Q- d' `) ^. y搜外论坛原创作者:哈哈王子3136
: B1 D& ]1 S# F$ o! U: f) @- r日期:2014.12.22' M. K  U8 P, X4 E  X# i
4 {3 G" ]/ E* X( I9 d* r+ q( w# A: j
                                                                                       
0 Y2 P1 X3 g' w. E! K0 F% C$ C6 R7 a! |: @, C: b3 w
" i" N  ^; c, L' `, z1 m" E
spider是目前搜索引擎工作原理的核心部分吧。知道其发展历史还是有点好处的,赞一个!
 

精彩评论11

正序浏览
gevaemaidovef 发表于 2016-3-14 20:09:54 | 显示全部楼层
 
到你的~~贴吧收藏~~~我的发言~`找
 
seazvyt 发表于 2016-3-14 20:10:49 | 显示全部楼层
 
呵呵 我可不敢~~~~
 
tohme 发表于 2016-3-14 20:11:23 | 显示全部楼层
 
对自己好点~别难为自己
 
seazvyt 发表于 2016-3-23 20:08:38 | 显示全部楼层
 
下次有人骂我了...我给他还回去..
 
Acropozelan 发表于 2016-3-23 20:09:08 | 显示全部楼层
 
这是怎么了啊??
 
tohme 发表于 2016-3-23 20:09:29 | 显示全部楼层
 
我率天兵天将 将你打回原形~~~
 
tohme 发表于 2016-3-23 20:09:30 | 显示全部楼层
 
好吧...那你说...
 
mwxny 发表于 2016-3-23 20:09:34 | 显示全部楼层
 
系统居然怀疑我灌水,我身边又没有水龙头。哦…明白了,身上有一个……
 
bqtklouu 发表于 2017-4-11 15:20:54 | 显示全部楼层
 
貌似我没看懂那~~~
 
effoggikeftor 发表于 2017-4-11 15:22:19 | 显示全部楼层
 
去干吗啊~~~伤心啊~~~
 
buingeEvineus 发表于 2017-4-11 15:25:21 | 显示全部楼层
 
这个站一周前刚刚有了点起色
 
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


0关注

1粉丝

2503帖子

热门图文
热门帖子
排行榜
作者专栏

关注我们:微信订阅号

官方微信

APP下载

全国服务Q Q:

956130084

中国·湖北

Email:956130084@qq.com

Copyright   ©2015-2022  站长技术交流论坛|互联网技术交流平台Powered by©Discuz!技术支持:得知网络  

鄂公网安备 42018502006730号

  ( 鄂ICP备15006301号-5 )