搜索引擎的快速发展也就是近15年发生的,这与互联网的发展趋势密切相关。最近几年,互联网在经过了web2.0的市场培育阶段后,迎来了以互联网用户的个性化和社交化为中心的趋势。同时,移动设备的逐渐流量及两大趋势的融合,催生了很多新型应用,为了迎接和顺应这种趋势,对搜索引擎来说,也产生了新的挑战。本文将阐述未来搜索引擎的发展趋势。纯属个人观点。" N* e7 c* ^2 ]% d2 N, c" q Z
6 p% |2 N' f& F
(纯属恶搞:用户搜索未来发展趋势)
' J: n4 ]& T/ Y. W& b
0 O$ ?7 k8 V- Q0 p1,社会化搜索
7 b- v9 ]4 S6 z% ^1 T2 k% A
, |, `7 r2 P* a; _# `" |; q随着Facebook的流行,社交网络平台和应用占据了互联网的主流,社交网络平台强调用户之间的联系和交互,这对传统的搜索技术提出了新的挑战。
0 t- Z9 y; D2 }: Q; D9 p, d% }- L" s8 B) L5 [) g) p; o: G; I
传统搜索技术强调搜索结果和用户需求的相关性,社会化搜索除了相关性外,还额外增加了一个维度,即搜索结果的可信赖性。对某个搜索结果,传统的结果可能成千上万,但如果处于用户社交网络内其他用户发布的信息、点评或验证过的信息则更容易信赖,这是与用户的心里密切相关的。社会化搜索为用户提供更准确、更值得信任的搜索结果。
" J* w/ ^+ w* U
1 m7 f- I- Y, G5 b$ p国外的dogpile等元搜索引擎能够得到发展和壮大,主要得益于国外传统搜索过多,并且企业实现共赢的理念,但在中国更多的人思考的是如何把所有资源都 掌握在自己手中,百度,google,yahoo是不会看着自己在未来发展中落伍,成为跟潮人,现在这几家都在不断丰富自己的产品线,并且触及社会化搜索,来保证自己在这个行业中的地位。
* c& u" ^- A0 Z1 ~" t" @+ n8 N
1 s2 M7 h4 [ H8 y2,实时搜索
0 D2 T- L- o! ~" W- L" p1 c- I/ d9 y/ Z- s+ ~3 c
随着微博的个人媒体平台兴起,对搜索引擎的实时性要求日益增高,我想这也是搜索时引擎未来的一个发展方向。) p/ L: F9 I9 }- Z' i
2 M! i6 _% f6 m$ I3 v& i3 d* g. u3 @百度也推出过实时搜索,搜索方法:
# G5 D0 v( X% z$ r' |0 D7 C( B1 j% V9 q/ c l- U% y. c
浏览器中输入http://www.baidu.com/s?rtt=2&tn=baiduwb&wd=【关键字】) M1 m/ f( G1 m5 E0 C
: A; p, ?; G5 ^5 _ V
实时搜索最突出的特点是时效性强,越来越多的突发事件首次发布在微博上,实时搜索核心强调的就是“快”,用户发布的信息第一时间能被搜索引擎搜索到。2 Q9 Q! w6 H4 K3 k' S5 p3 H8 d) L5 k
# _2 C9 F5 L( q# _6 X* h! l
不过在国内,实时搜索由于各方面的原因无法普及使用,比如Google的实时搜索是被重置的,百度也没有明显的实时搜索入口。
( v, J0 {/ ?. O, Q# A* N: Y5 \& g! X1 J3 G/ V6 z9 n* e
3,移动搜索- Q8 i9 T6 s5 x$ l9 M
# Z1 j, F1 t* p$ i G; f) N随着智能手机的快速发展,基于手机的移动设备搜索日益流行,但移动设备有很大的局限性,比如屏幕太小,可显示的区域不多,计算资源能力有限,打开网页速度很慢,手机输入繁琐等问题都需要解决。( ?# d- e( }4 h( F
2 v( i5 t# G1 l
目前,随着智能手机的快速普及,移动搜索一定会更加快速的发展,所以移动搜索的市场占有率会逐步上升,而对于没有移动版的网站来说,百度也提供了“百度移动开放平台”来弥补这个缺失。4 A4 d. W& E7 H8 K8 @8 O
7 v. k- k; o6 ]( M# G' j0 B! o2 Y4,个性化搜索. E/ d/ I$ {# [& O8 f# N
/ e; o# o/ ~6 d+ s' Q" w; }个性化搜索主要面临两个问题:如何建立用户的个人兴趣模型?在搜索引擎里如何使用这种个人兴趣模型。0 A6 H2 x k6 p: A
, _( g' F8 J& r. g6 v
个性化搜索的核心是根据用户的网络行为,建立一套准确的个人兴趣模型。而建立这样一套模型,就要全民收集与用户相关的信息,包括用户搜索历史、点击记录、浏览过的网页、用户email信息、收藏夹信息、用户发布过的信息、博客、微博等内容。比较常见的是从这些信息中提取出关键词及其权重。9 [; a3 t* _: d' \% E/ Z# C5 N
5 D$ O9 `; z2 ?( J
为不同用户提供个性化的搜索结果,是搜索引擎总的发展趋势,但现有技术有很多问题,比如个人隐私的泄露,而且用户的兴趣会不断变化,太依赖历史信息,可能无法反映用户的兴趣变化。" `' B8 W7 D; n% |1 N) r _0 G0 F
5 ~ Q, N) I1 ?9 r5 Z; N) B
5,地理位置感知搜索
" X; R) L6 s( m7 y$ @7 `
0 I/ I2 V: g4 v" Z目前很多手机已经有GPS的应用了,这是基于地理位置感知的搜索,而且可以通过陀螺仪等设备感知用户的朝向,基于这种信息,可以为用户提供准确的地理位置服务以及相关搜索服务。目前此类应用已经大行其道,比如手机地图app。
* S: X& R; r6 t9 b+ D; Z* H
: E9 a0 j6 m' q" X& W; b' A6,跨语言搜索
: M8 \% P" J/ H Z0 ]/ L2 y( C8 e) V6 K4 r+ w7 w
这方面做的最好的是Google,Google目前已经提供多种语言之间的跨语言搜索,比如我搜“麻省理工”排在第一位的则是麻省理工学院的主页。5 W3 c% Z+ S4 d+ t/ s
如何将中文的用户查询翻译为英文查询,目前主流的方法有3种:机器翻译、双语词典查询和双语语料挖掘方法。对于一个全球性的搜索引擎来说,具备跨语言搜索功能是必然的发展趋势,而其基本的技术路线一般会采用查询翻译加上网页的机器翻译这两种技术手段。
/ B) e' {1 L7 K1 x( t% Q* u
% V1 X; _( ^2 J& P( `7,多媒体搜索5 K# h; w* d$ }
$ J5 ^+ Y8 M' ?3 e* n9 d; V! [目前搜索引擎的查询还是基于文字的,即使是图片和视频搜索也是基于文本方式。那么未来的多媒体搜索技术则会弥补查询这一缺失。多媒体形式除了文字,主要包括图片、音频、视频。$ M E [1 a- {3 c6 s$ x' D
; m6 Z+ g- o9 H( P, _! Q多媒体搜索比纯文本搜索要复杂许多,一般多媒体搜索包含4个主要步骤:多媒体特征提取、多媒体数据流分割、多媒体数据分类和多媒体数据搜索引擎。
- q/ L0 J( j$ z0 l6 D- j( K, m( n. Z; K! Y- c
例如图片搜索,一般的步骤为:第一步,缩小尺寸。第二步,简化色彩。第三步,计算平均值。第四步,比较像素的灰度。第五步,计算哈希值。(详情可参见Google图片搜索的原理一文)。8 h2 m0 x8 M+ b9 i/ Z. O4 s7 _
0 v% n7 }( E8 }4 j% @9 i% I
8,情境搜索
$ U8 {6 {' f( a5 H* C3 C
$ I# R2 G: B4 k, F ?6 q$ K a情境搜索是融合了多项技术的产品,上面介绍的社会化搜索、个性化搜索、地点感知搜索等都是支持情境搜索的,目前Google在大力提倡这一概念。
2 P8 Q8 e& H v7 y9 n! ~+ R
# L, N# K3 C* Y$ r7 x, ]1 T所谓情境搜索,就是能够感知人与人所处的环境,针对“此时此地此人”来建立模型,试图理解用户查询的目的,根本目标还是要理解人的信息需求。比如某个用户在苹果专卖店附近发出“苹果”这个搜索请求,基于地点感知及用户的个性化模型,搜索引擎就有可能认为这个查询是针对苹果公司的产品,而非对水果的需求。4 ]! R5 q* T* ^, ]( j( u- E
$ Y4 h/ e; P' D& @1 i5 q2 ]
写在最后:
4 e) ^# g6 i2 C% S8 f; ?; X( O本文介绍了搜索引擎未来发展的8个趋势,无论是个性化搜索、实时搜索、社会化搜索、地理感知搜索、多媒体搜索、跨语言搜索。我们都能看出,搜索引擎是在不断揣摩人的心里,满足网民的需求而发展的,那么你的网站呢?
3 w: O$ L6 x% m, {; O# O6 A4 E |