内容导读:最近看到360搜索(好搜)一个功能在内测中,就去看了下官方文档,没想到是一个对大家很有用的一个工具——图搜众包,这里给大家提前预告一下。0 l. Y( a! ~! }4 G
0 ~& ]8 t/ ^! n' _/ c# S I. @一、众包介绍 1、众包是什么?; X* i" Y7 g% q b- q- C7 X
& B8 I: N# k! A, Z1 m3 w5 q: j% N/ a众包是一种可以让站长直接向搜索引擎提交数据的系统。
' L% _$ m3 J9 i# J3 J通过众包,站长可以提交的结构化数据,数据在经过审核后,会在搜索结果中优先展示。
- ^) D; q/ ^8 X f
% Z+ Q5 ^: `0 b* h2、众包有什么优势?
5 r! C5 n* s. S% }% A, _
& P' i3 U- n3 L0 `* S( I) a# L普通的数据收录,只能保证数据被引擎抓取入库,并不一定能保证上线;即使上线后,由于许多历史特征的缺失,排序的位置也会很靠后,甚至都不展示。5 v5 l7 t2 Y( p
通过图搜众包进行数据收录后,由于数据会经过人工审核,审核通过的数据即被认定为优质数据,在排序时会给予较高的权重,优先展现在比较靠前的位置。" d7 k4 c0 G; r- q* R* J9 \
; m5 M" f7 g5 f/ ~3、需要站长做什么?
, D8 a: \; g% r5 @9 C$ j5 M' h8 `9 x( ]& F% \1 w+ h
根据帮助文档,生成结构化的优质数据,并提交到众包平台,等待审核通过后,即可上线查看效果。
+ o, `7 b5 D, P' x3 ^) o4 T
0 x& c9 ~# W. l4、线上效果展示范例
* G& w' v& _0 b. Y) d6 S" n7 f# U5 Y/ Y* y. A! p6 o$ H: n
1、 查询接入词和TAG* A! U" I# I/ R1 L8 U% R7 N
B7 O1 U% I! g, A
& X/ m2 `8 }, E% M众包数据是以搜索词为单位进行接入的,所以第一步,需要查看能够接入的搜索词和TAG列表,不在系统中的搜索词是不能进行接入的,同样的对于一个搜索词,不在列表中的TAG也是不能进行接入的。1 g% R$ ^) ~7 d+ u
1 W1 B5 ^4 R4 z; U
查询系统提供以分类进行查询的方式,不同的分类的TAG列表也不同,选择本站擅长的类别数据进行接入,能提高审核通过率,审核率高的站点会进入先上线再审核的绿色通道。2 [, y4 D- `! r" e. E: |: s6 m' O8 @
! c$ h) Y9 v2 @
详细的数据接入格式,请参照文档的第三部分《提交数据规范》。5 f/ M4 o( [' I1 i
* J5 w. L7 Y7 f$ Z6 S! J7 q( i
2、 提交数据
5 _& L) y# l- k0 Y: v数据提交时,由于格式不对,数据不符,Query和TAG不在列表中等原因出错,以下是一些常见的错误提示(仅供参考,以系统提示为准)。
$ U( Y6 ?; { X+ x F3 d6 Q( E8 J h( d/ d1 e: n" e
- “文件上传成功”——表示数据已经成功提交。+ w9 Z# y3 @2 y& P. i: K7 a' p
- “XML解析错误”——上传文件非XML文件。5 \5 |/ ~- P; N# ^5 o0 ?
- “找不到查询词”——接入的Query并非众包系统开放出去的Query,可以接入哪些Query可以在上一步查询到。) o( v% }' Z! s, M
- “查询词已经重复添加”——接入的Query已经被其他站上传数据。7 Z: r$ x+ z' J; Y; L* t8 W2 \9 g
- “找不到标签名”——接入的某个Query的标签不是预定义的TAG,每类Query的TAG列表可以在上一步通过系统查询到。$ |2 ]- X( l9 ^& a' a& q l% `. M
- “一个或多个查询词为空”——接入的某个Query为空。
- z4 T6 w/ H. E% C' B: D - “一个或多个标签名为空”——接入的某个Query的某个标签为空。
: P) m: R+ }: _( m9 f - “一个或多个图片地址、标题、源站url为空”——接入的数据中某个图片的关键字段为空。
8 d) g1 i1 d( _8 ? - “图片个数超过最大上传图片数”——每个Query的标签下,接入的图片数最大为100,超过这个值会报错。$ u( z* F F1 p# a. y8 ?
- “没有上传XML文件”——上传的文件为空,即没有找到上传的文件“XML文件解析失败”——上传的文件为XML文件,但是不符合规范要求。2 }; l$ y, }1 j* e9 z
3、 查看审核情况: `0 J! r: p, i$ `$ P" u R1 h
6 K$ \" Y! x) d2 k3 R
: \# D# Y0 W+ _) S9 k8 z提交成功的数据首先会进入到“待审核数据”的序列。' O* l b$ F9 }' T2 x
如果审核通过,会进入到“已审核数据”序列,(审核需要一定时间,请耐心等候。);如果已审核过的数据,进入线上系统,“是否上线”这一列就会变成“是”。(上线需要进行图片抓取,如果图片已经通过审核2-3天还未上线,请check下网站是否有抓取限制,或者联系相关人员。); [0 D4 v( }; S0 l2 U" g/ U
如果上线的数据因为某些原因被下线,则数据会进入到“已下线数据”的序列中。
" Y& C( W/ G3 I% `+ t% s. I如果审核未通过,会进入到“未通过审核数据”序列,该页面会列举出审核未通过的详细原因。9 z/ i3 a8 e5 H1 ~: I
常见的审核不通过的错误原因(仅供参考,以系统提示为准)。* s3 O P6 v: i. Z# a
& f' g' Q( A1 ]1 e! i1 L- “数量少于标准”——每个Query的每个Tag下至少需要20张图片,太少会被审核不通过。& K; X( D0 q8 m. m3 u6 m" @
- “图片分辨率低”——上传的图片的尺寸过小。# g( e( {( Z' I$ G& w. Z
- “图片质量模糊”——上传的图片比较模糊,清晰度不高。
( }) ?; z4 o8 B3 S( G3 x( R) s - “数据与关键词不匹配”——图片和Query词不相关。- B$ R% r, w( x- t% j; g* p4 s) O
- “数据与分类词不匹配”——图片和Query的TAG不相关。' h% k( V, {8 i1 U. d# b+ D- x+ H
- “与线上数据重复”——图片大面积和已有的线上数据重复。
^" W' W1 E" m - “水印太大”——图片的水印过大,影响浏览体验。“其他原因”——其他的未定义的原因。
% ?5 G# D5 H3 W9 E 详细见另外一篇:图搜众包收录文档-引擎(360图片)7 X2 U. O' H8 f0 r
(搜外论坛首发)原文出处链接:http://seo论坛whyshuoseo站长论坛/zzpt/307.html9 I2 z! s, D% R) } e- ?$ m
搜外论坛原创作者:江云IVEN6 w8 o* k: P2 K; S9 i9 n
日期:2015.2.5 |