内容导读:最近看到360搜索(好搜)一个功能在内测中,就去看了下官方文档,没想到是一个对大家很有用的一个工具——图搜众包,这里给大家提前预告一下。) z1 k$ R1 @9 [- w: N' k4 r; t8 V
( D0 b0 i3 V4 C# W$ |一、众包介绍 1、众包是什么?* P$ `" }5 G3 |8 m. |
! [7 }" h) x/ L; e3 D众包是一种可以让站长直接向搜索引擎提交数据的系统。9 l+ q( k' ?, p2 c
通过众包,站长可以提交的结构化数据,数据在经过审核后,会在搜索结果中优先展示。
# Q$ g- G3 l3 E) q5 o/ r$ v" H. ~" @9 D+ Z C, d0 h. h4 r& X
2、众包有什么优势?$ h; d/ P1 ?7 Y! }+ e/ ~0 z) |1 E
; g, ]9 L% e/ T5 K j" B" x" |( U, Z
普通的数据收录,只能保证数据被引擎抓取入库,并不一定能保证上线;即使上线后,由于许多历史特征的缺失,排序的位置也会很靠后,甚至都不展示。4 D4 K6 T: ]2 o5 Y/ L
通过图搜众包进行数据收录后,由于数据会经过人工审核,审核通过的数据即被认定为优质数据,在排序时会给予较高的权重,优先展现在比较靠前的位置。
' h( y, S% ]: X" t! a" V$ E% V" [! d( K ?( P
3、需要站长做什么?: _. Y0 h6 l }9 t: G m; Y3 ?
. n9 t* i- K1 T6 X% e: T0 V根据帮助文档,生成结构化的优质数据,并提交到众包平台,等待审核通过后,即可上线查看效果。- k( {& M% h; }8 v0 p6 n% @+ _- V
" j3 {# x" @. f/ `
4、线上效果展示范例$ g, t" ?9 z% o# b
* Z2 B, O/ S4 ?/ P7 }1、 查询接入词和TAG8 u) V, t; K& }' z; j; Q
4 Z4 O" J7 q& P c. o1 D& ]8 g+ a* m8 R: {* r9 }* C, G6 k0 m9 z V
众包数据是以搜索词为单位进行接入的,所以第一步,需要查看能够接入的搜索词和TAG列表,不在系统中的搜索词是不能进行接入的,同样的对于一个搜索词,不在列表中的TAG也是不能进行接入的。
/ e- [$ Z7 A6 i, Y, ]9 e0 y9 v: I$ N0 Q$ M5 E( o/ r' o' i5 B
查询系统提供以分类进行查询的方式,不同的分类的TAG列表也不同,选择本站擅长的类别数据进行接入,能提高审核通过率,审核率高的站点会进入先上线再审核的绿色通道。2 V2 w. x" j" q9 w( Y: u* ^" Z
. H/ V2 w: A2 E# }1 ], N2 N详细的数据接入格式,请参照文档的第三部分《提交数据规范》。. n# B" i! ~/ L
% B. y# y' e; z* k& {. g0 b0 i2、 提交数据' d: N( e1 ~" X: J
数据提交时,由于格式不对,数据不符,Query和TAG不在列表中等原因出错,以下是一些常见的错误提示(仅供参考,以系统提示为准)。2 C: z' Z5 w' Q, C) z! O
3 h6 J8 O$ I4 U
- “文件上传成功”——表示数据已经成功提交。
- q0 m5 t* ^' U* @0 T+ E1 [- J' O# k - “XML解析错误”——上传文件非XML文件。& T6 m0 c& E1 k
- “找不到查询词”——接入的Query并非众包系统开放出去的Query,可以接入哪些Query可以在上一步查询到。* u8 V- ?8 h# q& a* Y6 F$ T
- “查询词已经重复添加”——接入的Query已经被其他站上传数据。# O& C1 ?# R8 C
- “找不到标签名”——接入的某个Query的标签不是预定义的TAG,每类Query的TAG列表可以在上一步通过系统查询到。
- b. p! y. s- {! ~( I+ X - “一个或多个查询词为空”——接入的某个Query为空。
& W1 u- I' @6 E, S3 Q0 s' B - “一个或多个标签名为空”——接入的某个Query的某个标签为空。, i8 }+ g1 a4 j. [
- “一个或多个图片地址、标题、源站url为空”——接入的数据中某个图片的关键字段为空。
& O+ J0 T$ H# k+ b. } - “图片个数超过最大上传图片数”——每个Query的标签下,接入的图片数最大为100,超过这个值会报错。
. r% ?$ S$ x! M - “没有上传XML文件”——上传的文件为空,即没有找到上传的文件“XML文件解析失败”——上传的文件为XML文件,但是不符合规范要求。
+ F* a. x! M, u: I9 b; k 3、 查看审核情况
9 ~( k0 `+ i6 f7 V! D5 o3 D2 u2 @" Q
5 f( [, t; s+ u2 E0 ~% s @8 v# `# c" N* `$ q& L
提交成功的数据首先会进入到“待审核数据”的序列。
8 s8 t2 H+ t7 h! q如果审核通过,会进入到“已审核数据”序列,(审核需要一定时间,请耐心等候。);如果已审核过的数据,进入线上系统,“是否上线”这一列就会变成“是”。(上线需要进行图片抓取,如果图片已经通过审核2-3天还未上线,请check下网站是否有抓取限制,或者联系相关人员。)
% o; U" _/ K) L& f W& |如果上线的数据因为某些原因被下线,则数据会进入到“已下线数据”的序列中。3 z$ B G' ~& Q4 T
如果审核未通过,会进入到“未通过审核数据”序列,该页面会列举出审核未通过的详细原因。: l1 Y E3 z5 u, x" F" K# m
常见的审核不通过的错误原因(仅供参考,以系统提示为准)。
9 Q$ r; a' H: r1 s; b! y! H7 o, s, y4 c8 {% Q) d* B8 ]1 w* }
- “数量少于标准”——每个Query的每个Tag下至少需要20张图片,太少会被审核不通过。
* r4 M3 o F! _- R5 Q4 Q - “图片分辨率低”——上传的图片的尺寸过小。' r+ e* m7 T0 j
- “图片质量模糊”——上传的图片比较模糊,清晰度不高。
5 _8 F6 u1 [9 ]" U8 j# I - “数据与关键词不匹配”——图片和Query词不相关。
+ f( u: H: N/ I, s0 i8 L! F - “数据与分类词不匹配”——图片和Query的TAG不相关。
: O+ a/ r( C& h. I6 h& G; ^; E( Y O. t+ q& i - “与线上数据重复”——图片大面积和已有的线上数据重复。+ @6 z! V$ T/ U) B
- “水印太大”——图片的水印过大,影响浏览体验。“其他原因”——其他的未定义的原因。
/ }: p7 y* H/ j% ] L 详细见另外一篇:图搜众包收录文档-引擎(360图片)0 H) O/ y+ {& E' \& o: l$ g
(搜外论坛首发)原文出处链接:http://seo论坛whyshuoseo站长论坛/zzpt/307.html
9 e2 p) |: K3 E s( [- {3 j( B搜外论坛原创作者:江云IVEN% Z) D* R) W- T1 X5 r% c- V
日期:2015.2.5 |
|