内容导读:最近看到360搜索(好搜)一个功能在内测中,就去看了下官方文档,没想到是一个对大家很有用的一个工具——图搜众包,这里给大家提前预告一下。$ X _/ J0 @5 {& v0 W5 o
. q; m' t! X' s7 T- p# P一、众包介绍 1、众包是什么?
( T& q, z# I. O- {& P/ f9 ~+ E' w: p, q, I$ ]- o+ E6 v' U/ u \
众包是一种可以让站长直接向搜索引擎提交数据的系统。
5 N& z# t- c0 J: o. S8 \$ ]通过众包,站长可以提交的结构化数据,数据在经过审核后,会在搜索结果中优先展示。
) w D/ V2 P* T( b% {( G3 c; W& y+ T( w9 j H
2、众包有什么优势?
0 V' p7 N' f+ H( [7 j+ x8 q3 k" h/ M/ h2 Y6 |0 x* c' h
普通的数据收录,只能保证数据被引擎抓取入库,并不一定能保证上线;即使上线后,由于许多历史特征的缺失,排序的位置也会很靠后,甚至都不展示。) b$ F8 Q7 H' j; U/ |/ D
通过图搜众包进行数据收录后,由于数据会经过人工审核,审核通过的数据即被认定为优质数据,在排序时会给予较高的权重,优先展现在比较靠前的位置。
8 J4 C# B' }0 k$ W( H. s+ k* G- R, l G
3、需要站长做什么?6 w, [$ \: ]6 a1 D) o4 D
2 J6 ^, G0 K6 N2 x1 \
根据帮助文档,生成结构化的优质数据,并提交到众包平台,等待审核通过后,即可上线查看效果。
6 J; f+ `' U! v4 H7 F1 T+ @0 Y4 s1 b$ ?9 Q
4、线上效果展示范例6 L* r m& u: R. X) Z/ N, _3 @0 G7 F
1 M3 T ?. ~8 { \1、 查询接入词和TAG
: O7 _. h4 }7 [8 l7 h0 Y4 i. k, y
3 Q, w! k# x$ W% s6 c众包数据是以搜索词为单位进行接入的,所以第一步,需要查看能够接入的搜索词和TAG列表,不在系统中的搜索词是不能进行接入的,同样的对于一个搜索词,不在列表中的TAG也是不能进行接入的。
/ S1 [: X3 J: y% I
6 N P7 q. O4 |) L( M' q! E1 r查询系统提供以分类进行查询的方式,不同的分类的TAG列表也不同,选择本站擅长的类别数据进行接入,能提高审核通过率,审核率高的站点会进入先上线再审核的绿色通道。/ T3 P4 M6 J9 }% z
* a# _* A v( u9 \0 W2 m$ {4 {+ N详细的数据接入格式,请参照文档的第三部分《提交数据规范》。$ }* k6 p5 `# J
4 q% X: @ Y) I( k. N
2、 提交数据
+ }2 J4 V: \9 u4 F, a1 ~& Z9 V) C数据提交时,由于格式不对,数据不符,Query和TAG不在列表中等原因出错,以下是一些常见的错误提示(仅供参考,以系统提示为准)。9 D* d# x+ Q6 N. ^/ L$ j; |; w
/ L+ W8 r6 O B5 M+ G# f( i$ R- “文件上传成功”——表示数据已经成功提交。2 n# L7 f$ p2 ?* o. x- Z" m( {- t
- “XML解析错误”——上传文件非XML文件。
5 ~( z) r- C4 h" J0 c$ A2 D - “找不到查询词”——接入的Query并非众包系统开放出去的Query,可以接入哪些Query可以在上一步查询到。
# L4 v) D8 x5 ~9 S5 |2 I6 | - “查询词已经重复添加”——接入的Query已经被其他站上传数据。
* l* k: I1 R/ q+ e g - “找不到标签名”——接入的某个Query的标签不是预定义的TAG,每类Query的TAG列表可以在上一步通过系统查询到。
2 @6 t) Q' G' a) D - “一个或多个查询词为空”——接入的某个Query为空。
* a! [& f+ e! M( m' L0 f8 s4 p - “一个或多个标签名为空”——接入的某个Query的某个标签为空。
( t7 u. `3 S: ^% \ - “一个或多个图片地址、标题、源站url为空”——接入的数据中某个图片的关键字段为空。, A. P9 S8 ~% e. R1 X' |- X
- “图片个数超过最大上传图片数”——每个Query的标签下,接入的图片数最大为100,超过这个值会报错。
) |9 I' h7 a2 S) } - “没有上传XML文件”——上传的文件为空,即没有找到上传的文件“XML文件解析失败”——上传的文件为XML文件,但是不符合规范要求。
, A. ]/ t6 I# i3 J9 f9 o2 t 3、 查看审核情况
9 E/ q) G' | l7 t. G" ^+ v' u
/ @* }, Y/ \. X: u' [- a: V4 w) C7 h( R+ _- K! r4 y3 y6 B
提交成功的数据首先会进入到“待审核数据”的序列。
5 C, n; G" i# k5 n! N- P如果审核通过,会进入到“已审核数据”序列,(审核需要一定时间,请耐心等候。);如果已审核过的数据,进入线上系统,“是否上线”这一列就会变成“是”。(上线需要进行图片抓取,如果图片已经通过审核2-3天还未上线,请check下网站是否有抓取限制,或者联系相关人员。)" V' I4 u3 K: E* A9 a6 j* N; F& @
如果上线的数据因为某些原因被下线,则数据会进入到“已下线数据”的序列中。
, B# F0 Z9 M- c( c! G如果审核未通过,会进入到“未通过审核数据”序列,该页面会列举出审核未通过的详细原因。3 Z) v# I3 `* O. g$ C3 ?
常见的审核不通过的错误原因(仅供参考,以系统提示为准)。
1 X1 s$ M! {( |( A! v$ B% g) W9 O
2 B! A4 q7 Q5 L& }( o- “数量少于标准”——每个Query的每个Tag下至少需要20张图片,太少会被审核不通过。# a; Z+ _, M' _$ @1 a$ U6 x0 [5 ]; F
- “图片分辨率低”——上传的图片的尺寸过小。7 I0 [+ q% R/ A6 i' R a. y
- “图片质量模糊”——上传的图片比较模糊,清晰度不高。* a* [1 _! W- x( n7 t6 e
- “数据与关键词不匹配”——图片和Query词不相关。- \8 v# ] ^: ~ {
- “数据与分类词不匹配”——图片和Query的TAG不相关。
0 P, \( q" [% m" V4 Q - “与线上数据重复”——图片大面积和已有的线上数据重复。2 @& Y. h4 ~: g' K
- “水印太大”——图片的水印过大,影响浏览体验。“其他原因”——其他的未定义的原因。
0 f9 p6 t. q: {! L 详细见另外一篇:图搜众包收录文档-引擎(360图片)( }0 ~. D5 L. B
(搜外论坛首发)原文出处链接:http://seo论坛whyshuoseo站长论坛/zzpt/307.html& G; S2 a+ e" B! A9 v- ~6 o
搜外论坛原创作者:江云IVEN
. ^) q/ X; x! e3 Z% R) i- B日期:2015.2.5 |