内容导读:最近看到360搜索(好搜)一个功能在内测中,就去看了下官方文档,没想到是一个对大家很有用的一个工具——图搜众包,这里给大家提前预告一下。
7 y5 A' ]4 I) [9 X) m: N- _9 n8 @1 \" I
一、众包介绍 1、众包是什么?/ y* ^% `7 a& v
$ x: {% h8 i. e L众包是一种可以让站长直接向搜索引擎提交数据的系统。; z9 I$ D" p7 |( X% U1 I$ ~
通过众包,站长可以提交的结构化数据,数据在经过审核后,会在搜索结果中优先展示。
1 _- O" e) x& n/ n( z+ x# S$ m5 U& B& E! z$ ]( S8 E: V/ O
2、众包有什么优势?
4 Y+ ?' m0 t. E9 k$ h4 b: I
, M7 U" x7 W. D3 z5 T普通的数据收录,只能保证数据被引擎抓取入库,并不一定能保证上线;即使上线后,由于许多历史特征的缺失,排序的位置也会很靠后,甚至都不展示。' I: p4 K5 N2 {2 s4 i
通过图搜众包进行数据收录后,由于数据会经过人工审核,审核通过的数据即被认定为优质数据,在排序时会给予较高的权重,优先展现在比较靠前的位置。. B$ Y Y5 K6 \6 C% q
" G( }# @; w1 J& T' G# ]
3、需要站长做什么?
3 \6 H! X$ Q* ]: _. ~4 {: U
. P2 z0 Y! {, Z* P; Y. X- ?7 R根据帮助文档,生成结构化的优质数据,并提交到众包平台,等待审核通过后,即可上线查看效果。# {% ]8 \7 R$ ?5 c" j( J
+ f" q. c% Q( ]; A
4、线上效果展示范例 c* l: P. Z2 O
' M6 O- U: K9 m r4 J5 l# }. L7 a/ k0 w
1、 查询接入词和TAG
5 Q& M9 B' V% g2 ]; Q2 J) k* ?6 l9 K- u0 H( b$ B, R% g
6 V7 O j% d" k
众包数据是以搜索词为单位进行接入的,所以第一步,需要查看能够接入的搜索词和TAG列表,不在系统中的搜索词是不能进行接入的,同样的对于一个搜索词,不在列表中的TAG也是不能进行接入的。
/ Z, q( _% a1 b1 T/ f" R
/ e) X) C. `# X: Q查询系统提供以分类进行查询的方式,不同的分类的TAG列表也不同,选择本站擅长的类别数据进行接入,能提高审核通过率,审核率高的站点会进入先上线再审核的绿色通道。3 d: _ y- X$ [& r
8 T& |( S0 s" S! ~
详细的数据接入格式,请参照文档的第三部分《提交数据规范》。
% e& Z8 B/ F, ?! n1 d2 r& A* U0 S* C8 C
2、 提交数据
% m' b$ n( L. Q* {4 I( h数据提交时,由于格式不对,数据不符,Query和TAG不在列表中等原因出错,以下是一些常见的错误提示(仅供参考,以系统提示为准)。
* W3 W7 u/ Q; }9 f& W% s$ i5 z
: S+ _- G- s( s6 F# g Y1 X- “文件上传成功”——表示数据已经成功提交。
$ K2 j' W/ r u' }. T9 H - “XML解析错误”——上传文件非XML文件。! Q4 a* L% B. D- }: J
- “找不到查询词”——接入的Query并非众包系统开放出去的Query,可以接入哪些Query可以在上一步查询到。
4 P7 L9 K' d, J+ g1 K - “查询词已经重复添加”——接入的Query已经被其他站上传数据。/ p! x( k# j' B! F/ Y2 J4 [
- “找不到标签名”——接入的某个Query的标签不是预定义的TAG,每类Query的TAG列表可以在上一步通过系统查询到。
6 {7 f0 t; x- C! I; b - “一个或多个查询词为空”——接入的某个Query为空。5 x7 x; s2 a' B& Y
- “一个或多个标签名为空”——接入的某个Query的某个标签为空。# u- V5 u$ Q6 z, `
- “一个或多个图片地址、标题、源站url为空”——接入的数据中某个图片的关键字段为空。( n) q. J! m8 c# X. N8 S
- “图片个数超过最大上传图片数”——每个Query的标签下,接入的图片数最大为100,超过这个值会报错。
6 _$ s6 z5 B- i - “没有上传XML文件”——上传的文件为空,即没有找到上传的文件“XML文件解析失败”——上传的文件为XML文件,但是不符合规范要求。
6 x% h2 U1 j" T9 E+ \7 s 3、 查看审核情况& f! v$ D) ~4 P8 O. L X0 E
) P$ j% v# x! N. k# B9 \ {
; j% }2 U! } w% B' x5 H
提交成功的数据首先会进入到“待审核数据”的序列。
0 d' g; ?7 M7 t# f6 K如果审核通过,会进入到“已审核数据”序列,(审核需要一定时间,请耐心等候。);如果已审核过的数据,进入线上系统,“是否上线”这一列就会变成“是”。(上线需要进行图片抓取,如果图片已经通过审核2-3天还未上线,请check下网站是否有抓取限制,或者联系相关人员。)
4 n3 c1 D9 K% w8 P如果上线的数据因为某些原因被下线,则数据会进入到“已下线数据”的序列中。
# V5 u" Z; i! M: K1 [! J* o如果审核未通过,会进入到“未通过审核数据”序列,该页面会列举出审核未通过的详细原因。
A) R. M. ^1 H常见的审核不通过的错误原因(仅供参考,以系统提示为准)。) s/ p! V' B1 p7 I8 ]% L# O% i
8 T' y( Z3 t" l( f' |" G
- “数量少于标准”——每个Query的每个Tag下至少需要20张图片,太少会被审核不通过。
8 L2 n2 H5 D }4 \0 U! d - “图片分辨率低”——上传的图片的尺寸过小。5 Z; M" ^ u( M4 q2 B6 F0 }
- “图片质量模糊”——上传的图片比较模糊,清晰度不高。
* c! [- w% R& b9 C# Q) [! _' p - “数据与关键词不匹配”——图片和Query词不相关。0 D6 U o x$ P. z6 R. b/ Q; n3 ?
- “数据与分类词不匹配”——图片和Query的TAG不相关。
e/ e( c% V. `, l% F) Q+ f - “与线上数据重复”——图片大面积和已有的线上数据重复。& S. u: B8 @! r& q0 ]$ R' X
- “水印太大”——图片的水印过大,影响浏览体验。“其他原因”——其他的未定义的原因。
) V) O+ _8 B4 y) [1 Y$ p9 { 详细见另外一篇:图搜众包收录文档-引擎(360图片)
4 A1 {+ l. X4 B" S(搜外论坛首发)原文出处链接:http://seo论坛whyshuoseo站长论坛/zzpt/307.html) q0 K* E" u1 c- O6 t
搜外论坛原创作者:江云IVEN! B0 _' E' d( H; H
日期:2015.2.5 |