内容导读:最近看到360搜索(好搜)一个功能在内测中,就去看了下官方文档,没想到是一个对大家很有用的一个工具——图搜众包,这里给大家提前预告一下。
+ I& {8 p2 q" D0 F; y" W- ~6 s; z+ U* Q
一、众包介绍 1、众包是什么?$ Q0 G9 _9 y q) M, ^) G; C
$ z8 h$ o; `4 d1 U众包是一种可以让站长直接向搜索引擎提交数据的系统。
7 p& M9 v1 S, `3 V, `5 J8 x通过众包,站长可以提交的结构化数据,数据在经过审核后,会在搜索结果中优先展示。$ G5 M0 \- j) G( ^! W8 c
0 p& I. j9 p# L6 @- L7 N2、众包有什么优势?9 U1 V( I: [. k3 R! ?8 ~
0 W5 k+ E7 v+ }" ]0 u
普通的数据收录,只能保证数据被引擎抓取入库,并不一定能保证上线;即使上线后,由于许多历史特征的缺失,排序的位置也会很靠后,甚至都不展示。/ Q+ r% O! U# R0 p7 O T5 ]
通过图搜众包进行数据收录后,由于数据会经过人工审核,审核通过的数据即被认定为优质数据,在排序时会给予较高的权重,优先展现在比较靠前的位置。0 H% ~7 D" c2 O+ s& X8 E
; K y% ^7 k( H- x3、需要站长做什么?0 m9 `- P8 c2 B
% M6 Y# I2 T5 S/ u, H
根据帮助文档,生成结构化的优质数据,并提交到众包平台,等待审核通过后,即可上线查看效果。, s* z! z: a# U. t
: j$ h. e r0 L6 O7 c7 r
4、线上效果展示范例
6 \0 b( c7 m% O+ u5 ~( f/ Z) n k& a# y+ ?
1、 查询接入词和TAG
2 m/ E l! [ Y" z5 [6 {1 ?* L; E( G. q1 e, g) D" H
: M( P& h8 W9 O, ~' a+ B
众包数据是以搜索词为单位进行接入的,所以第一步,需要查看能够接入的搜索词和TAG列表,不在系统中的搜索词是不能进行接入的,同样的对于一个搜索词,不在列表中的TAG也是不能进行接入的。
[ i* d" B) q7 I, u
5 O" v! f$ g" G6 Z& A8 }! x4 d6 D5 F0 X查询系统提供以分类进行查询的方式,不同的分类的TAG列表也不同,选择本站擅长的类别数据进行接入,能提高审核通过率,审核率高的站点会进入先上线再审核的绿色通道。
5 y; a( I( @& r# r9 D/ }* k& m6 e1 d
详细的数据接入格式,请参照文档的第三部分《提交数据规范》。
# D4 y8 ~ {. b. _6 e4 ]0 b3 [3 q5 J4 E4 y% J
2、 提交数据
4 d6 t3 l6 D9 R; Y' V数据提交时,由于格式不对,数据不符,Query和TAG不在列表中等原因出错,以下是一些常见的错误提示(仅供参考,以系统提示为准)。
7 |1 e) h$ o1 j! k" p% `
, P% j }- C4 P g) B- “文件上传成功”——表示数据已经成功提交。
. W0 Z, O6 ~9 m! g: }4 T5 U% } - “XML解析错误”——上传文件非XML文件。4 I5 k8 Q: Q! I: A f
- “找不到查询词”——接入的Query并非众包系统开放出去的Query,可以接入哪些Query可以在上一步查询到。
! d1 k( M! s$ i1 [ - “查询词已经重复添加”——接入的Query已经被其他站上传数据。
# L, u8 R& h8 l% k2 [# C) C R4 F! { - “找不到标签名”——接入的某个Query的标签不是预定义的TAG,每类Query的TAG列表可以在上一步通过系统查询到。
& R' G+ A7 g6 }( o/ d h' p - “一个或多个查询词为空”——接入的某个Query为空。 O" Q, B! v8 i! g* x$ K+ ^
- “一个或多个标签名为空”——接入的某个Query的某个标签为空。8 |* ?+ N ]1 P0 ]3 k7 w
- “一个或多个图片地址、标题、源站url为空”——接入的数据中某个图片的关键字段为空。 W# k$ B2 h8 c3 Y/ a- ]: K
- “图片个数超过最大上传图片数”——每个Query的标签下,接入的图片数最大为100,超过这个值会报错。
. D. h5 j6 d4 G% k& x$ B% n, f - “没有上传XML文件”——上传的文件为空,即没有找到上传的文件“XML文件解析失败”——上传的文件为XML文件,但是不符合规范要求。2 i: P7 |) N) Q
3、 查看审核情况
2 v( j) }! E0 e" Y& X: Q4 h. e) l G6 ~, A/ n8 S' D
; E% X. c5 F; u; G" e
提交成功的数据首先会进入到“待审核数据”的序列。
, j6 \: [1 }: q" Y( s! L. p如果审核通过,会进入到“已审核数据”序列,(审核需要一定时间,请耐心等候。);如果已审核过的数据,进入线上系统,“是否上线”这一列就会变成“是”。(上线需要进行图片抓取,如果图片已经通过审核2-3天还未上线,请check下网站是否有抓取限制,或者联系相关人员。)
' r5 O6 d5 X8 j4 y如果上线的数据因为某些原因被下线,则数据会进入到“已下线数据”的序列中。1 z! O5 E9 H) z2 z8 {) [( o
如果审核未通过,会进入到“未通过审核数据”序列,该页面会列举出审核未通过的详细原因。* ?5 {: ~$ c M! N# V$ H
常见的审核不通过的错误原因(仅供参考,以系统提示为准)。
0 T) N8 Q* T5 u5 l R7 A4 C
3 k6 h! _# p' N1 k- “数量少于标准”——每个Query的每个Tag下至少需要20张图片,太少会被审核不通过。; Y: l8 b$ o8 i
- “图片分辨率低”——上传的图片的尺寸过小。
1 o+ ?0 X7 [, R* Q( p - “图片质量模糊”——上传的图片比较模糊,清晰度不高。
. _/ |5 x* H3 {8 M: t. R, h9 o2 T: o - “数据与关键词不匹配”——图片和Query词不相关。
c5 C& ~( E6 }3 g1 H/ @* B9 _ - “数据与分类词不匹配”——图片和Query的TAG不相关。% u: t5 ^7 u) |+ j/ o5 S, W
- “与线上数据重复”——图片大面积和已有的线上数据重复。; }# C4 H. Y4 i2 p3 D& H- U( F( u' v
- “水印太大”——图片的水印过大,影响浏览体验。“其他原因”——其他的未定义的原因。
2 w! h7 Y0 t' P. w* X 详细见另外一篇:图搜众包收录文档-引擎(360图片)
( [, \, Q- R$ l. C; {" I& [7 n(搜外论坛首发)原文出处链接:http://seo论坛whyshuoseo站长论坛/zzpt/307.html: F9 u1 r$ D; x2 F# X
搜外论坛原创作者:江云IVEN
$ `/ b! G" L ?* x8 t8 p8 s8 w日期:2015.2.5 |