内容导读:最近看到360搜索(好搜)一个功能在内测中,就去看了下官方文档,没想到是一个对大家很有用的一个工具——图搜众包,这里给大家提前预告一下。& c+ z- o, A8 r
+ l8 U' Q: s; s) l; O一、众包介绍 1、众包是什么?
0 d% H2 j. i. z+ a& R& `
* @8 g" z7 i+ j- ~6 X7 l3 y2 g9 W众包是一种可以让站长直接向搜索引擎提交数据的系统。' Q4 @3 l( q, S; w* I$ r8 W& c1 ~
通过众包,站长可以提交的结构化数据,数据在经过审核后,会在搜索结果中优先展示。
9 O' {% `+ J+ a& S. ~; n3 d- }& ]2 n( X$ a8 G* r! }! h9 ]) _7 B" e, v
2、众包有什么优势?
8 f5 u# ~5 E/ I; a, M4 d% f
+ _. @" D# |! U0 t6 s普通的数据收录,只能保证数据被引擎抓取入库,并不一定能保证上线;即使上线后,由于许多历史特征的缺失,排序的位置也会很靠后,甚至都不展示。, a/ u7 v2 G+ G2 G0 Y. V, a
通过图搜众包进行数据收录后,由于数据会经过人工审核,审核通过的数据即被认定为优质数据,在排序时会给予较高的权重,优先展现在比较靠前的位置。0 y! q d# R0 C7 I
. o J& J& |& _8 O1 ?* ]- R8 A3、需要站长做什么?
+ V$ m) N/ b. w3 D* i# |8 ]; y ~/ {
根据帮助文档,生成结构化的优质数据,并提交到众包平台,等待审核通过后,即可上线查看效果。/ _4 u+ G8 k+ X! C, h
% C5 t1 [; z# h! E; ]9 q
4、线上效果展示范例
2 E; c. b% f: q' t4 h: F9 x; A$ w2 ]& ?+ v0 T
1、 查询接入词和TAG" s# T5 r8 {. |! c, W9 O, w2 h
# u1 P9 j) C6 b: q8 L W: j2 ]9 f( D* R" P9 Q* _
众包数据是以搜索词为单位进行接入的,所以第一步,需要查看能够接入的搜索词和TAG列表,不在系统中的搜索词是不能进行接入的,同样的对于一个搜索词,不在列表中的TAG也是不能进行接入的。
, U* P9 s+ V1 i3 }( [) Z4 w2 y5 F6 U4 q
查询系统提供以分类进行查询的方式,不同的分类的TAG列表也不同,选择本站擅长的类别数据进行接入,能提高审核通过率,审核率高的站点会进入先上线再审核的绿色通道。! m- R+ e9 z$ w6 R; G
- U4 C' t& i1 J
详细的数据接入格式,请参照文档的第三部分《提交数据规范》。
# @) k! o* K3 m' w2 r: b6 d! L
, S9 i, ~9 b. I2 D- V U2、 提交数据
& g1 e M3 y5 W' I( c; M数据提交时,由于格式不对,数据不符,Query和TAG不在列表中等原因出错,以下是一些常见的错误提示(仅供参考,以系统提示为准)。( b$ f( Q h6 P# f
" j4 s8 P6 f& C* P
- “文件上传成功”——表示数据已经成功提交。
. Y) ~5 J+ z' _2 k, P, L6 p - “XML解析错误”——上传文件非XML文件。, B0 P! `3 ]) n( P' j; X7 ]
- “找不到查询词”——接入的Query并非众包系统开放出去的Query,可以接入哪些Query可以在上一步查询到。' }/ M3 A8 W& Y& L+ m" j/ {
- “查询词已经重复添加”——接入的Query已经被其他站上传数据。
, z" |: t1 {( _5 R6 R - “找不到标签名”——接入的某个Query的标签不是预定义的TAG,每类Query的TAG列表可以在上一步通过系统查询到。
$ n9 X0 L5 a( H2 _ - “一个或多个查询词为空”——接入的某个Query为空。
_: Q! p6 A& e. Y3 k6 O6 i- d4 | - “一个或多个标签名为空”——接入的某个Query的某个标签为空。) c! @8 e# S, }7 e2 ?$ E8 {
- “一个或多个图片地址、标题、源站url为空”——接入的数据中某个图片的关键字段为空。
/ `1 u: ~0 @) d - “图片个数超过最大上传图片数”——每个Query的标签下,接入的图片数最大为100,超过这个值会报错。
' Q- i8 v6 Z/ O) g% _6 w - “没有上传XML文件”——上传的文件为空,即没有找到上传的文件“XML文件解析失败”——上传的文件为XML文件,但是不符合规范要求。/ V2 O2 ?# b: a/ z+ `
3、 查看审核情况
& B. B+ H8 j9 |+ G- z1 e) s8 H1 h
% @9 u _5 W3 r& B' j2 G
+ g* K, E% [, O3 i提交成功的数据首先会进入到“待审核数据”的序列。
, U% Y5 D3 d* z, w n$ ?/ x- U( b如果审核通过,会进入到“已审核数据”序列,(审核需要一定时间,请耐心等候。);如果已审核过的数据,进入线上系统,“是否上线”这一列就会变成“是”。(上线需要进行图片抓取,如果图片已经通过审核2-3天还未上线,请check下网站是否有抓取限制,或者联系相关人员。)
) S7 P6 b4 h% ^/ l1 S如果上线的数据因为某些原因被下线,则数据会进入到“已下线数据”的序列中。
7 G$ S7 |. t; ^7 ~如果审核未通过,会进入到“未通过审核数据”序列,该页面会列举出审核未通过的详细原因。
3 c! O% t+ A2 w3 g- }8 X常见的审核不通过的错误原因(仅供参考,以系统提示为准)。
- A/ F) c1 O, L# ?+ ?( _/ _* {" O) P/ Z; f: M6 v! h" _5 t" w5 i
- “数量少于标准”——每个Query的每个Tag下至少需要20张图片,太少会被审核不通过。- f X/ k1 [" _" u6 @, c1 \
- “图片分辨率低”——上传的图片的尺寸过小。4 K/ m$ o c% d& @9 m2 v3 Q9 J
- “图片质量模糊”——上传的图片比较模糊,清晰度不高。1 T6 j$ w! `1 J0 N0 _5 C% f# r" V
- “数据与关键词不匹配”——图片和Query词不相关。
; K% r& E% ~ _0 N! g# ^& w$ j2 ] - “数据与分类词不匹配”——图片和Query的TAG不相关。% y) D$ O& d ~5 f4 a
- “与线上数据重复”——图片大面积和已有的线上数据重复。2 J" n' C! Y) a: P( K' C
- “水印太大”——图片的水印过大,影响浏览体验。“其他原因”——其他的未定义的原因。2 N D! H! w% P/ A& a7 u+ |' H
详细见另外一篇:图搜众包收录文档-引擎(360图片)& R( ^0 p0 L7 h3 U+ H
(搜外论坛首发)原文出处链接:http://seo论坛whyshuoseo站长论坛/zzpt/307.html
+ p, U( q. w) G: A搜外论坛原创作者:江云IVEN: E4 Y( X6 r5 y( [ `: B
日期:2015.2.5 |