内容导读:最近看到360搜索(好搜)一个功能在内测中,就去看了下官方文档,没想到是一个对大家很有用的一个工具——图搜众包,这里给大家提前预告一下。: d5 ]0 u) a. N- ]
- m1 r# l: V* L' \) a. @$ I- z
一、众包介绍 1、众包是什么?
( Y2 _0 B5 s/ i8 f ]3 t
3 y# {. x5 P; q: I; J, c; D* |$ ~# [% m众包是一种可以让站长直接向搜索引擎提交数据的系统。
6 N0 y& G. y/ z8 l: l通过众包,站长可以提交的结构化数据,数据在经过审核后,会在搜索结果中优先展示。) C+ I- F$ R5 l! Z
, D* _8 S: E$ w/ _6 H
2、众包有什么优势?
" e, H" l; F; W/ ^2 L
( [7 |4 x) _, k( y% ~) D$ `普通的数据收录,只能保证数据被引擎抓取入库,并不一定能保证上线;即使上线后,由于许多历史特征的缺失,排序的位置也会很靠后,甚至都不展示。0 c+ y, j7 j o! x, j- e. Q* D
通过图搜众包进行数据收录后,由于数据会经过人工审核,审核通过的数据即被认定为优质数据,在排序时会给予较高的权重,优先展现在比较靠前的位置。
/ p7 y- H- }. b, c7 ]1 ]! J. l$ z) q! z* O1 @. b& J! L
3、需要站长做什么?. F) G$ F, q1 f* c* ^# Q4 X |
( v; f& Z9 M7 c/ m7 S9 y
根据帮助文档,生成结构化的优质数据,并提交到众包平台,等待审核通过后,即可上线查看效果。( N7 r% \+ H$ [5 L
/ |! ?# h; v3 l' C1 \6 ~
4、线上效果展示范例
% g6 P' J* x8 V0 M4 e* a% o+ u9 o8 Y4 J7 P Q; z4 [: C3 U- ]
1、 查询接入词和TAG7 M" W: S& m4 K$ h5 i! F& U7 l
4 h8 V+ X6 Q6 c
* w5 u# h c9 @. Z2 U+ n( j
众包数据是以搜索词为单位进行接入的,所以第一步,需要查看能够接入的搜索词和TAG列表,不在系统中的搜索词是不能进行接入的,同样的对于一个搜索词,不在列表中的TAG也是不能进行接入的。0 q# Q' k0 n. T: [% a( f* f" X
7 r2 t. \& O2 Y, F
查询系统提供以分类进行查询的方式,不同的分类的TAG列表也不同,选择本站擅长的类别数据进行接入,能提高审核通过率,审核率高的站点会进入先上线再审核的绿色通道。
5 z$ \ C' i, l0 D) C5 W# I
5 ] e: f) { Y* {8 A( I0 y6 G8 K详细的数据接入格式,请参照文档的第三部分《提交数据规范》。/ |% @& v6 ?: c7 X( y
# r5 q8 S( a" ^& M, W$ a
2、 提交数据
- [ Q2 ~" l1 R1 z6 p数据提交时,由于格式不对,数据不符,Query和TAG不在列表中等原因出错,以下是一些常见的错误提示(仅供参考,以系统提示为准)。( d9 l! ? s# r( y$ f2 f- g9 L* \+ m" G
5 R9 Q3 i% g" K* j2 a! n
- “文件上传成功”——表示数据已经成功提交。
. R' X' c, Y$ i; m7 O u - “XML解析错误”——上传文件非XML文件。/ a, c1 ]$ P) N; K5 p {0 |2 }
- “找不到查询词”——接入的Query并非众包系统开放出去的Query,可以接入哪些Query可以在上一步查询到。
) n) W6 X( p" O( x# d9 x - “查询词已经重复添加”——接入的Query已经被其他站上传数据。
5 d7 }' @3 f" u! d# j6 w5 n5 S- A6 p - “找不到标签名”——接入的某个Query的标签不是预定义的TAG,每类Query的TAG列表可以在上一步通过系统查询到。
; H$ o7 v) n- Y! b - “一个或多个查询词为空”——接入的某个Query为空。; p6 Y! x }& ~
- “一个或多个标签名为空”——接入的某个Query的某个标签为空。; M2 o- F8 M; ]" h6 Z/ [( |
- “一个或多个图片地址、标题、源站url为空”——接入的数据中某个图片的关键字段为空。$ M5 J% f7 u0 i) z# m; z5 X% c
- “图片个数超过最大上传图片数”——每个Query的标签下,接入的图片数最大为100,超过这个值会报错。
- W5 B% u' t# O; }, S7 }% g - “没有上传XML文件”——上传的文件为空,即没有找到上传的文件“XML文件解析失败”——上传的文件为XML文件,但是不符合规范要求。
/ Y0 M. U) E- k8 ]+ H0 W 3、 查看审核情况
, c: Q; w9 l4 ` O" t @7 x0 x2 G3 h; A, _" t0 G8 X
3 k I) G$ F2 |- h( S: R% t$ G
提交成功的数据首先会进入到“待审核数据”的序列。; f+ d( {( {2 G5 v" e' S6 t' }
如果审核通过,会进入到“已审核数据”序列,(审核需要一定时间,请耐心等候。);如果已审核过的数据,进入线上系统,“是否上线”这一列就会变成“是”。(上线需要进行图片抓取,如果图片已经通过审核2-3天还未上线,请check下网站是否有抓取限制,或者联系相关人员。)
1 z+ e2 i) h0 G2 b, N3 i如果上线的数据因为某些原因被下线,则数据会进入到“已下线数据”的序列中。
4 d' q, T/ Z+ ]; e如果审核未通过,会进入到“未通过审核数据”序列,该页面会列举出审核未通过的详细原因。
% i) R8 X3 }& ]3 E8 O" d常见的审核不通过的错误原因(仅供参考,以系统提示为准)。
/ @5 d2 }) ^- t% ~/ h& x4 g* \6 { S! o
- “数量少于标准”——每个Query的每个Tag下至少需要20张图片,太少会被审核不通过。, y4 X) Q9 `+ j0 } a
- “图片分辨率低”——上传的图片的尺寸过小。
. L% E$ f2 f& }$ p$ L4 n5 J - “图片质量模糊”——上传的图片比较模糊,清晰度不高。
) x% q: n" b3 ~2 K' L ^0 c - “数据与关键词不匹配”——图片和Query词不相关。" n5 H3 Z3 V! f4 ~3 Z
- “数据与分类词不匹配”——图片和Query的TAG不相关。 B& s z9 m7 F! Y4 J
- “与线上数据重复”——图片大面积和已有的线上数据重复。) z* u4 l/ X2 f6 Z
- “水印太大”——图片的水印过大,影响浏览体验。“其他原因”——其他的未定义的原因。3 E# b0 x0 E- P( F0 y/ s, Q [% `
详细见另外一篇:图搜众包收录文档-引擎(360图片)
, S# \/ I5 H& ^# N(搜外论坛首发)原文出处链接:http://seo论坛whyshuoseo站长论坛/zzpt/307.html+ j: e6 P% S3 _5 d% {
搜外论坛原创作者:江云IVEN2 ]2 f2 ~' r) d0 R) T* L, O
日期:2015.2.5 |