内容导读:最近看到360搜索(好搜)一个功能在内测中,就去看了下官方文档,没想到是一个对大家很有用的一个工具——图搜众包,这里给大家提前预告一下。
3 L4 b X$ N2 w& r7 n0 v2 b5 ~& Q% i( i3 Z# `" H8 b
一、众包介绍 1、众包是什么?3 W5 {* n: S0 L9 J0 t1 L
7 ^* E: T$ H+ g. \9 a; f6 i众包是一种可以让站长直接向搜索引擎提交数据的系统。( L. p+ r6 c! f2 ]0 Y2 L
通过众包,站长可以提交的结构化数据,数据在经过审核后,会在搜索结果中优先展示。
( }) A' b# W0 h
7 ]* a/ r m% W- m$ v2、众包有什么优势?
& D" K; S7 R- x" R8 F* V. {2 s9 ~6 W0 _ W. b# M& j" ]- s, ~( F7 _
普通的数据收录,只能保证数据被引擎抓取入库,并不一定能保证上线;即使上线后,由于许多历史特征的缺失,排序的位置也会很靠后,甚至都不展示。
( h5 Z" }+ f0 c& @0 P0 v! ]. Y通过图搜众包进行数据收录后,由于数据会经过人工审核,审核通过的数据即被认定为优质数据,在排序时会给予较高的权重,优先展现在比较靠前的位置。+ F0 q0 L7 |6 z: O' C2 C
7 p* o z& k8 i6 f- D; y% ~# x
3、需要站长做什么?
4 ^& W8 M0 M5 T8 B9 ~. l2 {$ a- ~- C; ?/ ~# w4 z
根据帮助文档,生成结构化的优质数据,并提交到众包平台,等待审核通过后,即可上线查看效果。4 X. z0 P" Y4 i
% g5 n' ^* Y. b1 ^# ]5 I4、线上效果展示范例) Q0 V0 [; q3 e3 x5 \/ ~
, q9 Q+ [, L+ J" k* l" n1、 查询接入词和TAG4 l! d! T, V, v$ ]
, B' s" p1 j4 U7 ?
; C4 P+ d1 _& @7 [8 r: @9 Y+ g众包数据是以搜索词为单位进行接入的,所以第一步,需要查看能够接入的搜索词和TAG列表,不在系统中的搜索词是不能进行接入的,同样的对于一个搜索词,不在列表中的TAG也是不能进行接入的。1 N3 S7 h3 I, {- x9 G9 ?
% L- I" p9 N% }
查询系统提供以分类进行查询的方式,不同的分类的TAG列表也不同,选择本站擅长的类别数据进行接入,能提高审核通过率,审核率高的站点会进入先上线再审核的绿色通道。
9 r0 Q' g) D9 S% `" V1 g- s! M1 r
- S# K9 J7 c3 m# o9 b+ B详细的数据接入格式,请参照文档的第三部分《提交数据规范》。
9 f0 G% _: ]2 }3 Z9 {! E0 d' b5 {$ @4 i$ k
2、 提交数据
! C5 _/ W h9 L0 a数据提交时,由于格式不对,数据不符,Query和TAG不在列表中等原因出错,以下是一些常见的错误提示(仅供参考,以系统提示为准)。$ [2 {9 X/ y9 I7 g; `, J& n
. t* |' k' ?4 n% x$ B- “文件上传成功”——表示数据已经成功提交。* W0 p6 \% T: ` z- H% p1 c5 `. B, l
- “XML解析错误”——上传文件非XML文件。
; x+ w& J3 r. k, \7 V# W - “找不到查询词”——接入的Query并非众包系统开放出去的Query,可以接入哪些Query可以在上一步查询到。8 y4 x& T, t: t
- “查询词已经重复添加”——接入的Query已经被其他站上传数据。9 p2 A( Q N3 X+ g3 v5 g+ D
- “找不到标签名”——接入的某个Query的标签不是预定义的TAG,每类Query的TAG列表可以在上一步通过系统查询到。7 p, U" L& w. z9 u: \
- “一个或多个查询词为空”——接入的某个Query为空。
; U" T# U! _9 k - “一个或多个标签名为空”——接入的某个Query的某个标签为空。8 p' E: s- h' r0 }- _7 p" }
- “一个或多个图片地址、标题、源站url为空”——接入的数据中某个图片的关键字段为空。
5 T$ W$ x# z, {6 O( U: r9 X* o - “图片个数超过最大上传图片数”——每个Query的标签下,接入的图片数最大为100,超过这个值会报错。
1 h$ D+ { _% V3 E: z2 k c) v) W - “没有上传XML文件”——上传的文件为空,即没有找到上传的文件“XML文件解析失败”——上传的文件为XML文件,但是不符合规范要求。1 x f( ~; I- W
3、 查看审核情况
* t9 W" o S( F D' G7 z8 g2 C: X @8 y# l: h( A
: S4 Y5 K& q! ~9 X3 F提交成功的数据首先会进入到“待审核数据”的序列。& f1 _- D$ z0 X; M3 L9 ~
如果审核通过,会进入到“已审核数据”序列,(审核需要一定时间,请耐心等候。);如果已审核过的数据,进入线上系统,“是否上线”这一列就会变成“是”。(上线需要进行图片抓取,如果图片已经通过审核2-3天还未上线,请check下网站是否有抓取限制,或者联系相关人员。)
# A* @* x; y/ ]: P3 j* g如果上线的数据因为某些原因被下线,则数据会进入到“已下线数据”的序列中。
; h1 ^9 \8 d4 Y( r# {如果审核未通过,会进入到“未通过审核数据”序列,该页面会列举出审核未通过的详细原因。
0 @) T: i3 R9 V! M3 f常见的审核不通过的错误原因(仅供参考,以系统提示为准)。0 F# T& G9 }% l
) Y0 t5 v+ v& B1 K L: H+ D- “数量少于标准”——每个Query的每个Tag下至少需要20张图片,太少会被审核不通过。
( g& F2 ?" u7 P1 g* a - “图片分辨率低”——上传的图片的尺寸过小。
3 w1 _4 l; D) V9 w) a, K& \) ] - “图片质量模糊”——上传的图片比较模糊,清晰度不高。
. f7 J* z' N; G6 |8 r% [0 ~ - “数据与关键词不匹配”——图片和Query词不相关。) n2 C% U8 g; d# Z
- “数据与分类词不匹配”——图片和Query的TAG不相关。3 l0 `% j% W$ K. }4 N
- “与线上数据重复”——图片大面积和已有的线上数据重复。5 @; s3 [, g) E+ r3 h& x
- “水印太大”——图片的水印过大,影响浏览体验。“其他原因”——其他的未定义的原因。
: {* Z% n0 I s! k9 Q1 S f; z 详细见另外一篇:图搜众包收录文档-引擎(360图片)
5 S4 L# e, I+ ?( s8 d(搜外论坛首发)原文出处链接:http://seo论坛whyshuoseo站长论坛/zzpt/307.html! l& Q! v5 O5 |/ Z7 S+ \
搜外论坛原创作者:江云IVEN
2 k1 k& W( V& s+ z0 U+ c日期:2015.2.5 |