内容导读:最近看到360搜索(好搜)一个功能在内测中,就去看了下官方文档,没想到是一个对大家很有用的一个工具——图搜众包,这里给大家提前预告一下。
& ^4 d( w4 P8 A, p) V" }" m& w, v+ v4 X `' Q5 Y+ i
一、众包介绍 1、众包是什么?
: P( v1 l- J, X$ N4 C0 E# a, L! e( f4 T0 v+ x' J+ i0 H( D, G/ f
众包是一种可以让站长直接向搜索引擎提交数据的系统。
- v+ r0 L1 s" w1 |- l通过众包,站长可以提交的结构化数据,数据在经过审核后,会在搜索结果中优先展示。4 v8 g- A, p1 q' D# @& O
# `: V* W$ ^8 Z! X! V. X
2、众包有什么优势?+ T- ~" O. h4 C, }" U5 l; N! S
0 g9 v6 ?6 [- a% v& ], @/ L普通的数据收录,只能保证数据被引擎抓取入库,并不一定能保证上线;即使上线后,由于许多历史特征的缺失,排序的位置也会很靠后,甚至都不展示。
4 d% u o# M8 U通过图搜众包进行数据收录后,由于数据会经过人工审核,审核通过的数据即被认定为优质数据,在排序时会给予较高的权重,优先展现在比较靠前的位置。* D+ s7 d; Q( {9 P
' R3 `4 u- ~4 x7 Z
3、需要站长做什么?6 I3 Q9 a2 N4 \6 a, `
% z1 s1 i6 f! j' i+ j根据帮助文档,生成结构化的优质数据,并提交到众包平台,等待审核通过后,即可上线查看效果。8 \" r6 c6 I9 F$ N7 F2 C
1 o9 D$ O j$ `" y' u+ d
4、线上效果展示范例6 T5 k, ]9 l$ Z2 c
* [ |) |0 w* s% M1、 查询接入词和TAG
, K8 @$ g0 s9 v- H M% P4 v% E& Y$ ?- s
# Q+ G2 @* d: a' p- F1 a
众包数据是以搜索词为单位进行接入的,所以第一步,需要查看能够接入的搜索词和TAG列表,不在系统中的搜索词是不能进行接入的,同样的对于一个搜索词,不在列表中的TAG也是不能进行接入的。7 b0 o1 a# {# [- |8 U$ `
, r& O" T* U. @ I0 Z; @, x2 W
查询系统提供以分类进行查询的方式,不同的分类的TAG列表也不同,选择本站擅长的类别数据进行接入,能提高审核通过率,审核率高的站点会进入先上线再审核的绿色通道。; {9 _, w. S1 O% ^% [3 W. a1 q
1 w8 T3 y: }1 O# P, x0 F8 n
详细的数据接入格式,请参照文档的第三部分《提交数据规范》。: U3 |: R2 }6 t Y& i+ s
[8 ^7 m6 l* P$ T9 I2、 提交数据
5 G8 W& G* O1 R+ B$ N/ ~数据提交时,由于格式不对,数据不符,Query和TAG不在列表中等原因出错,以下是一些常见的错误提示(仅供参考,以系统提示为准)。
$ {+ b2 `) w/ p* x# m8 c% W, S
2 h; E5 e6 Q) `- Y& j3 C- “文件上传成功”——表示数据已经成功提交。
' z/ }) ?$ `/ T% k - “XML解析错误”——上传文件非XML文件。
! B0 {! Q0 u9 s! R* J% D1 i* q - “找不到查询词”——接入的Query并非众包系统开放出去的Query,可以接入哪些Query可以在上一步查询到。
( i3 @+ ^# L" r# d - “查询词已经重复添加”——接入的Query已经被其他站上传数据。" V9 ~4 L4 `6 G. Z
- “找不到标签名”——接入的某个Query的标签不是预定义的TAG,每类Query的TAG列表可以在上一步通过系统查询到。
1 ^1 @5 b: z' b$ x! m" Z - “一个或多个查询词为空”——接入的某个Query为空。( }" x% {/ [- `# Z/ j) c& ^
- “一个或多个标签名为空”——接入的某个Query的某个标签为空。
" S+ S+ m: R# J& |3 i/ E - “一个或多个图片地址、标题、源站url为空”——接入的数据中某个图片的关键字段为空。
4 [8 R9 Y* `3 [+ _ - “图片个数超过最大上传图片数”——每个Query的标签下,接入的图片数最大为100,超过这个值会报错。
$ T s( F& f+ h. \* t$ w0 | - “没有上传XML文件”——上传的文件为空,即没有找到上传的文件“XML文件解析失败”——上传的文件为XML文件,但是不符合规范要求。
5 \6 h; F1 v" r& g& J1 ~ 3、 查看审核情况
2 v$ T* g+ w8 B
! {; P; J- ^( T0 z( f `/ N( b3 x
提交成功的数据首先会进入到“待审核数据”的序列。
|- S( H& N+ e9 G& E& c: @% ^如果审核通过,会进入到“已审核数据”序列,(审核需要一定时间,请耐心等候。);如果已审核过的数据,进入线上系统,“是否上线”这一列就会变成“是”。(上线需要进行图片抓取,如果图片已经通过审核2-3天还未上线,请check下网站是否有抓取限制,或者联系相关人员。)
) W$ W i5 Y' a2 ~/ b" M如果上线的数据因为某些原因被下线,则数据会进入到“已下线数据”的序列中。: e$ j! W5 X( }) e: ]
如果审核未通过,会进入到“未通过审核数据”序列,该页面会列举出审核未通过的详细原因。% F0 C8 s6 L9 `9 B
常见的审核不通过的错误原因(仅供参考,以系统提示为准)。+ ]" g" P# n9 I5 r
$ t. k' [7 U6 z- “数量少于标准”——每个Query的每个Tag下至少需要20张图片,太少会被审核不通过。
% p8 b3 I/ i: _/ l' W, B- O - “图片分辨率低”——上传的图片的尺寸过小。
; a: e t# m9 y- s {- f2 E- S - “图片质量模糊”——上传的图片比较模糊,清晰度不高。/ V8 `5 \0 G# G7 h: `6 Q" z' a
- “数据与关键词不匹配”——图片和Query词不相关。
+ q1 \! V3 z6 \( ~% C( g - “数据与分类词不匹配”——图片和Query的TAG不相关。! |0 r: R. r; h0 b1 _
- “与线上数据重复”——图片大面积和已有的线上数据重复。0 k4 O+ S0 q% b% h/ b/ u. ]
- “水印太大”——图片的水印过大,影响浏览体验。“其他原因”——其他的未定义的原因。" y' e% W3 b7 Y q( t5 E
详细见另外一篇:图搜众包收录文档-引擎(360图片)5 B1 W1 J6 M: ?- ?1 q
(搜外论坛首发)原文出处链接:http://seo论坛whyshuoseo站长论坛/zzpt/307.html
0 c k0 E7 p% `' ~: ~6 t搜外论坛原创作者:江云IVEN+ w6 N# R0 \ _# X' Q! ^
日期:2015.2.5 |