内容导读:最近看到360搜索(好搜)一个功能在内测中,就去看了下官方文档,没想到是一个对大家很有用的一个工具——图搜众包,这里给大家提前预告一下。
, z+ r$ C2 S) A( ?9 A2 V) t5 H; a# p
一、众包介绍 1、众包是什么?% t; u" [+ e* _ A, V
9 K& |: V! h2 Q) c7 D/ u. S D4 |6 }众包是一种可以让站长直接向搜索引擎提交数据的系统。9 C( A/ s$ T6 U0 j
通过众包,站长可以提交的结构化数据,数据在经过审核后,会在搜索结果中优先展示。
9 W1 @5 t6 W) y/ m# P4 d) d
/ C# H& r: H" k0 X4 Q: m2、众包有什么优势?
! F2 `/ `0 k% R, S$ M# K( ` s( E' o4 x" L0 l
普通的数据收录,只能保证数据被引擎抓取入库,并不一定能保证上线;即使上线后,由于许多历史特征的缺失,排序的位置也会很靠后,甚至都不展示。
% ?5 ~/ e1 w0 e' H* g通过图搜众包进行数据收录后,由于数据会经过人工审核,审核通过的数据即被认定为优质数据,在排序时会给予较高的权重,优先展现在比较靠前的位置。2 C5 N( k+ p' @3 I _
& s- t& {2 a" T/ K3、需要站长做什么?
$ T) ~ l* s& b: t9 O& n* e7 |; Q
* E9 x- h8 \/ e" m+ g6 C1 K根据帮助文档,生成结构化的优质数据,并提交到众包平台,等待审核通过后,即可上线查看效果。7 N! t- K& X' W3 j! J* P0 V* G
$ ~8 \0 ?3 }0 b# s
4、线上效果展示范例
R$ N; @1 t2 B5 O U. a6 N
" O6 y# ? d4 |6 `6 c- a% o1、 查询接入词和TAG
/ K* o) ^0 ], o" p. K
' L, ^; n! w1 G* q# g+ t8 Q" n( z2 `. ` 登录/注册后可看大图
7 a# e: u! u! C2 D5 j ^) C3 R, O
1 m) d9 `4 a0 ?* I \$ a众包数据是以搜索词为单位进行接入的,所以第一步,需要查看能够接入的搜索词和TAG列表,不在系统中的搜索词是不能进行接入的,同样的对于一个搜索词,不在列表中的TAG也是不能进行接入的。! Q7 c' d. J( G8 E# c! z
3 f4 E' S6 L! v7 [/ b2 Z% ?2 g
查询系统提供以分类进行查询的方式,不同的分类的TAG列表也不同,选择本站擅长的类别数据进行接入,能提高审核通过率,审核率高的站点会进入先上线再审核的绿色通道。
5 T$ a: h& f9 [' \" d: a# N% X1 O9 ^- }+ `1 B2 ^5 {0 H1 i
详细的数据接入格式,请参照文档的第三部分《提交数据规范》。( A. s% M/ v7 J0 R9 W# C/ H& z
+ U _- S6 Y e! P0 p) J0 ^0 u
2、 提交数据5 x' N. ]) `! u
数据提交时,由于格式不对,数据不符,Query和TAG不在列表中等原因出错,以下是一些常见的错误提示(仅供参考,以系统提示为准)。
8 e* I# d) w7 p6 l ^1 [' {
: k1 B0 }1 T( _# {' N- “文件上传成功”——表示数据已经成功提交。* V& q7 ~2 l! S4 i/ ]
- “XML解析错误”——上传文件非XML文件。- k8 x E. O: {9 k I6 r9 P
- “找不到查询词”——接入的Query并非众包系统开放出去的Query,可以接入哪些Query可以在上一步查询到。
& {/ z) z3 h7 {5 m6 C& v - “查询词已经重复添加”——接入的Query已经被其他站上传数据。- c. b$ ]- Y0 I
- “找不到标签名”——接入的某个Query的标签不是预定义的TAG,每类Query的TAG列表可以在上一步通过系统查询到。! Z$ Q& P# A2 k8 z3 O/ |- M
- “一个或多个查询词为空”——接入的某个Query为空。 N" R/ t0 q8 G( e% }
- “一个或多个标签名为空”——接入的某个Query的某个标签为空。: y" d* \8 P2 V: k6 b$ B" E2 U
- “一个或多个图片地址、标题、源站url为空”——接入的数据中某个图片的关键字段为空。
E9 F- S* l" ~& @5 K - “图片个数超过最大上传图片数”——每个Query的标签下,接入的图片数最大为100,超过这个值会报错。
3 F' l I: A% V# I - “没有上传XML文件”——上传的文件为空,即没有找到上传的文件“XML文件解析失败”——上传的文件为XML文件,但是不符合规范要求。
1 ?, _( ^/ V& Y6 ?# r# `8 E" h! i, ] 3、 查看审核情况+ U/ l% X# A( H/ P# C- ?: V8 _
3 x; N8 j' z. Y2 t; V
% h! A3 ~: ~4 d1 C+ D/ [提交成功的数据首先会进入到“待审核数据”的序列。8 d9 e3 M9 e: T5 _% @6 I7 ?) G
如果审核通过,会进入到“已审核数据”序列,(审核需要一定时间,请耐心等候。);如果已审核过的数据,进入线上系统,“是否上线”这一列就会变成“是”。(上线需要进行图片抓取,如果图片已经通过审核2-3天还未上线,请check下网站是否有抓取限制,或者联系相关人员。)+ ~( }9 V. b1 w1 @$ D0 o# E
如果上线的数据因为某些原因被下线,则数据会进入到“已下线数据”的序列中。
, I9 q* L7 H( X. h. O" ]0 B7 R如果审核未通过,会进入到“未通过审核数据”序列,该页面会列举出审核未通过的详细原因。
% M9 a3 K& \8 a0 ?% E) }, m常见的审核不通过的错误原因(仅供参考,以系统提示为准)。: ?9 y8 q' F9 j% C+ g: k/ T* r! w
) u% T, |( ]( `
- “数量少于标准”——每个Query的每个Tag下至少需要20张图片,太少会被审核不通过。) \8 k7 _- u% n: D
- “图片分辨率低”——上传的图片的尺寸过小。3 b9 T, C+ [: i5 |% I( g
- “图片质量模糊”——上传的图片比较模糊,清晰度不高。0 V. n6 E5 Q0 G
- “数据与关键词不匹配”——图片和Query词不相关。% }5 c( H8 y2 q0 f
- “数据与分类词不匹配”——图片和Query的TAG不相关。, b8 w8 D$ u/ [& Z, Q
- “与线上数据重复”——图片大面积和已有的线上数据重复。
" {- I4 ` p( o: T2 r5 w' d! J+ Q( R - “水印太大”——图片的水印过大,影响浏览体验。“其他原因”——其他的未定义的原因。
+ K. n1 E' J6 m' k4 X 详细见另外一篇:图搜众包收录文档-引擎(360图片)
2 [- N1 V2 M2 n9 I4 u* s* ` Y(搜外论坛首发)原文出处链接:http://seo论坛whyshuoseo站长论坛/zzpt/307.html
0 K, ^6 s2 u( N( d; @! l- @7 e4 a5 M搜外论坛原创作者:江云IVEN) D+ I5 ?- K0 w+ A! ~* F% U
日期:2015.2.5 |