内容导读:最近看到360搜索(好搜)一个功能在内测中,就去看了下官方文档,没想到是一个对大家很有用的一个工具——图搜众包,这里给大家提前预告一下。5 o& y' Q2 ?6 K2 I, O
( w$ V8 L& e4 W K一、众包介绍 1、众包是什么?/ w9 j5 x7 x2 k" |9 f8 ~8 G
~4 m, V; m" @ N: j% W/ z' j
众包是一种可以让站长直接向搜索引擎提交数据的系统。
* q0 D$ i( S q7 m9 B1 T; r1 Q- n# }通过众包,站长可以提交的结构化数据,数据在经过审核后,会在搜索结果中优先展示。& q% Z* w3 z9 R) d: i' a
O$ m- h7 G# N3 S6 X
2、众包有什么优势?7 R d' K4 {8 y- V- b! D2 f" ^
$ \( i- y) c2 _
普通的数据收录,只能保证数据被引擎抓取入库,并不一定能保证上线;即使上线后,由于许多历史特征的缺失,排序的位置也会很靠后,甚至都不展示。
1 G2 @2 a- E n1 j通过图搜众包进行数据收录后,由于数据会经过人工审核,审核通过的数据即被认定为优质数据,在排序时会给予较高的权重,优先展现在比较靠前的位置。6 K( ?7 N/ \9 h2 ]; _4 S
; \' W& c2 X( H+ E
3、需要站长做什么?3 L) ]3 Z/ T3 D, `" |# G4 A
. a2 A8 O" o# A' e
根据帮助文档,生成结构化的优质数据,并提交到众包平台,等待审核通过后,即可上线查看效果。1 c6 S$ b" D6 g |* g9 h
k% I$ y; p3 M) q4、线上效果展示范例0 q' ?1 x2 A! `- {6 o A8 h
! Y& l# K# c6 H9 ^
1、 查询接入词和TAG
! f \6 y" c: e0 q( n4 o% n, a& ]$ N7 {1 i: q% D% J7 P
: k/ |3 ^" M8 ]# Y1 V
众包数据是以搜索词为单位进行接入的,所以第一步,需要查看能够接入的搜索词和TAG列表,不在系统中的搜索词是不能进行接入的,同样的对于一个搜索词,不在列表中的TAG也是不能进行接入的。
* B* B& N! Y: p7 J+ [: Z" B$ R! ~2 P
D( ?1 J# I" J! ^8 ?6 {9 O `: i1 N* `查询系统提供以分类进行查询的方式,不同的分类的TAG列表也不同,选择本站擅长的类别数据进行接入,能提高审核通过率,审核率高的站点会进入先上线再审核的绿色通道。- D( U' i, Y% }0 j, Y2 K2 Q, L
' O, f g; p s# Y8 E3 F
详细的数据接入格式,请参照文档的第三部分《提交数据规范》。
3 q* a* b# P0 q4 \+ C0 c
1 V# R( }+ Z$ |, j, ~3 d2、 提交数据+ C/ D" b& u ]
数据提交时,由于格式不对,数据不符,Query和TAG不在列表中等原因出错,以下是一些常见的错误提示(仅供参考,以系统提示为准)。
. |! {* B6 p( U5 {' a' k
( n8 X R- p5 {$ e/ |% O- “文件上传成功”——表示数据已经成功提交。
! B: O2 z& T: ~ - “XML解析错误”——上传文件非XML文件。& a+ `5 k) Y' D4 {0 T& s
- “找不到查询词”——接入的Query并非众包系统开放出去的Query,可以接入哪些Query可以在上一步查询到。
3 V, m6 {9 M% T: x - “查询词已经重复添加”——接入的Query已经被其他站上传数据。
1 c& o+ B& e' x0 u: N8 ?5 h - “找不到标签名”——接入的某个Query的标签不是预定义的TAG,每类Query的TAG列表可以在上一步通过系统查询到。
! E, S4 ]/ u. i! Z - “一个或多个查询词为空”——接入的某个Query为空。
1 P7 `8 D$ h! k% S5 I, ` - “一个或多个标签名为空”——接入的某个Query的某个标签为空。7 ^+ k, _# o+ h T1 H
- “一个或多个图片地址、标题、源站url为空”——接入的数据中某个图片的关键字段为空。 \; v; R, q* g
- “图片个数超过最大上传图片数”——每个Query的标签下,接入的图片数最大为100,超过这个值会报错。4 ?. b" @" g. r7 e- N* K
- “没有上传XML文件”——上传的文件为空,即没有找到上传的文件“XML文件解析失败”——上传的文件为XML文件,但是不符合规范要求。
6 a+ ~% G9 }% M9 e& y8 r" y 3、 查看审核情况' m! p! N' o8 N+ A( k8 W$ q
) c+ ]. V( `# ?9 I! o' b( O# o0 a- m6 j3 [( E; T; m
提交成功的数据首先会进入到“待审核数据”的序列。/ h& y" i8 Q+ f/ o1 X/ r6 B" P
如果审核通过,会进入到“已审核数据”序列,(审核需要一定时间,请耐心等候。);如果已审核过的数据,进入线上系统,“是否上线”这一列就会变成“是”。(上线需要进行图片抓取,如果图片已经通过审核2-3天还未上线,请check下网站是否有抓取限制,或者联系相关人员。)
7 r$ [* R' t" m: E' k. S如果上线的数据因为某些原因被下线,则数据会进入到“已下线数据”的序列中。+ E+ `. x' w8 F9 m
如果审核未通过,会进入到“未通过审核数据”序列,该页面会列举出审核未通过的详细原因。) f" R' Q0 f$ o1 x& ^) b/ t
常见的审核不通过的错误原因(仅供参考,以系统提示为准)。
5 `0 b9 p, o/ n t( ~* M6 W0 N1 m5 [2 T* w* v, |
- “数量少于标准”——每个Query的每个Tag下至少需要20张图片,太少会被审核不通过。
3 ^6 m$ `# i% E- a - “图片分辨率低”——上传的图片的尺寸过小。- X4 h% L8 i4 }7 r" g, X
- “图片质量模糊”——上传的图片比较模糊,清晰度不高。
7 h8 m& F$ l/ n J3 ` - “数据与关键词不匹配”——图片和Query词不相关。
5 ~8 e. P) S' f6 s3 N& i7 ^3 N - “数据与分类词不匹配”——图片和Query的TAG不相关。7 h* D; R" \5 K0 _# i
- “与线上数据重复”——图片大面积和已有的线上数据重复。' ^. W% W) g+ K: Y+ T( G N
- “水印太大”——图片的水印过大,影响浏览体验。“其他原因”——其他的未定义的原因。
1 o& ^4 V6 N& J3 z 详细见另外一篇:图搜众包收录文档-引擎(360图片)
+ F+ a0 C! A% F(搜外论坛首发)原文出处链接:http://seo论坛whyshuoseo站长论坛/zzpt/307.html
s: L1 E0 n4 h( b8 O( w% Y搜外论坛原创作者:江云IVEN" ~- U. }5 a& r3 [6 L1 ~
日期:2015.2.5 |