内容导读:最近看到360搜索(好搜)一个功能在内测中,就去看了下官方文档,没想到是一个对大家很有用的一个工具——图搜众包,这里给大家提前预告一下。
9 A, k/ {: W( w' w# l; r7 S. y. J! x+ T* w X( J( P$ v
一、众包介绍 1、众包是什么?3 T$ G1 Z, a# ?4 F
2 j9 P; ^. j: A众包是一种可以让站长直接向搜索引擎提交数据的系统。7 V0 ^5 H/ L' Y
通过众包,站长可以提交的结构化数据,数据在经过审核后,会在搜索结果中优先展示。% ^' j% C4 E6 l* w/ g$ c
# X& d1 j" q# @* ?% D0 ]: L2、众包有什么优势?" Z) i! \, H0 ~+ _9 N& l
* L4 \- F; H6 v" A$ o普通的数据收录,只能保证数据被引擎抓取入库,并不一定能保证上线;即使上线后,由于许多历史特征的缺失,排序的位置也会很靠后,甚至都不展示。4 W4 t# a/ n6 I6 V/ {' L
通过图搜众包进行数据收录后,由于数据会经过人工审核,审核通过的数据即被认定为优质数据,在排序时会给予较高的权重,优先展现在比较靠前的位置。
: Y7 y5 K) z7 z) l# a" e
: @" x4 _# i9 @2 v( u) R3、需要站长做什么?
& l$ d; S. [, v& ?( ]$ g0 F$ a! q0 _: f! f' V/ V3 W
根据帮助文档,生成结构化的优质数据,并提交到众包平台,等待审核通过后,即可上线查看效果。! [. D. v* y. e! N# m7 N
3 g& g$ V0 y. h: }& `4、线上效果展示范例! L3 |& z% I" N$ T) X: h# b; Q
" q. H6 a8 j9 {. `) k S
1、 查询接入词和TAG2 K. b) Y& j( ^8 B
* p7 P& v" t- T( h; T% ]
4 Z9 J/ |' l$ [' b7 R
众包数据是以搜索词为单位进行接入的,所以第一步,需要查看能够接入的搜索词和TAG列表,不在系统中的搜索词是不能进行接入的,同样的对于一个搜索词,不在列表中的TAG也是不能进行接入的。' h5 L" }. `8 G( n7 |
6 G7 v' J( w7 w0 ~查询系统提供以分类进行查询的方式,不同的分类的TAG列表也不同,选择本站擅长的类别数据进行接入,能提高审核通过率,审核率高的站点会进入先上线再审核的绿色通道。
5 A, n9 p) e1 E' \1 n
& H5 E( W" k1 u/ j2 S9 \1 B3 Y) s详细的数据接入格式,请参照文档的第三部分《提交数据规范》。
" ?. l$ z) f4 ?/ d
9 b: R& m3 |5 w$ L0 S* Z5 e2、 提交数据; H3 D) Q, ~$ z, S
数据提交时,由于格式不对,数据不符,Query和TAG不在列表中等原因出错,以下是一些常见的错误提示(仅供参考,以系统提示为准)。& \- g2 P9 Y9 f6 H) W9 I
. p- J; z4 q3 L/ H8 i, }, I- “文件上传成功”——表示数据已经成功提交。
. Q3 g8 Y5 E, a) L$ ?8 a7 q3 K3 Q# z - “XML解析错误”——上传文件非XML文件。
- K8 ]% |, p* Q- b; |/ y3 c - “找不到查询词”——接入的Query并非众包系统开放出去的Query,可以接入哪些Query可以在上一步查询到。& |. ~6 W3 K( U; v( i
- “查询词已经重复添加”——接入的Query已经被其他站上传数据。
0 H1 d& N+ l7 _ - “找不到标签名”——接入的某个Query的标签不是预定义的TAG,每类Query的TAG列表可以在上一步通过系统查询到。$ y0 w9 e5 l: H. p* a% Y* a. {
- “一个或多个查询词为空”——接入的某个Query为空。 c, |2 a# f' U, w- T
- “一个或多个标签名为空”——接入的某个Query的某个标签为空。1 R0 P* F: E) O4 b$ \3 |6 T
- “一个或多个图片地址、标题、源站url为空”——接入的数据中某个图片的关键字段为空。
$ K* g, i2 j+ X! `% h8 }8 h! b - “图片个数超过最大上传图片数”——每个Query的标签下,接入的图片数最大为100,超过这个值会报错。
* f! ?# P1 ~3 x- l4 E! ~) ~7 p - “没有上传XML文件”——上传的文件为空,即没有找到上传的文件“XML文件解析失败”——上传的文件为XML文件,但是不符合规范要求。2 [& {& o5 B3 k6 O/ ?: I1 r7 K
3、 查看审核情况
9 t+ T8 N: H$ |' |; p3 C! S0 U; P) d$ Z1 r) R2 D0 f
: a3 m% x4 s6 f# ^, A( H- U- [提交成功的数据首先会进入到“待审核数据”的序列。
$ y. T" U# t T3 a* L如果审核通过,会进入到“已审核数据”序列,(审核需要一定时间,请耐心等候。);如果已审核过的数据,进入线上系统,“是否上线”这一列就会变成“是”。(上线需要进行图片抓取,如果图片已经通过审核2-3天还未上线,请check下网站是否有抓取限制,或者联系相关人员。)
8 e( I4 } x4 k/ a如果上线的数据因为某些原因被下线,则数据会进入到“已下线数据”的序列中。. K! x* Y8 Z9 \: E5 ?7 G
如果审核未通过,会进入到“未通过审核数据”序列,该页面会列举出审核未通过的详细原因。
* B8 ~& J( X& ^+ f常见的审核不通过的错误原因(仅供参考,以系统提示为准)。
* [1 u/ E4 d- y3 L( T# M1 E, Q$ ~
* N2 Y: |- B5 J) ?: Y- “数量少于标准”——每个Query的每个Tag下至少需要20张图片,太少会被审核不通过。- d# l. G/ q. }5 x. M
- “图片分辨率低”——上传的图片的尺寸过小。' A7 P7 f* U0 b
- “图片质量模糊”——上传的图片比较模糊,清晰度不高。8 [2 \& B% O4 d
- “数据与关键词不匹配”——图片和Query词不相关。* w" s7 \: }4 r: }, q
- “数据与分类词不匹配”——图片和Query的TAG不相关。. M% u3 ]5 m# Z* O8 _6 _' x {
- “与线上数据重复”——图片大面积和已有的线上数据重复。" V0 m- J* R( Y% D: m x! K
- “水印太大”——图片的水印过大,影响浏览体验。“其他原因”——其他的未定义的原因。
8 b6 W3 u- Z+ U- x 详细见另外一篇:图搜众包收录文档-引擎(360图片): K, p s4 y3 O' v3 E2 B
(搜外论坛首发)原文出处链接:http://seo论坛whyshuoseo站长论坛/zzpt/307.html/ U6 w: B, M# H# I1 L7 {' u/ v/ |( ?$ j
搜外论坛原创作者:江云IVEN
0 _9 H# j. ?7 z& e O9 ?日期:2015.2.5 |