1、框架结构,在网站诞生初七很流行,因为对网站的页面更新维护有一定的方便性,现在已经很少用的。因为不利于搜索引擎抓取是框架越来越不流行的重要原因之一,使用框架设计页面,在早期的时候有,不过现在的网站都很少用框架设计,所以这里就不多说了,无论你是在用或者没用,记住一句话:不要让搜索引擎去讨好你。
- g& a9 P+ l6 m$ `( ~; q1 P
$ o6 J0 O, C8 ~; P, j. X5 }! A 2、各种跳转,除了301重定向之外,搜索引擎对其他形式的跳转都比较敏感,比如302、JavaScript跳转、Flash、Meta Refresh跳转等,一些用户访问首页的时候会自动被跳转到某个目录下面,一些常用的团购网站、生活类网站按照地理位置转向最适合的目录,这是无可厚非的。但对于这种首页转向看不出任何理由和目的,这样的转向能免则免。
a' x' u+ d# o- I
/ g7 P0 i; T" ?$ H( P0 U" T 3、搜索引擎能不能找到网页。要让搜搜引擎发现网站首页,就必须有良好的外部链接链接到首页,就找到了首页,然后蜘蛛会沿着链接爬的更深。让蜘蛛通过简单的html页面的链接到达,javascript链接,flash链接都是蜘蛛的陷阱。这点要注意。找到网页后能不能抓去内容,被发现的蜘蛛是可以被爬取的,数据库动态生成,带过很多的参数url、sessionID、整个页面都是flash、框架结构、大量的转向,和大量的复制内容都可能把蜘蛛拦截在门外。这也也是要注意的。( D; Z" e. ~* s, R
4、SessionID,如果,我们的网站使用SessionID跟踪用户访问,这样就会出现一种现象,什么现象呢?就会出项搜索引擎每一次访问我们的页面时出现一个不一样的Session ID,即使访问的时同一个页面,他也会出现不一样的ID,但是内容却是一样的,就形成了大量的重复性内容,这也就形成了一个蜘蛛陷阱,也不利于网站的优化。那么我们通常建议大家使用cookies而不要生成SessionID。3 p$ e' r1 g$ T1 j
; O$ A2 h2 h" f 5、动态URL,所谓动态URL就是指网址里面带有问号、等号以及一些参数等等。一般情况下来说,动态URL也是不利于蜘蛛抓取的,我们应该避免。
" s5 \8 X3 Y1 ~1 F {: Q5 g
9 O; k3 O- T. I0 U 6、要求登录,搜素殷勤蜘蛛他不会填写用户名、密码、验证码。那么你的这些内容也就不会被他发现。
4 {* {. h! c& ~# F' k4 B& z$ H
2 d3 k) m" {2 v2 }1 I" z 7、强制使用Cookies,有些网站就想记住用户的登录信息、跟踪访问路径等,强制的去使用Cookies。如果说,互联网用户的浏览器没有启用Cookies,那么这样以来就会导致此页面无法正常显示。简单来说,强制使用Cookies只能造成搜索引擎蜘蛛无法正常访问。8 e' a6 C7 x* K
6 @! X, d* x8 L$ g- n' t
|