网上使用chunked编码的网站似乎并不是很多,除了那些使用gzip压缩的网站,例:google.com,还有就是大部分打开gzip压缩的php论坛。
7 Z# f& e- u0 M0 }: i, S根据本人的理解,使用chunked编码的主要好处就在于一些程序的运算出过程中,可以动态的输出内容。
$ P- O& V' J( l8 V例如,要在后台处理一个小时的运算,但又不希望用户等一个小时才能看到结果。这时就可采用chunked编码将内容分块输出,用户随时都可以接收到最新的处理结果。
; c& x/ o1 |# p0 ?asp关闭了缓存的输出模式,就是chunked编码的。(response.buffer = false)
( P+ W, b, r! i9 U# T$ ^& N而每一次的response.write,都是一个chunked,所以不要使用的太频繁哦,否则chunk数量太多,额外的数据太浪费空间了。
+ m/ Z! o2 M- m) {3 e若想了解chunked的具体编码结构,用asp关闭缓存调试蛮方便的。:)6 K; h9 K b% A0 N- h6 g( V/ h
我们先来看看rfc2616中对chunked的定义:2 e. L; F t' v+ j: C' o$ f3 b
chunked-body = *chunk4 n5 \7 ~8 k& ]: i: z. r. a* |. ]
last-chunk& g9 G+ A& Q$ l" x0 s' |- W
trailer0 M b/ s+ Z% | Z) ~( E# V
crlf! D+ ~9 X5 A" `* a1 M1 o
chunk = chunk-size [ chunk-extension ] crlf
! b4 |+ t" z- r& cchunk-data crlf
. @+ t3 s) O4 ^& A% U; Uchunk-size = 1*hex
* e: O3 s0 Z- g1 ]last-chunk = 1*(0) [ chunk-extension ] crlf/ v* ~1 l) J) ~
chunk-extension= *( ; chunk-ext-name [ = chunk-ext-val ] )
) ~; r' j5 L0 J, u3 ~; Bchunk-ext-name = token( l; O$ A7 R& B& I' [' `
chunk-ext-val = token | quoted-string
0 @3 l% |4 o9 Z. ichunk-data = chunk-size(octet)
, \, A9 M5 J+ Y$ H8 R ctrailer = *(entity-header crlf)& }; S% Q' E0 O; g
我们来模拟一下数据结构:- m' P& F1 k1 q9 K2 ]7 `
[chunk大小][回车][chunk数据体][回车][chunk大小][回车][chunk数据体][回车][0][回车]/ ?3 W2 R: n" Z3 N
注意chunk-size是以十六进制的ascii码表示的,比如86ae(实际的十六进制应该是:38366165),计算成长度应该是:34478,表示从回车之后有连续的34478字节的数据。8 H! ~: L# x0 h! N }. ^
跟踪了的返回数据,发现在chunk-size中,还会多一些空格。可能是固定长度为7个字节,不满7个字节的,就以空格补足,空格的ascii码是0x20。6 c! k, ^6 U& O1 }; k3 t" K: R6 y
以下是解码过程的伪代码:
# Q( M8 }$ k1 w4 x( elength := 0//用来记录解码后的数据体长度
& s: b3 o: h$ nread chunk-size, chunk-extension (if any) and crlf//第一次读取块大小) s: o4 E7 f7 z) g: m
while (chunk-size > 0) {//一直循环,直到读取的块大小为0
3 O# G- v& a) v& K2 V' c. r- Yread chunk-data and crlf//读取块数据体,以回车结束
0 O( b6 l/ f# Q) R, k" x" Z! D1 j9 Yappend chunk-data to entity-body//添加块数据体到解码后实体数据
- Z1 ^% w0 x' L1 elength := length + chunk-size//更新解码后的实体长度, t F! N5 y; Z- N2 Y( D" c
read chunk-size and crlf//读取新的块大小
- G2 m3 G" D5 G' j; p}" [9 M1 @# D# S9 C' b4 m! A/ I
read entity-header//以下代码读取全部的头标记1 S* B" h' b1 Z. ~
while (entity-header not empty) {: Z" k) a( P: C3 l/ ?
append entity-header to existing header fields
- g, J, t" r _& `: Oread entity-header
! f* A4 @( G* ^9 b2 p) Y6 E- R}0 n" g( ?/ Q& P. `* _ [
content-length := length//头标记中添加内容长度9 v" U8 f0 W9 o1 H4 [3 L" _3 e
remove chunked from transfer-encoding//头标记中移除transfer-encoding
5 l: X8 ?) ?; C( u5 l) d3 T3 f有空再研究一下gzip+chunked是如何编码的,估计是每个chunk块进行一次gzip独立压缩。
& C& h* J" U4 ~! q- A使用了chunked,自然会在性能上稍微打点折扣,因为比正常的数据体多出了一些额外的消耗。
0 ^. p9 B) S! @- i4 ]! T$ y但是有一些情况下,必需要使用分块输出,这也是不得已而为之.5 S0 L( p1 h+ n
1 u9 D; I5 ~; M" L9 ~% x
更多网页制作信息请查看: 网页制作 |
|