返回列表 发新帖

http协议之chunked解析

194.2k 8
swmozowtfl 发表于 2015-7-10 20:44:48|湖北 | 查看全部 阅读模式
网上使用chunked编码的网站似乎并不是很多,除了那些使用gzip压缩的网站,例:google.com,还有就是大部分打开gzip压缩的php论坛。2 B2 P$ }( b: j7 H- P2 [7 B
根据本人的理解,使用chunked编码的主要好处就在于一些程序的运算出过程中,可以动态的输出内容。
0 s. v# v& z# m# i. d4 h例如,要在后台处理一个小时的运算,但又不希望用户等一个小时才能看到结果。这时就可采用chunked编码将内容分块输出,用户随时都可以接收到最新的处理结果。: c" W5 k- I+ a4 v$ Q! U% p
asp关闭了缓存的输出模式,就是chunked编码的。(response.buffer = false)& I( W8 l9 V5 u6 n9 [1 @' z0 A
而每一次的response.write,都是一个chunked,所以不要使用的太频繁哦,否则chunk数量太多,额外的数据太浪费空间了。
$ L, w2 I6 p8 f$ p" D: u若想了解chunked的具体编码结构,用asp关闭缓存调试蛮方便的。:): ~' t$ H; ~5 s. M4 D" i
我们先来看看rfc2616中对chunked的定义:( Q. i, G! W% {
chunked-body = *chunk
) _  }5 ~! c$ f" u7 j: llast-chunk
- `) H* o. w$ Ctrailer
7 m% s/ T8 n+ M1 W6 `. rcrlf
* n% j! l0 m5 }$ _. ~* Achunk = chunk-size [ chunk-extension ] crlf
9 x0 F  w8 M, Schunk-data crlf
7 X: U1 Y# P3 Z7 M: f  N9 zchunk-size = 1*hex
* q. ]6 f. Q* b& G8 w' alast-chunk = 1*(0) [ chunk-extension ] crlf
& P" ]0 ]9 ^( \  x& bchunk-extension= *( ; chunk-ext-name [ = chunk-ext-val ] )
' u+ h; b- e& ~- u5 t0 vchunk-ext-name = token
8 `5 y) J2 G! n$ J. Echunk-ext-val = token | quoted-string5 ^7 O, A- Z; f2 P% F# Z
chunk-data = chunk-size(octet)
# t  h: ^: X! N( ltrailer = *(entity-header crlf)
6 F: g; `3 G3 h7 l: {; [* |7 m0 F我们来模拟一下数据结构:
% a% y' J* Z5 m# L6 z6 _[chunk大小][回车][chunk数据体][回车][chunk大小][回车][chunk数据体][回车][0][回车]
% K" K% c3 @* s' \$ ~8 E注意chunk-size是以十六进制的ascii码表示的,比如86ae(实际的十六进制应该是:38366165),计算成长度应该是:34478,表示从回车之后有连续的34478字节的数据。
4 p; ?: K: d- S  v跟踪了的返回数据,发现在chunk-size中,还会多一些空格。可能是固定长度为7个字节,不满7个字节的,就以空格补足,空格的ascii码是0x20。, P" L" B( T& w5 X( G% o
以下是解码过程的伪代码:! I6 {% W* p  m3 {! w2 H" N
length := 0//用来记录解码后的数据体长度9 Y/ h: h! @3 n2 \" ?# B
read chunk-size, chunk-extension (if any) and crlf//第一次读取块大小3 @. q6 S, u1 C/ B2 b- G! a
while (chunk-size > 0) {//一直循环,直到读取的块大小为03 w% |: P$ L: v
read chunk-data and crlf//读取块数据体,以回车结束5 c5 }- ~# _0 I& [$ l
append chunk-data to entity-body//添加块数据体到解码后实体数据
# P# k' w& C" R, }% I( o$ Xlength := length + chunk-size//更新解码后的实体长度
; J1 u+ l: L  v! H; l; n7 ]1 oread chunk-size and crlf//读取新的块大小/ b( v- c" V* n5 ~4 v. H
}. p  v/ n; e- F$ u' ?2 v: h/ O8 X
read entity-header//以下代码读取全部的头标记& [6 E6 q5 \1 ?+ u. {
while (entity-header not empty) {
! X: T! U4 E5 Z/ v4 sappend entity-header to existing header fields2 W% x8 A3 k% K( i
read entity-header! @/ p! D. p# P
}( H. s' Z% @: C
content-length := length//头标记中添加内容长度5 ?4 D& a$ A8 W/ X
remove chunked from transfer-encoding//头标记中移除transfer-encoding
* s# {+ A0 z8 I( [. u* E# ?有空再研究一下gzip+chunked是如何编码的,估计是每个chunk块进行一次gzip独立压缩。
7 G( a& U2 H4 W, U- p3 ~) s使用了chunked,自然会在性能上稍微打点折扣,因为比正常的数据体多出了一些额外的消耗。
( `+ l7 q& c* c4 W; w/ ?但是有一些情况下,必需要使用分块输出,这也是不得已而为之." |$ i! i/ w4 y) }. {2 ]6 X

8 r: ~7 f/ k' s: V0 Y: w. M2 ]& S更多网页制作信息请查看: 网页制作

回复|共 8 个

gevaemaidovef 发表于 2016-3-24 15:23:38|Reserved | 查看全部
楼猪.重量级人物阿.
Mqokjdvq 发表于 2016-3-24 15:24:17|加拿大 | 查看全部
笨点也好~~~~
seazvyt 发表于 2016-3-24 15:24:19|英国 | 查看全部
我又回复了
tohme 发表于 2016-3-24 15:24:27|韩国 | 查看全部
cd:遮~~~~~~
tohme 发表于 2016-4-1 11:59:35|美国 | 查看全部
这话从何说起那~~~
buingeEvineus 发表于 2016-4-1 11:59:36|美国 | 查看全部
唉!猪!你怎么了?
GoodyFouppy 发表于 2016-4-1 12:00:15|美国 | 查看全部
这就是我斗胆的一点粗略分析,每天睡觉以前,我都会把您的帖子再三拜读,拜读。
bqtklouu 发表于 2016-4-1 12:00:44|美国 | 查看全部
你该这么说~~

回复

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

得知互动是一个融创意、设计、开发、营销、生活、互联网于一体的专业交流分享平台。
Copyright © 2026 站长技术交流论坛|互联网技术交流平台 版权所有 All Rights Reserved. Powered by Discuz! X5.0 鄂ICP备15006301号-5|鄂公网安备 42018502006730号
关灯 在本版发帖 扫一扫添加QQ客服 返回顶部
快速回复 返回顶部 返回列表