《多媒体数据处理技术.ppt》由会员分享,可在线阅读,更多相关《多媒体数据处理技术.ppt(34页珍藏版)》请在优知文库上搜索。
1、第第 5 章章多媒体数据压缩技术多媒体数据压缩技术5.1 数据压缩基本原理数据压缩基本原理 5.1.1 信息、数据与编码信息、数据与编码 5.1.2 数据压缩的条件数据压缩的条件 5.1.3 数据冗余数据冗余5.2 数据压缩算法数据压缩算法 5.2.1 数据压缩算法分类数据压缩算法分类 5.2.2 预测编码原理预测编码原理 5.2.3 变换编码原理变换编码原理 5.2.4 统计编码原理统计编码原理 5.2.5 霍夫曼编码原理霍夫曼编码原理 5.2.6 行程编码原理行程编码原理 5.2.7 算术编码原理算术编码原理 5.2.8 LZW压缩编码压缩编码5.3 静态图像静态图像JPEG压缩编码技术压
2、缩编码技术 5.3.1 JPEG标准的由来标准的由来 5.3.2 JPEG压缩算法压缩算法 5.3.3 无失真预测编码无失真预测编码 5.3.4 有失真有失真DCT压缩编码压缩编码5.4 动态图像动态图像MPEG压缩编码技术压缩编码技术 5.4.1 基本原理基本原理 5.4.2 MPEG技术标准技术标准数据压缩基本原理数据压缩基本原理5.15.1.1 信息、数据与编码信息、数据与编码1信息和熵信息和熵 信息量的大小和消息有一定的关系。在数学上,消息是其出现概率信息量的大小和消息有一定的关系。在数学上,消息是其出现概率 的单调下降函数。信息量越大,消息的可能性越小,反之亦然。的单调下降函数。信息
3、量越大,消息的可能性越小,反之亦然。 信息量:为了从信息量:为了从N个相等的可能事件中挑选出一个事件所需的信息个相等的可能事件中挑选出一个事件所需的信息 度量和含量,所提问度量和含量,所提问“是或否是或否”的次数。也就是说,在的次数。也就是说,在N个事件中辨个事件中辨 识特定的一个事件要询问识特定的一个事件要询问“是或否是或否”次数。次数。要从要从256个数中选定某一个数,可以先提问个数中选定某一个数,可以先提问“是否大于是否大于128?”,不,不论论回答是与否,则半数的可能事件被取消。如果继续询问下去,每次回答是与否,则半数的可能事件被取消。如果继续询问下去,每次询问将对应一个询问将对应一个
4、1bit的信息量。的信息量。例例例例随着每次询问,有半数的可能事件被取消,这个过程由公式表示:随着每次询问,有半数的可能事件被取消,这个过程由公式表示:可看出:对于可看出:对于256个数的询问只要进行个数的询问只要进行8次,即可确定一个具体的数。次,即可确定一个具体的数。设:从设:从N个数中选定任意一个数个数中选定任意一个数x的概率为的概率为p(x),假定选定任意一个数,假定选定任意一个数的概率都相等,即的概率都相等,即p (x)=1/N,则信息量为:,则信息量为:log2256 = 8 bit如果将信息源所有可能事件的信息量进行平均,即可得到信息的如果将信息源所有可能事件的信息量进行平均,即
5、可得到信息的“熵熵” (熵是平均信息量熵是平均信息量),信息源,信息源X的符号集为的符号集为xi(i=1,2,N)。设:设:xi出现的概率为出现的概率为p(xi),则信息源,则信息源X的熵为:的熵为:I(x) = log2N = - log21N = - log2p(x) = Ip(x)H(x) =P(xi )log2p(xi )P(xi ) I p(xi ) = -ni=1ni=1信息与数据信息与数据2.信息可以用函数表示,该函数由信息论创始人信息可以用函数表示,该函数由信息论创始人C.E.Shannon提出,提出,以概率论的观点对信息进行定量描述,具体的信息函数表达式为:以概率论的观点对信
6、息进行定量描述,具体的信息函数表达式为:I(ai ) = -log2Pi (i = 1,2,r )公式中,公式中,Pi (i = 1,2,r )是随机消息组合是随机消息组合Xa1,a2,ar中的中的消息消息ai (i = 1,2,r )的先验概率。的先验概率。Pi 可以度量可以度量ai (i = 1,2,r )所含的信息量。所含的信息量。而而I(ai) (i = 1,2,r )在在X的先验概率空间的先验概率空间Pp1,p2,pr中的中的统计平均值为信息源统计平均值为信息源X的熵:的熵:信息源信息源X的熵用来度量的熵用来度量X中每种消息所包含的平均信息量。信息熵中每种消息所包含的平均信息量。信息
7、熵主要表示信息系统的有序程度,而不是热力学中系统的无序程度。主要表示信息系统的有序程度,而不是热力学中系统的无序程度。H(X) = Hp1,p2,pr = -Pilog2pini=1多媒体信息的数据量多媒体信息的数据量3.1) 文本文本 假设屏幕显示分辨率为假设屏幕显示分辨率为1024768,字符为,字符为1616点阵,点阵, 每个字符用每个字符用4个字节表示,则显示一屏字符所需要的存储空间为:个字节表示,则显示一屏字符所需要的存储空间为: (1024/16)(768/16)4 B = 12288 B(约合(约合12KB)2) 图像图像 假定图像显示在假定图像显示在1024768分辨率的屏幕上
8、,则满屏幕分辨率的屏幕上,则满屏幕 像点所占用的空间为:像点所占用的空间为: 1024768log2256 = 768 KB3) 音频音频 假定模拟声音频率假定模拟声音频率22050 Hz,其数字采样频率,其数字采样频率44100 Hz, 采样精度为采样精度为16bit,双声道立体声模式,则,双声道立体声模式,则1min所需数据量为:所需数据量为: 44100Hz2B (16bit采样精度采样精度)2 (双声道双声道)60s = 10 MB/min4) 视频视频 采用带宽为采用带宽为5MHz的的PAL制视频信号,扫描速度制视频信号,扫描速度25帧帧/ s, 样本宽度样本宽度24bit,采样频率
9、最低,采样频率最低10MHz,则一帧数字化图像所占用的,则一帧数字化图像所占用的 最少存储空间为:最少存储空间为: 10 (采样频率采样频率)25 (扫描速度扫描速度)24 (样本宽度样本宽度) = 9.6Mbit (合合1.2 MB)数据压缩的条件数据压缩的条件5.1.2 数据冗余度数据冗余度 (重复数据、可忽略数据重复数据、可忽略数据) 信息传输与存储的限制信息传输与存储的限制 (压缩压缩 传输或存储传输或存储 解压缩解压缩) 44.1kHz / Stereo 1.3MB 22.0kHz / Mono 0.3MB Stop重复数据重复数据可忽略数据可忽略数据 人类不敏感因素人类不敏感因素
10、(颜色、亮度、细节等颜色、亮度、细节等)224 颜色颜色 (16,777,216色色)28 颜色颜色 (256色色) 音频不敏感因素音频不敏感因素 (试听试听) 颜色不敏感因素颜色不敏感因素数据冗余数据冗余5.1.3 冗余基本概念冗余基本概念 冗余冗余 信息所具有的各种性质中多余的无用空间信息所具有的各种性质中多余的无用空间 冗余度冗余度 多余的无用空间的程度多余的无用空间的程度I = D duI 信息量信息量 D 数据量数据量 du 冗余量,包含在冗余量,包含在D中中 信息量与冗余的关系信息量与冗余的关系 冗余举例冗余举例播音员播音员 180字字/分钟,分钟,2Byte一个字,一个字,360
11、Byte (合合0.35KB/分钟分钟)音频数据音频数据8kHz采样采样8bit60秒秒 = 3840KBit (合合480KB/分钟分钟)冗余分类冗余分类1 空间冗余空间冗余规则物体的物理相关性规则物体的物理相关性2 时间冗余时间冗余视频与动画画面间的相关性视频与动画画面间的相关性3 统计冗余统计冗余具有空间冗余和时间冗余具有空间冗余和时间冗余6 视觉冗余视觉冗余视觉、听觉敏感度和非线性感觉视觉、听觉敏感度和非线性感觉7 知识冗余知识冗余凭借经验识别凭借经验识别4 结构冗余结构冗余规则纹理、相互重叠的结构表面规则纹理、相互重叠的结构表面5 信息熵冗余信息熵冗余编码冗余,数据与携带的信息编码冗
12、余,数据与携带的信息8 其他冗余其他冗余上述上述7种以外的冗余种以外的冗余冗余分类冗余分类1 空间冗余空间冗余规则物体的物理相关性规则物体的物理相关性2 时间冗余时间冗余视频与动画画面间的相关性视频与动画画面间的相关性3 统计冗余统计冗余具有空间冗余和时间冗余具有空间冗余和时间冗余6 视觉冗余视觉冗余视觉、听觉敏感度和非线性感觉视觉、听觉敏感度和非线性感觉7 知识冗余知识冗余凭借经验识别凭借经验识别4 结构冗余结构冗余规则纹理、相互重叠的结构表面规则纹理、相互重叠的结构表面5 信息熵冗余信息熵冗余编码冗余,数据与携带的信息编码冗余,数据与携带的信息8 其他冗余其他冗余上述上述7种以外的冗余种以
13、外的冗余冗余分类冗余分类1 空间冗余空间冗余规则物体的物理相关性规则物体的物理相关性2 时间冗余时间冗余视频与动画画面间的相关性视频与动画画面间的相关性3 统计冗余统计冗余具有空间冗余和时间冗余具有空间冗余和时间冗余6 视觉冗余视觉冗余视觉、听觉敏感度和非线性感觉视觉、听觉敏感度和非线性感觉7 知识冗余知识冗余凭借经验识别凭借经验识别4 结构冗余结构冗余规则纹理、相互重叠的结构表面规则纹理、相互重叠的结构表面5 信息熵冗余信息熵冗余编码冗余,数据与携带的信息编码冗余,数据与携带的信息8 其他冗余其他冗余上述上述7种以外的冗余种以外的冗余冗余分类冗余分类1 空间冗余空间冗余规则物体的物理相关性规
14、则物体的物理相关性2 时间冗余时间冗余视频与动画画面间的相关性视频与动画画面间的相关性3 统计冗余统计冗余具有空间冗余和时间冗余具有空间冗余和时间冗余6 视觉冗余视觉冗余视觉、听觉敏感度和非线性感觉视觉、听觉敏感度和非线性感觉7 知识冗余知识冗余凭借经验识别凭借经验识别4 结构冗余结构冗余规则纹理、相互重叠的结构表面规则纹理、相互重叠的结构表面5 信息熵冗余信息熵冗余编码冗余,数据与携带的信息编码冗余,数据与携带的信息8 其他冗余其他冗余上述上述7种以外的冗余种以外的冗余冗余分类冗余分类1 空间冗余空间冗余规则物体的物理相关性规则物体的物理相关性2 时间冗余时间冗余视频与动画画面间的相关性视频
15、与动画画面间的相关性3 统计冗余统计冗余具有空间冗余和时间冗余具有空间冗余和时间冗余6 视觉冗余视觉冗余视觉、听觉敏感度和非线性感觉视觉、听觉敏感度和非线性感觉7 知识冗余知识冗余凭借经验识别凭借经验识别4 结构冗余结构冗余规则纹理、相互重叠的结构表面规则纹理、相互重叠的结构表面5 信息熵冗余信息熵冗余编码冗余,数据与携带的信息编码冗余,数据与携带的信息8 其他冗余其他冗余上述上述7种以外的冗余种以外的冗余冗余分类冗余分类1 空间冗余空间冗余规则物体的物理相关性规则物体的物理相关性2 时间冗余时间冗余视频与动画画面间的相关性视频与动画画面间的相关性3 统计冗余统计冗余具有空间冗余和时间冗余具有
16、空间冗余和时间冗余6 视觉冗余视觉冗余视觉、听觉敏感度和非线性感觉视觉、听觉敏感度和非线性感觉7 知识冗余知识冗余凭借经验识别凭借经验识别4 结构冗余结构冗余规则纹理、相互重叠的结构表面规则纹理、相互重叠的结构表面5 信息熵冗余信息熵冗余编码冗余,数据与携带的信息编码冗余,数据与携带的信息8 其他冗余其他冗余上述上述7种以外的冗余种以外的冗余224色色28色色冗余分类冗余分类1 空间冗余空间冗余规则物体的物理相关性规则物体的物理相关性2 时间冗余时间冗余视频与动画画面间的相关性视频与动画画面间的相关性3 统计冗余统计冗余具有空间冗余和时间冗余具有空间冗余和时间冗余6 视觉冗余视觉冗余视觉、听觉敏感度和非线性感觉视觉、听觉敏感度和非线性感觉7 知识冗余知识冗余凭借经验识别凭借经验识别4 结构冗余结构冗余规则纹理、相互重叠的结构表面规则纹理、相互重叠的结构表面5 信息熵冗余信息熵冗余编码冗余,数据与携带的信息编码冗余,数据与携带的信息8 其他冗余其他冗余上述上述7种以外的冗余种以外的冗余冗余分类冗余分类1 空间冗余空间冗余规则物体的物理相关性规则物体的物理相关性2 时间冗余时间冗余视频与动