视频压缩技术解析_科技_中国创投网- 领先的互联网消费互动媒体

6.1.1 视频信号压缩的可能性

视频数据中存在着大量的冗余，即图像的各像素数据之间存在极强的相关性。利用这些相关性，一部分像素的数据可以由另一部分像素的数据推导出来，结果视频数据量能极大地压缩，有利于传输和存储。视频数据主要存在以下形式的冗余。

1. 空间冗余视频图像在水平方向相邻像素之间、垂直方向相邻像素之间的变化一般都很小，存在着极强的空间相关性。特别是同一景物各点的灰度和颜色之间往往存在着空间连贯性，从而产生了空间冗余，常称为帧内相关性。

2. 时间冗余在相邻场或相邻帧的对应像素之间，亮度和色度信息存在着极强的相关性。当前帧图像往往具有与前、后两帧图像相同的背景和移动物体，只不过移动物体所在的空间位置略有不同，对大多数像素来说，亮度和色度信息是基本相同的，称为帧间相关性或时间相关性。

3. 结构冗余在有些图像的纹理区，图像的像素值存在着明显的分布模式。如方格状的地板图案等。已知分布模式，可以通过某一过程生成图像，称为结构冗余。 4. 知识冗余有些图像与某些知识有相当大的相关性。如人脸的图像有固定的结构，嘴的上方有鼻子，鼻子的上方有眼睛，鼻子位于脸部图像的中线上。这类规律性的结构可由先验知识得到，此类冗余称为知识冗余。 5. 视觉冗余人眼具有视觉非均匀特性，对视觉不敏感的信息可以适当地舍弃。在记录原始的图像数据时，通常假定视觉系统是线性的和均匀的，对视觉敏感和不敏感的部分同等对待，从而产生了比理想编码(即把视觉敏感和不敏感的部分区分开来编码)更多的数据，这就是视觉冗余。人眼对图像细节、幅度变化和图像的运动并非同时具有最高的分辨能力。人眼视觉对图像的空间分解力和时间分解力的要求具有交换性，当对一方要求较高时，对另一方的要求就较低。根据这个特点，可以采用运动检测自适应技术，对静止图像或慢运动图像降低其时间轴抽样频率，例如每两帧传送一帧；对快速运动图像降低其空间抽样频率。另外，人眼视觉对图像的空间、时间分解力的要求与对幅度分解力的要求也具有交换性，对图像的幅度误差存在一个随图像内容而变的可觉察门限，低于门限的幅度误差不被察觉，在图像的空间边缘(轮廓)或时间边缘(景物突变瞬间)附近，可觉察门限比远离边缘处增大3～4倍，这就是视觉掩盖效应。根据这个特点，可以采用边缘检测自适应技术，对于图像的平缓区或正交变换后代表图像低频成分的系数细量化，对图像轮廓附近或正交变换后代表图像高频成分的系数粗量化；当由于景物的快速运动而使帧间预测编码码率高于正常值时进行粗量化，反之则进行细量化。在量化中，尽量使每种情况下所产生的幅度误差刚好处于可觉察门限之下，这样能实现较高的数据压缩率而主观评价不变。

6. 图像区域的相同性冗余在图像中的两个或多个区域所对应的所有像素值相同或相近，从而产生的数据重复性存储，这就是图像区域的相似性冗余。在这种情况下，记录了一个区域中各像素的颜色值，与其相同或相近的区域就不再记录各像素的值。矢量量化方法就是针对这种冗余图像的压缩方法。 7. 纹理的统计冗余有些图像纹理尽管不严格服从某一分布规律，但是在统计的意义上服从该规律，利用这种性质也可以减少表示图像的数据量，称为纹理的统计冗余。电视图像信号数据存在的信息冗余为视频压缩编码提供了可能。

6.1.2 视频信号的数字化和压缩模拟电视信号(包括视频和音频)通过取样、量化后编码为二进制数字信号的过程称为模数变换(A／D变换)或脉冲编码调制(PCM， Pulse Coding Modulation)，所得到的信号也称为PCM信号，其过程可用图6-1(a)表示。若取样频率等于fs、用n比特量化，则PCM信号的码率为nfs(比特／s)。 PCM编码既可以对彩色全电视信号直接进行，也可以对亮度信号和两个色差信号分别进行，前者称为全信号编码，后者称为分量编码。

PCM信号经解码和插入滤波恢复为模拟信号，如图6-1(b)所示，解码是编码的逆过程，插入滤波是把解码后的信号插补为平滑、连续的模拟信号。这两个步骤合称为数模变换（D／A变换）或PCM解码。

图 6-1 电视信号的数字化和复原 (a) A/D变换； (b) D/A变换