3.1 图像的基本概念
3.1.1 图像的基本属性
1. 图像分辨率 2. 显示分辨率 3. 图像深度 4. 真彩色 5. 真彩色图像
3.1.2 图像的种类
放大区域
图3-1 矢量图和局部放大
放大区域
图
3-2 位图及其局部的放大
图3-3 单色图和灰度图
图3-4 真彩色图像和8色图像
3.2 图像色彩与色彩空间
3.2.1 颜色的描述与度量
图3-5 光谱色
1.
色调 2. 饱和度 3. 明度
图3-6 颜色圆
3.2.2 三基色原理
3.2.3 相加混色和相减混色
图3-7 三基色加色混色
3.2.4 颜色空间
1. RGB 颜色空间
根据三基色原理,任意一种颜色可以由下式匹配:
C =rR +gG +bB
式中的系数r
、g 和b 分别为三基色红、绿、和蓝的比例系数。
图3-8 RGB 颜色空间的表示
2. CMYK 颜色空间
3. XYZ 颜色空间 对任一颜色C ,有:
C =xX +yY +zZ
x +y +z =1,x 、y 、z 均大于0。和RGB 颜色空间有如下的换算关系: X =0. 49R 0+0. 3G 1+0
7+0. 8G +12 Y =0. 11R
Z =0. 01G 0+0. 9B 90
0. B 2
0. B 011
两组颜色空间坐标的相互转换关系为:
x =(0. 49r 0+
y =(0. 11r 7+z =
(0. 00r 0+
4. Lab 颜色空间
0. 3g 1+0
0. 8g 1+20. 0g 1+0200) r +(0. 66g 7+
011) r +(0. 66g 7+990) r +(0. 66g 7+1. 1b 32
1. 1b 321. 1b 32
图3-9 Lab 颜色模型
5. HSB 颜色空间
图3-10 HSB 颜色空间
6. YUV 颜色空间
0.11⎤⎡R ⎤⎡Y ⎤⎡0.300.59
⎢U ⎥=⎢-0.15-0.290.44⎥⎢G ⎥⎢⎥⎢⎥⎢⎥ ⎢⎣V ⎥⎦⎢⎣0.61-0.52-0.096⎥⎦⎢⎣B ⎥⎦
3.3 数字图像
3.3.1 图像数字化
图3-11 对一幅连续的图样的采样
图3-12 图像采样后的结果
图3-13 图像量化后的结果
⎡[***********]22 0000000000⎤⎢ ⎥⎢⎥
⎢⎥
⎢⎥[***********]665 666666666⎣⎦
矩阵和图像相对应,矩阵中每个元素a ij 取0~7中的任一整数。i 、j 为整
数,0
3.3.2 主流数字图像文件格式
1. BMP 图像文件
一幅256色的BMP 图像的文件头大致具有如下数据: 42 4D 40 04 00 00 00 00 00 00 36 04 00 00
第二部分是位图信息头的长度,用来描述位图的颜色、压缩方法等,如:
28 00 00 00 02 00 00 00 02 00 00 00 01 00 08 00 00 00„„
2. GIF 文件格式 3. TIFF 文件格式 4. PNG 格式
3.3.3 其他图像文件格式
1. PSD 格式 2. PCX 3. PDF
3.3.4 对格式的品质评估
1. 质量
2. 灵活性 3. 效率
3.4 静态图像压缩标准JPEG
3.4.1 JPEG 压缩算法简介 3.4.2 DCT 变换
DCT 变换是一种实数域变换,其变换核为实数的余弦函数,计算速度较
快,很适于做图像压缩。设一幅图像,或者一幅图像的某个彩色分量经过数字化后存为矩阵A ,并设A 为M ⨯N 矩阵,则二维DCT 变换定义为:
B (u , v ) =αu αv ∑∑A (x , y )cos
x =0y =0
M -1N -1
(2x +1) u π(2y +
1) v π
cos
2M 2N
其中:
u , x =0,1,2, , M -1
⎧⎪αu =v , y =0,1,2, , N -1
(v =0)(1≤v ≤N -1)
⎧⎪, αv =(1≤u ≤M -1) (u =0)
DCT 变换实际上是傅立叶变换的实数部分,它将一个空间域上的信号,
变换为一个频域上的信号。
例3-4 图像的DCT 变换。 解:
(a )原图
(b )进行DCT 变换后的图
图3-14 图像及DCT 变换后的频谱图
图3-14(b )对应645⨯600的矩阵A (每个颜色分量都有一个),为了舍弃高频部分,将该矩阵的高频部分置为0值。在这里令:
A (i , j ) =0, 388≤i ≤645, 361≤j ≤600
此时矩阵减少为387⨯360,数据量是原来的387⨯645⨯600=36%
随后用这样一个矩阵重构图像。方法是对该矩阵进行DCT 逆变换,变换公式如下:
(2x +1) u π(2y +1) v π
A (x , y ) =αu αv ∑∑B (u , v )cos cos
2M 2N u =0v =0
其中:
u , x =0,1,2, , M -1
M -1N -1
v , y =0,1,2, , N -1
(v =0)(1≤v ≤N -1)
⎧⎪αu =⎧⎪, αv =(1≤u ≤M -1) (u =0)
(a
)
(b )
图3-15 保留的低频部分和重构的图
(a )
258×240矩阵
(b )130×120矩阵
(c )65×60矩阵
图3-16 不同压缩比的比较
反之,仅去掉少量的低频部分,也会对图像形成很大的影响。图3-17是将矩阵A
的前15行和列置为0的情形。
图3-17 低频部分对图像的影响
3.4.3 JPEG 压缩流程
在实际的JPEG 压缩过程中,具体进行了以下的运算:
(1) 将图像从RGB 空间变换到YUV 空间。
(2) 将图像矩阵分块,对每一块单独进行DCT 变换。DCT 变换矩阵的
大小为8⨯8。 (3) 对变换后的DCT 矩阵进行量化处理,即用表3-1和表3-2的量化
矩阵分别对Y 分量和U 、V 分量量化。量化的原则是低频部分用小的值量化,高频部分用大的值量化,量化的结果将会在高频部分出现大量的“0”。
表3-1 JPEG 标准所推荐的亮度量化表
表3-2 JPEG 标准所推荐的色度量化表
(4) 量化后的系数要重新编排,目的是为了增加连续的“0”系数的个
数,就是“0”的游程长度,方法是按Z 字形的式样编排,如图3-18所示。这样就把一个8⨯8的矩阵变成一个1⨯64的矢量,频率较低的系数放在矢量的顶部。
图3-18 Z 字形编码
(5) 在第四步得到的数据的一个特点就是有大量连续的“0”。因此对
此数据采用了行程编码。 (6) 对全部数据进行霍夫曼编码。
3.5 数字图像处理
3.5.1
数字图像处理概述
3.5.2 图像的增强
图3-19 图片及其灰度直方图
图3-20 经过灰度扩展之后的图像与灰度直方图
图3-21 直方图均衡化后的结果
3.5.3 图像的几何变换
1. 平移(translation )
⎡u ⎤⎡1⎢v ⎥=⎢0⎢⎥⎢⎢⎣1⎥⎦⎢⎣0⎡x ⎤⎡1⎢y ⎥=⎢0⎢⎥⎢⎢⎣1⎥⎦⎢⎣0
0∆x ⎤⎡x ⎤
⎢y ⎥1∆y ⎥⎥⎢⎥
01⎥⎦⎢⎣1⎥⎦0-∆x ⎤⎡u ⎤
⎢v ⎥1-∆y ⎥⎥⎢⎥
01⎥⎦⎢⎣1⎥⎦
(a )原图
(b )平移
图3-22 图像的平移
2.
旋转(rotation )
(a )原图
(b )旋转
(c )旋转,大小不变
图3-23 图像的旋转
⎡u ⎤⎡cos(a ) 1/2⨯cos(a ) ⨯wnew -sin(a ) 1/2⨯cos(a ) ⨯hnew -1/2⨯wsource ⎤⎡x ⎤⎢v ⎥=⎢sin(a ) 1/2⨯sin(a ) ⨯wnew+cos(a ) 1/2⨯sin(a ) ⨯hnew+1/2⨯hsource ⎥⎢y ⎥⎢⎥⎢⎥⎢⎥ ⎢⎥01⎣1⎥⎦⎢⎣0⎦⎢⎣1⎥⎦⎡x ⎤⎡cos(a ) sin(a ) 1/2⨯wsource ⨯cos(a ) -1/2⨯sin(a ) ⨯hsource -1/2⨯wnew ⎤⎡u ⎤⎢y ⎥=⎢-sin(a ) cos(a ) -1/2⨯sin(a ) ⨯wsource -1/2⨯cos(a ) ⨯hsource+1/2⨯hnew ⎥⎢v ⎥⎢⎥⎢⎥⎢⎥⎢⎥01⎣1⎥⎦⎢⎣0⎦⎢⎣1⎥⎦
3.
镜像(mirror )和转置(transpose )
(
a )原图
(c )垂直镜像
图3-24
(b )水平镜像
(d )转置
图像的镜像和转置
3.5.4 更复杂的数字图像处理
3.6 Photoshop 简介
3.6.1 使用Photoshop
调整图像
图3-25 图像调整的命令菜单
图3-26 亮度与对比度的调节
图3-27 Levels 命令窗口
3.6.2
Photoshop 的图层与选区
图3-28 从图像中选择一架飞机
图3-29 魔术棒和自由套索工具
图3-30 选出的飞机
图3-31 飞机被粘贴在城市上空
图3-32 图层窗口
3.6.3
Photoshop 滤镜
图3-33 原图
图3-34 添加灯光效果
思考与练习
1.图像有哪些基本属性?
2.什么是矢量图?什么是位图?二者之间有何异同点?
3.什么是256色图?什么是真彩色图?在实际运用中,你认为应该根据哪些因素来选择颜色的数目?
4.什么是色调、饱和度和明度? 5.简述加色原理和减色原理。
6.简述RGB 、Lab 、YUV 颜色空间是如何对颜色进行描述的。
7.举例说明图像数字化的过程,并估算数字化后图像文件的大小。
8.谈谈你对不同图像文件格式的看法。在实际运用中,你准备如何选择格式? 9.简述JPEG 的压缩过程。
10.分别将一幅图像以jpg 、bmp 、tiff 、png 、pdf 、psd 的格式保存,比较它们占用空间的大小和画面的质量。再将这些图像用压缩软件压缩,如rar 或zip ,并比较压缩后的大小。选择不同画面的图像,如风景画、屏幕抓图等重复上述过程,你认为画面和文
件的大小有什么关系?
11.在一幅图像中选择一个局部,如一个花瓣、蓝天等单一景物。求出在这一局部中,红、绿和蓝颜色分量的最大亮度值是多少,最小亮度值是多少。
12.打开一幅图像,指出这幅图像最亮的地方在哪里,最暗的地方在哪里。
13.将一幅图像镜像后和原图拼合成一幅图像。
14.运用你熟悉的某种编程语言和编程环境,完成一种图像变换的算法。
3.1 图像的基本概念
3.1.1 图像的基本属性
1. 图像分辨率 2. 显示分辨率 3. 图像深度 4. 真彩色 5. 真彩色图像
3.1.2 图像的种类
放大区域
图3-1 矢量图和局部放大
放大区域
图
3-2 位图及其局部的放大
图3-3 单色图和灰度图
图3-4 真彩色图像和8色图像
3.2 图像色彩与色彩空间
3.2.1 颜色的描述与度量
图3-5 光谱色
1.
色调 2. 饱和度 3. 明度
图3-6 颜色圆
3.2.2 三基色原理
3.2.3 相加混色和相减混色
图3-7 三基色加色混色
3.2.4 颜色空间
1. RGB 颜色空间
根据三基色原理,任意一种颜色可以由下式匹配:
C =rR +gG +bB
式中的系数r
、g 和b 分别为三基色红、绿、和蓝的比例系数。
图3-8 RGB 颜色空间的表示
2. CMYK 颜色空间
3. XYZ 颜色空间 对任一颜色C ,有:
C =xX +yY +zZ
x +y +z =1,x 、y 、z 均大于0。和RGB 颜色空间有如下的换算关系: X =0. 49R 0+0. 3G 1+0
7+0. 8G +12 Y =0. 11R
Z =0. 01G 0+0. 9B 90
0. B 2
0. B 011
两组颜色空间坐标的相互转换关系为:
x =(0. 49r 0+
y =(0. 11r 7+z =
(0. 00r 0+
4. Lab 颜色空间
0. 3g 1+0
0. 8g 1+20. 0g 1+0200) r +(0. 66g 7+
011) r +(0. 66g 7+990) r +(0. 66g 7+1. 1b 32
1. 1b 321. 1b 32
图3-9 Lab 颜色模型
5. HSB 颜色空间
图3-10 HSB 颜色空间
6. YUV 颜色空间
0.11⎤⎡R ⎤⎡Y ⎤⎡0.300.59
⎢U ⎥=⎢-0.15-0.290.44⎥⎢G ⎥⎢⎥⎢⎥⎢⎥ ⎢⎣V ⎥⎦⎢⎣0.61-0.52-0.096⎥⎦⎢⎣B ⎥⎦
3.3 数字图像
3.3.1 图像数字化
图3-11 对一幅连续的图样的采样
图3-12 图像采样后的结果
图3-13 图像量化后的结果
⎡[***********]22 0000000000⎤⎢ ⎥⎢⎥
⎢⎥
⎢⎥[***********]665 666666666⎣⎦
矩阵和图像相对应,矩阵中每个元素a ij 取0~7中的任一整数。i 、j 为整
数,0
3.3.2 主流数字图像文件格式
1. BMP 图像文件
一幅256色的BMP 图像的文件头大致具有如下数据: 42 4D 40 04 00 00 00 00 00 00 36 04 00 00
第二部分是位图信息头的长度,用来描述位图的颜色、压缩方法等,如:
28 00 00 00 02 00 00 00 02 00 00 00 01 00 08 00 00 00„„
2. GIF 文件格式 3. TIFF 文件格式 4. PNG 格式
3.3.3 其他图像文件格式
1. PSD 格式 2. PCX 3. PDF
3.3.4 对格式的品质评估
1. 质量
2. 灵活性 3. 效率
3.4 静态图像压缩标准JPEG
3.4.1 JPEG 压缩算法简介 3.4.2 DCT 变换
DCT 变换是一种实数域变换,其变换核为实数的余弦函数,计算速度较
快,很适于做图像压缩。设一幅图像,或者一幅图像的某个彩色分量经过数字化后存为矩阵A ,并设A 为M ⨯N 矩阵,则二维DCT 变换定义为:
B (u , v ) =αu αv ∑∑A (x , y )cos
x =0y =0
M -1N -1
(2x +1) u π(2y +
1) v π
cos
2M 2N
其中:
u , x =0,1,2, , M -1
⎧⎪αu =v , y =0,1,2, , N -1
(v =0)(1≤v ≤N -1)
⎧⎪, αv =(1≤u ≤M -1) (u =0)
DCT 变换实际上是傅立叶变换的实数部分,它将一个空间域上的信号,
变换为一个频域上的信号。
例3-4 图像的DCT 变换。 解:
(a )原图
(b )进行DCT 变换后的图
图3-14 图像及DCT 变换后的频谱图
图3-14(b )对应645⨯600的矩阵A (每个颜色分量都有一个),为了舍弃高频部分,将该矩阵的高频部分置为0值。在这里令:
A (i , j ) =0, 388≤i ≤645, 361≤j ≤600
此时矩阵减少为387⨯360,数据量是原来的387⨯645⨯600=36%
随后用这样一个矩阵重构图像。方法是对该矩阵进行DCT 逆变换,变换公式如下:
(2x +1) u π(2y +1) v π
A (x , y ) =αu αv ∑∑B (u , v )cos cos
2M 2N u =0v =0
其中:
u , x =0,1,2, , M -1
M -1N -1
v , y =0,1,2, , N -1
(v =0)(1≤v ≤N -1)
⎧⎪αu =⎧⎪, αv =(1≤u ≤M -1) (u =0)
(a
)
(b )
图3-15 保留的低频部分和重构的图
(a )
258×240矩阵
(b )130×120矩阵
(c )65×60矩阵
图3-16 不同压缩比的比较
反之,仅去掉少量的低频部分,也会对图像形成很大的影响。图3-17是将矩阵A
的前15行和列置为0的情形。
图3-17 低频部分对图像的影响
3.4.3 JPEG 压缩流程
在实际的JPEG 压缩过程中,具体进行了以下的运算:
(1) 将图像从RGB 空间变换到YUV 空间。
(2) 将图像矩阵分块,对每一块单独进行DCT 变换。DCT 变换矩阵的
大小为8⨯8。 (3) 对变换后的DCT 矩阵进行量化处理,即用表3-1和表3-2的量化
矩阵分别对Y 分量和U 、V 分量量化。量化的原则是低频部分用小的值量化,高频部分用大的值量化,量化的结果将会在高频部分出现大量的“0”。
表3-1 JPEG 标准所推荐的亮度量化表
表3-2 JPEG 标准所推荐的色度量化表
(4) 量化后的系数要重新编排,目的是为了增加连续的“0”系数的个
数,就是“0”的游程长度,方法是按Z 字形的式样编排,如图3-18所示。这样就把一个8⨯8的矩阵变成一个1⨯64的矢量,频率较低的系数放在矢量的顶部。
图3-18 Z 字形编码
(5) 在第四步得到的数据的一个特点就是有大量连续的“0”。因此对
此数据采用了行程编码。 (6) 对全部数据进行霍夫曼编码。
3.5 数字图像处理
3.5.1
数字图像处理概述
3.5.2 图像的增强
图3-19 图片及其灰度直方图
图3-20 经过灰度扩展之后的图像与灰度直方图
图3-21 直方图均衡化后的结果
3.5.3 图像的几何变换
1. 平移(translation )
⎡u ⎤⎡1⎢v ⎥=⎢0⎢⎥⎢⎢⎣1⎥⎦⎢⎣0⎡x ⎤⎡1⎢y ⎥=⎢0⎢⎥⎢⎢⎣1⎥⎦⎢⎣0
0∆x ⎤⎡x ⎤
⎢y ⎥1∆y ⎥⎥⎢⎥
01⎥⎦⎢⎣1⎥⎦0-∆x ⎤⎡u ⎤
⎢v ⎥1-∆y ⎥⎥⎢⎥
01⎥⎦⎢⎣1⎥⎦
(a )原图
(b )平移
图3-22 图像的平移
2.
旋转(rotation )
(a )原图
(b )旋转
(c )旋转,大小不变
图3-23 图像的旋转
⎡u ⎤⎡cos(a ) 1/2⨯cos(a ) ⨯wnew -sin(a ) 1/2⨯cos(a ) ⨯hnew -1/2⨯wsource ⎤⎡x ⎤⎢v ⎥=⎢sin(a ) 1/2⨯sin(a ) ⨯wnew+cos(a ) 1/2⨯sin(a ) ⨯hnew+1/2⨯hsource ⎥⎢y ⎥⎢⎥⎢⎥⎢⎥ ⎢⎥01⎣1⎥⎦⎢⎣0⎦⎢⎣1⎥⎦⎡x ⎤⎡cos(a ) sin(a ) 1/2⨯wsource ⨯cos(a ) -1/2⨯sin(a ) ⨯hsource -1/2⨯wnew ⎤⎡u ⎤⎢y ⎥=⎢-sin(a ) cos(a ) -1/2⨯sin(a ) ⨯wsource -1/2⨯cos(a ) ⨯hsource+1/2⨯hnew ⎥⎢v ⎥⎢⎥⎢⎥⎢⎥⎢⎥01⎣1⎥⎦⎢⎣0⎦⎢⎣1⎥⎦
3.
镜像(mirror )和转置(transpose )
(
a )原图
(c )垂直镜像
图3-24
(b )水平镜像
(d )转置
图像的镜像和转置
3.5.4 更复杂的数字图像处理
3.6 Photoshop 简介
3.6.1 使用Photoshop
调整图像
图3-25 图像调整的命令菜单
图3-26 亮度与对比度的调节
图3-27 Levels 命令窗口
3.6.2
Photoshop 的图层与选区
图3-28 从图像中选择一架飞机
图3-29 魔术棒和自由套索工具
图3-30 选出的飞机
图3-31 飞机被粘贴在城市上空
图3-32 图层窗口
3.6.3
Photoshop 滤镜
图3-33 原图
图3-34 添加灯光效果
思考与练习
1.图像有哪些基本属性?
2.什么是矢量图?什么是位图?二者之间有何异同点?
3.什么是256色图?什么是真彩色图?在实际运用中,你认为应该根据哪些因素来选择颜色的数目?
4.什么是色调、饱和度和明度? 5.简述加色原理和减色原理。
6.简述RGB 、Lab 、YUV 颜色空间是如何对颜色进行描述的。
7.举例说明图像数字化的过程,并估算数字化后图像文件的大小。
8.谈谈你对不同图像文件格式的看法。在实际运用中,你准备如何选择格式? 9.简述JPEG 的压缩过程。
10.分别将一幅图像以jpg 、bmp 、tiff 、png 、pdf 、psd 的格式保存,比较它们占用空间的大小和画面的质量。再将这些图像用压缩软件压缩,如rar 或zip ,并比较压缩后的大小。选择不同画面的图像,如风景画、屏幕抓图等重复上述过程,你认为画面和文
件的大小有什么关系?
11.在一幅图像中选择一个局部,如一个花瓣、蓝天等单一景物。求出在这一局部中,红、绿和蓝颜色分量的最大亮度值是多少,最小亮度值是多少。
12.打开一幅图像,指出这幅图像最亮的地方在哪里,最暗的地方在哪里。
13.将一幅图像镜像后和原图拼合成一幅图像。
14.运用你熟悉的某种编程语言和编程环境,完成一种图像变换的算法。