数字图像处理

在数字图像处理领域,本书作为主要教材已有 40 多年的历史。第四版是作者在前三版的基础上修订而成的,是前三版的发展与延续。除保留前几版的大部分内容外,根据读者的反馈,作者对本书进行了全面修订,融入了近几年来数字图像处理领域的重要进展,增加了几百幅新图像、几十个新图表和上百道新习题。全书共十二章,即绪论、数字图像基础、灰度变换与空间滤波、频率域滤波、图像复原与重建、小波变换和其他图像变换、彩色图像处理、图像压缩和水印、形态学图像处理、图像分割、特征提取、图像模式等。

本书的读者对象主要是从事信号与信息处理、通信工程、电子科学与技术、信息工程、自动化、计算机科学与技术、地球物理、生物工程、生物医学工程、物理、化学、医学、遥感等领域的大学教师和科技工作者、研究生、大学本科高年级学生及工程技术人员。

第 1 章 绪论

1.1 什么是数字图像处理

一幅图像可以定义为一个二维函数 $f(x, y)$,其中 $x$ 和 $y$ 是空间(平面)坐标,任一一对空间坐标 $(x, y)$ 处的幅值 $f$ 称为图像在该点的强度灰度。当 $x$,$y$ 和灰度值 $f$ 都是有限的离散量时,我们称该图像为数字图像数字图像处理是指借助于数字计算机来处理数字图像。注意,数字图像由有限数量的元素组成,每个元素都有一个特定的位置和数值。这些元素称为图画元素图像元素像素

考虑三种类型的计算机图像处理:

  • 低级处理:初级图像操作,涉及降噪、对比度增强和图像锐化等。
  • 中级处理:涉及诸多任务,如图像分割、提取特征(如边缘、轮廓和各个目标的识别)。
  • 高级处理:涉及“理解”目标,以及执行与人类视觉相关的认识功能。

本书将数字图像处理界定为输入和输出都是图像的处理,它包含从图像种提取特征的处理,甚至包含各个目标的识别。举例:如文本自动分析。

1.2 数字图像处理的起源

数字图像处理的历史与数字计算机的发展密切相关。事实上,数字图像处理要求巨大的储存和计算能力,数字图像处理领域的发展一直依赖于数字计算机及数据存储、显示和传输等支撑技术的发展。

1.3 数字图像处理技术应用领域实例

基于电磁波谱辐射的成像:

  • 伽马射线成像:核医学和天文观测。
  • X 射线成像:医学诊断,工业成像,天文学。
  • 紫外波段成像:平板印刷术、工业检测、显微方法、激光、生物成像、天文观测。
  • 可见光和红外波段成像:光显微方法、天文学、遥感、工业和执法。
  • 微波波段成像:雷达,不受天气、光照条件影响。
  • 无线电波段成像:医学和天文学。
  • 其他方式成像:声波成像(B超)、电子显微方法、合成成像(分形)。

1.4 数字图像处理的基本步骤

1.5 图像处理系统的组成

第 2 章 数字图像基础

2.1 视觉感知要素

2.1.1 人眼的结构

角膜是坚硬并且透明的组织,覆盖在人眼的前表面。
巩膜是包围眼球其余部分的不透明膜。
脉络膜中含有血管网,它是眼睛的主要营养来源。
虹膜的收缩和扩张控制进入人眼的光量。
晶状体吸收约 8% 的可见光谱,对短波长的光有较高的吸收率。
视网膜布满整个后部的内壁。眼睛聚焦时,来自物体的光在视网膜上成像。其上分布有对颜色高度敏感的锥状体和对低光照敏感的杆状体。

2.1.2 人眼中图像的成像

在普通照相机中,镜头的焦距是固定的。不同距离的聚焦是通过改变镜头和成像平面之间的距离来实现的,胶片(或数码相机的成像芯片)放在成像平面上。在人眼中,情况与此相反;晶状体和成像区域(视网膜)之间的距离是固定的,正确聚焦的焦距是通过改变晶状体的形状得到的。在远离或接近目标时,睫状体中的纤维通过分别压扁或加厚晶状体来实现聚焦。

2.1.3 亮度适应与辨别

人类视觉系统能够适应的光强邓建的范围很宽——从暗阈值到强光约有 $10^{10}$ 级别。实验数据表明,主观亮度(即人类视觉系统感知的亮度)是进入人眼的光强的对数函数。

现象一:视觉系统往往会在不同灰度区域的边界处出现“下冲”或“上冲”现象,典型如马赫带效应

现象二:同时对比,即一个区域的感知亮度不只取决于其灰度,还与其周边环境的灰度相关。

现象三:光学错视,即人眼中充斥这不存在的信息或错误地感知了物体的几何特点。

2.2 光和电磁波

电磁波谱可用波长、频率或能量来表示。波长($\lambda$)和频率($v$)的关系为:$\lambda = c / v$;式中 $c$ 是光速。

电磁波谱个分量的能量为 $E = hv$;式中 $h$ 是普朗克常数。常用能量单位是电子伏特。

电磁波可视为以波长 $\lambda$ 传播的正弦波,或视为没有质量的粒子流,每个粒子像波浪一样行进并以光速运动。每个无质量的粒子都是具有一定(一束)能量的粒子,称为光子

光是一种电磁辐射,它可以被人眼感知。电磁波谱可见光波段范围是 0.43 um(紫色)~ 0.79 um(红色)。

感知的物体颜色由物体反射的光的性质决定。相对平衡地以所有可见光波长反射光的物体,在观察者看来呈现白色。

没有颜色的光称为单色光无色光。单色光的唯一属性是亮度。单色光从黑到白的数值范围通常称为灰度级,而单色图像常称为灰度图像

对于彩色光,除了频率外,我们还用三个其他量来描述彩色光源:辐射、光通量和亮度。辐射是从光源流出的总能量,通常用瓦特(W)来度量。光通量是观察者从光源感知的能量,但通常用流明(lm)来度量。亮度是光感知的主观描绘子,它实际上不能度量,体现的是强度的无色概念,是描述色彩感觉的关键因素之一。

原理上,如果能够开发传感器来检测由一个电磁波谱波段发射的能量,那么 就能在该波段上对感兴趣的事件成像。

2.3 图像感知与获取

我们感兴趣的大多数图像,都是由“照射”源和形成图像的“场景”元素对光能的反射和吸收产生的。对“照射”和“场景”加引号的目的,是强调它们要比我们熟悉的可见光源照射三维场景的情况更为普遍。例如,照射可能来自电磁能量源,如雷达、红外线或 X 射线系统。也可能来自非传统光源(如超声波),甚至来自计算机产生的照射模式。

2.3.1 使用单个传感器获取图像

2.3.2 使用条带传感器获取图像

  • 安装有成像条带传感器的飞行器以恒定高度和速度飞过待成像区域,对地面进行成像。
  • 医学和工业成像使用环形条带传感器获取三维物体的剖面(“切片”)图像。

2.3.3 使用阵列传感器获取图像

优点是将能量聚焦到阵列表面就可得到一幅完整的图像,不需要传感器排列的运动。典型如数字摄像机的典型传感器 CCD(电荷耦合器件)阵列。

2.3.4 一个简单的成像模型

我们用形如 $f(x,y)$ 的二维函数来表示图像。在空间坐标 $(x,y)$ 处 $f$ 的值是一个标量,其物理异议由图像源决定,其值与物理源(如电磁波)辐射的能量成正比。因此 $f(x,y)$ 一定是非负的和有限的,即 $0 \leq f(x,y) < \infty$ 。

函数 $f(x,y)$ 由两个分量表征:(1)入射到被观察场景的光源照射量;(2)被场景中物体反射的照射量。它们分别称为入射分量反射分量,并分别用 $i(x,y)$ 和 $r(x,y)$ 表示。这两个函数的乘积形成 $f(x,y)$,即 $f(x,y)=i(x,y)r(x,y)$,式中,$0 \leq i(x,y) < \infty$ 且 $0 \leq r(x,y) \leq 1$。

于是,反射分量限制在 0(全吸收)和 1(全反射)之间。$i(x,y)$ 的性质取决于照射源,而 $r(x,y)$ 的性质取决于被成像物体的特性。这些表达式也适用于投射成像的情况,如胸透 X 射线。这时,要用透射系数代替反射函数。

2.4 图像取样和量化


数字图像处理
http://example.com/2023/08/10/digital-image-processing/
作者
QiDianMaker
发布于
2023年8月9日
更新于
2023年8月14日
许可协议