您的位置:自考365 > 自考资讯 > 教材大纲 > 江苏自学考试语音与图象信号处理教材大纲

江苏自学考试语音与图象信号处理教材大纲

2006-11-17 10:20   【 】【我要纠错

  南京理工大学编 (高纲号 0553)

  Ⅰ、课程性质与设置目的要求

  “语音与图象信号处理”是江苏省高等教育自学考试电子工程专业的必修课,是为了培养和检验自学应考者信号处理的基本知识和基本技能而设置的一门专业课程,本课程分为两大部分,第一部分是语音信号处理,第二部分是数字图象处理。

  语音信号处理是一门比较实用的电子工程的专业课程,语音是人类获取信息的重要来源和利用信息的重要手段。通过语言相互传递信息是人类最重要的基本功能之一。语言是人类特有的功能,它是创造和记载几千年人类文明史的根本手段,没有语言就没有今天的人类文明。语音是语言的声学表现,是相互传递信息的最重要的手段,是人类最重要、最有效、最常用和最方便的交换信息的形式。语音中除包含实际发音内容的语言信息外,还包括发音者是谁及喜怒哀乐等各种信息。在人类已构成的通信系统中,语音通信方式早已成为主要的信息传递途径之一,具有最方便和最快捷的特点。语言和语音也是人类进行思维的一种依托,它与人的智力活动密切相关,与文化和社会的进步紧密相连,具有最大的信息容量和最高的智力水平。语音信号处理是研究用数字信号处理技术对语音信号进行处理的一门学科,它是一门新兴的学科,同时又是综合性的多学科领域和涉及面很广的交叉学科。

  除了语音之外,图像是人类获取信息的另外一个重要来源,大约70%的信息是通过人眼获得的图像信息。图像信号是指将图像作为一种二维信号,采用数字信号处理的方法来对图像进行描述。今后为了表示方便,图像信号就称为图像。在近代科学研究、军事技术、工农业生产、气象、医学等领域中,人们越来越多地利用图像来认识和判断事物,解决实际问题。例如:人们利用人造卫星所拍摄的地面照片,来分析获取地球资源、全球气象和污染情况,利用“和平号”宇宙飞船所拍摄的月球表面照片,分析月球的形成。在医学上,通过CT断层扫描,医生可以观察和诊断人体内部是否有病变组织。在公安侦破中,采用指纹提取并处理进行破案。在军事上,目标的自动识别和自动跟踪都需要进行图像处理。

  图像信号的数字处理技术,按照人们通常的习惯,也称为数字图像处理技术,是指用计算机对图像进行处理。它建立在以计算机为中心的包括各种输入、输出及显示设备在内的数字图像处理系统上进行的。有时,结合数字语音处理系统,构成多媒体处理系统。

  设置本课程的目的要求

  使自学应考者能够掌握与人类密切相关的两种信息:语音信号和图象信号的基本概念和基本原理,能够应用数字信号处理的基本原理和方法对语音信号和图象信号进行各种处理,如:语音信号数字模型的建立,语音信号的分析、合成、识别、编码的基本原理的基本方法,数字图像信号的采集、表达、各种变换方法和图象信号的编码压缩等。同时能够对语音信号和图象信号处理的最新研究成果与发展趋势有所了解,以适应现代社会对信息处理越来越高的要求。

  Ⅱ、考试目标(考核知识点,考核要点)

  第一部分  语音信号处理

  第一章  绪论

  一、考核知识点

  (一)语音信号处理的基本概念

  (二)语音信号处理的发展概况

  二、考核要点

  (一)语音信号处理的基本概念

  1.识记:(1)语音信号对人类的重要性。通过语音传递信息是人类最重要的基本功能之一。语言是人类特有的功能,它是记载和创造几千年人类文明的基本手段,没有语言就没有今天的人类文明。(2)语音信号处理的应用领域。

  (二)语音信号处理的发展概况

  1.识记:(1)语音信号处理的发展历史。

  (2)语音编码、语音合成、语音识别的基本概论。语音编码技术是伴随着语音的数字化而产生的,目前主要应用在数字语音通信领域。语音合成的目的是使计算机能象人一样说话,而语音识别使能够听懂人说的话。

  第二章  语音信号处理的基本知识

  一、考核知识点

  (一)语音产生的过程

  (二)语音信号的特性

  (三)语音信号产生的数字模型

  (四)人耳的听觉特性

  二、考核要求

  (一)语音产生的过程

  1.识记:声音是一种波,能被人耳听到,振动频率为20-20000Hz之间。自然界中包含各种各样的声音,而语音是声音的一种,它是由人的发音器官发出的,具有一定语法和意义的声音。

  2.领会:(1)语音产生的过程与人类发声的基本原理。(2)清音、浊音、共振峰的基本概念。语音由声带震动或不经声带震动产生,其中由声带震动产生的音统称为浊音,而不由声带震动而产生的音统称为清音。声道是一个分布参数系统,它是一个谐振腔,有许多谐振频率,称为共振峰,它是声道的重要声学特征。

  (二)语音信号的特性

  1.识记:(1)语音的物理性质,包括音质、音调、响度、音长等特性。语音是人的发音器官发出的一种声波,具有声音的物理属性。基中音质是一种声音区别于其它声音的基本特征。音调就是声音的高低,取决于声波的频率:频率高则音调高,频率低则音调低。响度就是声音的强弱,又称音量。它是由声波振动幅度决定的。声音变的长短也称音长,它取决于发音持续时间的长短。

  (2)音素、音节、单词、句子的基本概念以及它们之间的关系。音素是语音的最小、最基本的组成单位,音素都有其独立的各不相同的发音方法和发音部位,它是使听者能区别一个单词和另一个单词的声音的基础。音节是最小的语言片段,一个音节由一个或几个音素组成。单词是由音节结合而成的更大单位,是有意义的语言的最小单位。句子是单词的进一步组合。

  (3)语音信号的统计特性。

  2.领会:语音的时间波形和频谱特性,特别是清音和浊音的频谱特性、共振峰特性,二者之间的区别。

  (三)语音信号间生的数字模型

  1.识记:(1)语音信号被看成是线性时不变系统(声道)在随机噪声或准调周期脉冲序列激励下的输出。在满足这样的假设条件下,产生了语音信号的基本数字模型,是语音处理技术的基础。

  (2)语音信号产生的数字模型的框图结构。

  2.领会:语音信号数字模型各部分的组成依据和数学描述,包括激励模型、声道模型(声管模型和共振峰模型)和辐射模型。

  (四)人耳的听觉特性

  1.识记:(1)声音的三要素:响度、音调和音色的基本概念。人的听觉系统具有复杂的特性,没有哪一种物理仪器具有人耳那样的特性。听觉机构不但是一个非常灵敏的声音接收器,还具有选择性,此外还有判别声音的强弱、音调和音色的本领。响度是人耳对声音的强弱程度的主管反映,响度取决于声音的幅度,主要是声压的函数,但和频率和波形也有关,人耳对3000~4000Hz的声音感觉最灵敏。音调也称音高,是一种主观心理量,是人耳对声音频率高低的感受。音色也叫音质,反映了声音属性。人根据音色在主观感觉上区别具有相同响度和音调的两个声音。

  (2)听觉“掩蔽效应”的基本概念与应用。

  第三章  语音信号的时域分析

  一、考核知识点

  (一)语音信号的数字化和预处理

  (二)短时能量分析

  (三)短时过零分析

  (四)短时相关分析

  二、考核要求

  (一)语音信号的数字化和预处理

  1.识记:(1)取样和量化的基本概念。为了将原始的模拟语音信号变成数字信号,必须经过取样和量化两个步骤,从而得到在时间和幅度上均为离散的数字语音信号。取样是将时间上连续的语音信号离散化为一个样本序列。根据取样定理,当取样频率大于信号的两倍带宽时,取样过程不会丢失信息,且从取样信号中可以精确地重构原始信号的波形。量化是指将取样后得到的样本序列的幅度再离散化,量化过程是将整个幅度值分割为有限个区间,将落入同一区间的样本赋予相同的幅度值。

  (2)抗混迭滤波器的作用。它是一个具有良好截止特性的模拟低通滤波器,主要是为了防止混迭失真和噪声干扰。

  (3)短时分析技术的基本概念。语音信号是一种随时间而变化的信号,可能是浊音激励也可能是清音激励,浊音的基音周期以及信号幅度等语音牧场生也都随时间变化,但这种变化是缓慢的,在一小段短时间内10~30ms,语音信号近似不变。于是,我们把变化的语音信号分成一些相继的短时间段来处理。而每一段时间段具有固定的特性,这种方法称为“短时”处理方法。

  2.领会:(1)取样率和量化字长的选取原则,理论依据。

  (二)短时能量分析

  1.识记:语音信号的能量分析是基于语音号能量随时间有相当大的变化,特别是清音段的能量一般比浊音段的小得多。能量分析包括能量和幅度两个方面。

  2.领会:(1)直角窗与海明窗的频率特性。海明窗的带宽大约是同等宽度矩形窗小得多,而且通带与阻带的起伏比较小。

  (2)窗口长度的选取原则。N选择太大,则短时能量En随时间变化就很小,不能充分反映语音信号的幅度变化;而N选择得小,即选择N等于或小于一个基音周期时,En将按照信号波形的细微变化而起伏不定,以致短时能量En不够匀化和平滑。因此,折衷考虑N的值,在通常情况下,当取样频率为10kHz,N=100~200被认为是合适的。

  (3)短时平均能量的主要用途。根据短时能量函数可以大致区分浊音和清音,在高信噪化情况下,利用短时能量函数En也可区分有声和无声。

  3.应用:(1)短时平均能量的计算方法。

  (2)利用短时能量来区分清/浊音。

  (三)短时过零分析

  1.识记:过零分析与平均过零率的基本概念。对于离散时间信号的相邻两个取样值具有不同符号时,便出现“过零”现象。单位时间过零的次数叫做“过零率”。对于窄带信号系统,过零率可以比较准确地反映该信号的频率。在宽带信号情况下,过零率只能粗略反映信号的频谱特性。

  2.领会:过零分析的用途。

  3.应用:(1)短时平均过零数的计算方法。

  (2)利用短时平均过零数来区分清/浊音。

  (四)短时相关分析

  1.识记:(1)短时自相关函数的物理意义,性质。对于浊音语音来说,短时自相关函数具有明显的峰值且呈周期分布,而对于清音来说,则没有很强的自相关周期峰,其性质类似于噪声。

  (2)短时平均幅度函数的作用。

  2.应用:(1)短时自相关函数的计算方法,实现框图。

  (2)修正的短时自相关函数的计算方法。

  (3)利用短时自相关函数区分清/浊音。

  (4)短时平均幅度差函数的计算方法。

  第四章  语音信号的短时傅里叶分析

  一、考核知识点

  (一)傅里叶分析在信号分析与处理中的地位与作用

  (二)短时傅里叶变换的定义与物理意义

  (三)短时傅里叶变换的取样率

  (四)语音信号的短时综合

  二、考核要点

  (一)傅里叶分析在信号分析与处理中的地位与作用

  1.识记:傅里叶分析的重要性,短时傅里叶分析的基本概念。在语音信号处理中,傅里叶表示在传统上,一直起主要作用。其原因一方面在于稳态语音的产生模型由线性系统组成,此系统被一随时间作周期变化或随机变化的源所激励,因而系统输出频谱具有非常明显的语言声学意义,可以获得某些重要的语音特征。同时,语音的感知过程与人类听觉系统具有频谱分析功能是紧密相关的。

  (二)短时傅里叶变换的定义与物理意义

  1.识记:(1)短时傅里叶分析的重要性。短时傅里叶分析是分析缓慢时变频谱的一种简便方法,是用稳态分析方法处理非稳态信号的一种方法,在语音处理中是一个非常重要的工具。

  (2)短时傅里叶变换的定义。

  2.领会:(1)标准傅里叶变换的解释。(2)窗口序列的特性,理论分析。(3)海明窗与直角窗对浊音语音的频谱分析对比。(4)短时傅里叶变换的滤波器的解释,滤波器框图的组成。

  (三)短时傅里叶变换的取样率

  1.识记:(1)时域取样率的基本概念。(2)频域取样率的基本概念。(3)总取样率的基本概念。

  2.领会:理解分析加窗与不加窗时总取样率的区别。

  (四)语音信号的短时综合

  1.领会:由复频域表达恢复复时域波形的几种方法,包括滤器组成求和法的基本原理与实现框图,数学证明,快速傅里叶变换求和法的基本原理,两者的关系。

  第五章  语音信号的同态滤波及倒谱分析

  一、考核知识点

  (一)卷积与解卷的基本概念

  (二)同态信号处理的基本原理

  (三)复倒谱和倒谱的基本概念

  (四)语音信号两个卷积分量复倒谱的性质

  (五)避免相位卷绕的几种算法

  二、考核要求

  (一)卷积与解卷积的基本概念

  1.识记:(1)根据语音信号的产生模型,可以将其用一个线性非时变系统的输出表示,即看作是声门激励信号和声道冲激响应的卷积。

  (2)为了分离加性组合信号,常采用线性滤波方法。而为了分离非加性信号(如乘积性或卷积性组合)信号,常采用同态滤波技术。

  (二)同态信号处理的基本原理

  1.识记:同态信号处理的基本概念与作用。同态信号处理的作用就是将非线性问题转化为线性问题来处理。根据实现原理分为乘积同态处理和卷积同态处理。

  2.领会:同态信号处理的基本实现方法,实现框图,数字证明。

  (三)复倒谱和倒谱

  1.识记:复倒谱与倒谱的基本概念,定义。

  (四)语音信号两个卷积分量复倒谱的性质

  1.识记:(1)一个周期冲激的有限长度序列,其复倒谱也是一个周期冲激序列,而且长度Np不变,只是序列变为无限长度序列。同时其振幅随着K值的增大南昌衰减。

  (2)声道冲激响应序列复倒谱的性质。

  2.领会:(1)声门激励的数学描述。

  (2)声道冲激响度序列的零标点模型描述,各个零标点结系统响应的影响。

  (五)避免相位卷绕的几种算法

  1.领会:(1)从傅里叶变换的角度说明相位卷绕产生的原因。

  (2)利用微分法消除相位卷绕的数学描述和实现框图。

  (3)利用最小相位法求信号复倒谱的原理实现。

  (4)利用递推法求信号复倒谱的基本方法及其局限性。

  第六章  语音信号的线性预测分析

  一、考核知识点

  (一)线性预测分析的基本概念

  (二)线性预测分析的基本原理

  (三)线性预测方程组的建立

  (四)利用自相关法求解线性预测方程组

  (五)利用协方差法求解线性预测方程组

  (六)利用格型法求解线性预测方程组

  (七)LPC谱估计和LPC复倒谱

  (八)线谱对分析原理与参数求解

  (九)极零模型

  二、考核要点

  (一)线性预测分析的基本概念

  1.识记:线性预测分析包含的基本概念是,一个语音的抽样能够用过去若干个语音抽样的线性组合来逼近。通过使实际语音抽样和线性预测抽样之间差值的平方和(在一个有限间隔上)达到最小值,即进行最小均方误差的逼近,能够决定唯一的一组预测系数。

  (二)线性预测分析的基本原理

  1.识记:采用全极点模型分析语音信号的理论依据。全极点模型最易于计算,对全极点模型作参数估计是对线性方程组的求解过程;有时无法知道输入序列;人的听觉对于那种只能用零点来表示的频谱陡峭谷点是迟钝的;如果不考虑鼻音和摩擦音,那么语音的声道传递函数就是一个全极点模型。

  2.领会:线性预测分析的物理意义与优越性。

  (三)线性预测方程组的建立

  1.识记:最小均方误差准则。

  2.领会:线性预测方程组的建立,根据线性预测器和最小均方误差准则则能够最终得到线性预测方程组,并进行简化。

  3.应用:线性预测方程组的数学推导。

  (四)利用自相关法求解线性预测方程组

  1.识记:自相关函数的定义,性质。

  2.领会:自相关法求解线性预测方程组的矩阵形式。

  3.应用:自相关法矩阵方程组的具体求解过程。

  (五)利用协方差法求解线性预测方程组

  1.识记:(1)协方差法与自相关法的不同之处在于这种方法无需对语音信号加窗,即不规定信号的长度范围,它可使信号的N个样点上误关最小,即把计算均方误差的间隔固定下来。

  (2)自相关与协方差法二者的优缺点比较2.领会:协方差法的线性预测方程组矩阵表示,图解表示。

  (六)利用格型法求解线性预测方程组

  1.识记:(1)格型法的基本原理。(2)格型法分析滤波器结构。(3)格型滤波器的优点。

  2.领会:(1)格型法求解的基本方法,包括正向格型法、反向格型法、几何平均格型法、伯格法、协方差格型法。

  (七)LPC谱估计和LPC复倒谱

  1.识记:(1)线性预测分析的阶数p的选取原则,首先要保证有足够的极点来模拟声道响应的谐振结构,但p值达到12~14后,若进一步增加则误差改善很小。

  (2)在线性预测分析中,分析帧长度N同样重要,N尽可能小有好处,在LPC线性方程组求解中,计算量都与N成正比。但谱估计的精度随着N的增加而提高。通常取N为2~3个基音周期长度。

  (3)复倒谱的计算方法,复倒谱分析的优点。

  (八)线谱对分析原理与参数求解

  1.识记:(1)线谱对分析的优点。

  (2)线谱对分析的基本原理(3)线谱对参数求解的基本方法。

  (九)极零模型

  1.识记:将极零模型转变为全极点模型的基本方法。

  第七章  语音信号的矢量量化

  一、考核知识点

  (一)矢量量化概述

  (二)矢量量化的基本原理

  (三)失真测度

  (四)最佳矢量量化器和码本的设计

  二、考核要求

  (一)矢量量化概述

  1.识记:(1)矢量量化的理论依据与优越性。根据仙农信息论可以得出,矢量理化总是优于标题量化,且矢量维数越大性能越优越。因为矢量量化有效利用了矢量中各分量间的各种相互关联的性质。采用矢量理化技术对信号波形数据进行压缩,可以获得非常高的压缩比。

  (2)矢量量化的基本概念。矢量量化是将若干个取样信号分成一组,即构成一个乔量,然后对此矢量一次进行量化,即作为一个整体进行量化。

  (二)矢量量化的基本原理

  1.识记:(1)矢量量化的过程。将语音信号波形的K个样点的每帧,或有K个参数的每一帧参数,构成K维空间中的一个矢量,然后对这个矢量进行量化。

  (2)矢量量化的实现原理框图。

  (三)失真测度

  1.识记:(1)失真测度必须具备的几个特性。必须在主观评价上有意义;必须是易于处理的;平均失真存在且可计算;易于硬件实现。

  (2)欧式距离—均方误差的基本概念。

  (四)最佳矢量量化器和码本的设计

  1.识记:(1)矢量量化器最佳设计的两个条件。最佳划分和最佳码书。

  (2)初始码书的生成方法。随机选取法、分裂法和乘积码书法

  第九章  语音检测分析

  一、考核知识点

  (一)基音检测

  (二)共振峰估值

  二、考核要点

  (一)基音检测

  1.识记:(1)基音检测的重要性与难点。基音的提取和估计是语音信号处理中十分重要的一个问题,准确地检测语音信号的基音周期对于高质量的语音分析与合成、语音压缩编码、语音识别和说话人确认等具有重要意义。在低速率语音编码中,准确的基音检测是非常关键的,它直接影响到整个系统的性能。

  (2)基音检测的三种方法:波形估计法、相关处理法和变换法。

  (3)并行处理法的基本原理与实现框图。

  2.领会:(1)中心削波法的基本原是与实现图。

  (2)利用倒谱法提取基音的基本原理与实现方法。

  (3)利用简化逆滤波器法进行基音检测的基本原理与实现方法。

  (二)共振峰估值

  1.识记:(1)共振峰估计中存在的问题。

  (2)带通滤波器组法提取共振峰特性的基本原理。

  第十章  语音编码(一)——波形编码

  一、考核知识点

  (一)语音编码的目的与应用前景

  (二)语音信号的压缩编码原理

  (三)脉冲编码的调制(PCM)及其自适应

  (四)预测编码及自适应预测编码原理

  (五)自适应差分脉冲编码调制及自适应增量调制

  (六)子带编码

  (七)自适应变换编码

  二、考核要求

  (一)语音编码的目的与应用前景

  1.识记:(1)话音编码的目的是在保持可以接受的失真的情况下采用尽可能少的比特数表示语音。

  2.语音信号数字传输的应用前景。

  (二)语音信号的压缩编码原理

  1.识记:(1)语音压缩的必要性。语音编码的目的是在保持可以接受的失真情况下,采用尽可能少的比特数表示语音。如果对语音直接数字化,则传输或存储语音的数据量太大。为了降低传输或存储的费用,必须对其压缩。

  (2)语音压缩的基本依据及理论分析。

  (3)语音通信质量的分类。

  (4)波形编码与声码器的性能比较。

  (三)脉冲编码调制及其自适应

  1.识记:(1)PCM的基本原理。(2)均匀PCM中,信噪比与量化比特数的关系。(3)非均匀PCM的基本思想。(4)U律与A律的压扩特性。

  2.领会:自适应PCM的基本原理与实现框图。

  (四)预测编码及其自适应APC

  1.识记:(1)预测编码的基本概念。(2)短时预测与长时预测的基本概念。

  (五)自适应差分脉冲编码调制(ADPCM)及自适应增量调制(ADM)

  1.识记:(1)DPCM的基本原理与实现框图。

  (2)ADPCM的实现原理。

  (3)增量调制的基本概念与实现框图。

  (4)自适应增量调制的基本概念。

  2.领会:(1)掌握DM编码中斜率过载和颗粒噪声产生的原因及克服的办法。

  (2)连续可变斜率增量调制的实现原理。

  (六)子带编码

  1.识记:(1)人耳的听觉与信号频率的关系。

  (2)子带编码的基本实现方法。

  (3)正交镜像滤波器(QMF)的基本概念。

  2.领会:(1)子带编码中,子带的分割与重建语音质量的关系。

  (2)正交镜象滤波器的幅频特性。

  3.应用:通过正交镜像滤波器恢复原始信号的原理与方法。

  (七)自适应变换编码

  1.识记:(1)自适应变换编码的基本概念。变换编码是一种优秀的高质量的语音压缩编码方法,它将时域的语音信号变换到频域,变换后的数值表示信号中不同频率分量的强度,然后将这些变换系数按照比特分配的结果进行理化编码。

  (2)DCT正交变换的优点2.领会:自适应变换编码的基本原理与实现框图。

  第十一章  语音编码(二)—声码器技术及混合编码

  一、考核知识点

  (一)语音参数编码的基本概念

  (二)声码器的基本结构

  (三)相位声码器和通道码器

  (四)同态声码器

  (五)线性预测声码器

  (六)混合编码

  (七)各种语音编码方法的比较

  (八)语音编码的性能指标和质量评价

  二、考核要求

  (一)语音参数编码的基本概念

  1.识记:(1)语音参数编码通过对语音信号的参数进行提取及编码,力图使重建语音信号具有尽可能高的可懂度,即保持原语音的语意。这类编码的优点是编码率低,可低至2.4kbit/s以下。

  (2)参数编码的基础是语音间生的数学模型。实现参数编码的器件称为声码器,主要用于窄带信道的语音通信。

  (二)声码器的基本结构

  1.识记:(1)声码器的基本结构及实现过程。

  (2)声码器的局限性。

  (三)相位声码器和通道声码器

  1.识记:(1)相位声码器的基本工作原理。

  (2)通道声码器的基本工作原理。

  (四)同态声码器

  1.识记:(1)基于倒谱的分析与合成的基本原理。

  (2)同态声码器的基本实现框图。

  (五)线性预测声码器

  1.识记:(1)线性预测声码器的基本实现框图。

  (2)线性预测编码参数的变换和量化,包括反射系数,对数面积比和预测多项式的根。

  (3)变帧率LPC声码器的基本概念。

  (六)混合编码

  1.识记:(1)混合编码是波形编码和声码器两种优点的结合:既利用了语音生成模型,通过对模型中的参数进行编码,减少了波形编码中被编码对象的动态范围或数目;又使编码的过程产生接近原始语音波形的合成语音,以保留说话人的各种自然特征,提高了合成语音质量。

  (2)多脉冲线性预测声码器的基本概念。

  (3)CELP的基本概念。

  (七)各种语音编码方法的比较

  1.识记:波形编码和声码器的优缺点比较。

  (八)语音编码的性能指标和质量评价

  1.识记:(1)语音编码的基本性能指标,包括编码速率和顽健性。

  (2)编码器的质量评价方法,包括全观评价法和客观评价法。

  (3)常用的几种语音评价标准。

  第十二章  语音合成

  一、考核知识点

  (一)语音合成概述

  (二)语音合成原理

  (三)共振峰合成

  (四)线性预测合成

  二、考核要求

  (一)语音合成概述

  1.识记:(1)语音合成技术的两个关键性能:一是正确,一是自然。

  (2)语音合成的发展现状。

  (二)语音合成原理

  1.识记:(1)语音合成的三种基本方法:波形合成法、参数合成法和规则合成法的基本概念。

  (2)语音合成系统的特性,包括合成单元、合成参数与合成音质的基本概念。

  (三)共振峰合成

  1.识记:共振峰合成的基本原理

  (四)线性预测合成

  1.识记:(1)线性预测分析合成系统的基本原理。

  (2)直接递归型合成滤波器和格型合成滤波器二者性能对比。

  第二部分  数字图象处理

  第一章  绪论

  一、考核知识点

  (一)从图象到图象工程

  (二)图象处理和分析

  二、考核要求

  (一)从图象到图象工程

  1.识记:(1)图象与数字图象的基本概念,连续图象与数字图象的数学描述。

  (2)图象技术的基本概念。

  (3)图象工程与相关学科和领域的联系与区别。

  (二)图象处理与分析

  1.识记:(1)图象处理和分析系统的基本组成。

  (2)图象采集模块的基本作用。

  (3)图象显示模块的基本作用。

  (4)图象存储模块的基本作用。

  (5)图象通信模块的基本作用。

  (6)图象处理与分析模块的基本作用。

  第二章  图象和视觉基础

  一、考核知识点

  (一)概述和分类

  (二)人眼与亮度视觉

  (三)颜色视觉

  (四)光度学和成象模型

  (五)成象变换

  (六)采样和量化

  (七)象素间联系

  (八)算术和逻辑运算

  (九)坐标变换

  二、考核要求

  (一)概述和分类

  1.识记:图象和视觉基础的分类。

  (二)人眼与亮度视觉

  1.识记:(1)人眼的基本组成结构与人眼成象的基本原理(2)人眼的亮度适应性和亮度分辨能力。

  (3)马赫带效应与同时对比度的基本概念。

  (三)颜色视觉

  1.识记:(1)三基色的基本概念。颜色的三种基本特性量:辉度、色调和饱和度的基本概念。

  (2)颜色的两种模型表示:RGB模型和HIS模型的基本原理。

  (3)RGB模型和HIS模型之间的相互转换。

  (四)光度学和成象模型

  1.识记:(1)光通量,发光强度和照度的基本概念。

  (2)图象成象模型的数学描述。

  2.领会:光通量,发光强度和照度之间的相互关系,计算方法。

  (五)成象变换

  1.识记:将3-D客观场景投影到2-D图象平面的成象过程。

  (六)采样和量化

  1.识记:(1)均匀采样的基本概念,采样后图象的矩阵表示。

  (2)均匀量化的基本概念(3)非均匀采样和量化的优缺点。

  2.领会:(1)采样点的选取与图象空间分辨率的关系:一幅图象的采样点数越多,则空间分辨率越高。

  (2)量化阶数的选取与图象幅度分辨率的关系,量化阶数越多,则幅度分辨率越高。

  (七)象素间联系

  1.识记:(1)象素领域的基本概念。(2)象素间的连通性的概念及判断方法。(3)集合的等价关系和传递闭包的基本概念。(4)象素的距离量度的数学描述。

  2.领会:m-连通时象素间距离测量的基本方法。

  (八)算术和逻辑运算

  1.识记:(1)象素间的各种算术和逻辑运算关系。

  (2)模板运算的基本概念与用法。

  2.领会:二值图象的逻辑运算关系。

  (九)坐标变换

  1.识记:(1)图象的平移变换的基本方法。

  (2)图象的尺度变换的基本方法。

  (3)图象的旋转变换的基本方法。

  (4)反变换的基本概念(5)各种变换的级连的实现方法。

  2.应用:给定不同的变换矩阵,对空间点进行各种变换。

  第三章  图象变换

  一、考核知识点

  (一)图象变换的概述和分类

  (二)傅里叶变换和性质

  (三)快速傅里叶变换

  (四)其它可分离图象变换

  (五)霍特林变换

  二、考核要求

  (一)图象变换的概述和分类

  1.识记:图象变换的分类关系。

  (二)傅里叶变换和性质

  1.识记:(1)1-D傅里叶变换的基本概念。

  (2)2-D傅里叶变换的基本概念。

  (3)2-D傅里叶变换的性质,包括分离性、平等性、周期性和共扼对称性、旋转特性、分配律、尺度变换特性、平均值、卷积和相关特性。

  (4)采样宣的基本概念(5)2-D图象采样时的空域和频域的关系。

  2.领会:(1)2-D傅里叶变换的各种性质的数学描述。

  (2)连续信号的频谱与连续信号采样后的频谱关系,连续信号在时域采样反映在频谱上,就是频谱周期性地重复。只有满足采样定理时,采样后的频谱才不会发生混迭。

  (3)当采样在有限区间进行时,对信号频谱产生的影响。

  3.应用:2-D信号卷积和相关的求解方法。

  (三)快速傅里叶变换

  1.识记:(1)2-D快速傅里叶变换的算法原理。

  (2)采用快速傅里叶变换和一般傅里叶变换运算次数的对比。

  2.领会:2-D快速傅里叶变换的实现方法。

  (四)其它可分离图象变换

  1.识记:(1)可分离变换的特点,正变换核与反变换的表示方法,变换的矩阵表示方法。

  (2)沃尔什变换的表示方法与特点,N=4时沃尔什变换基本函数的图形表示。

  (3)哈达玛变换的表示方法与特点(4)离散余弦变换的特点

  2.领会:(1)利用矩阵运算的方法求解2-D傅里叶变换的方法。

  (2)沃尔什变换的求解方法。

  (3)哈达玛变换核的递推关系,哈达玛变换的求解方法。

  (4)2-D离散余弦变换的求解方法。

  3.应用:能够利用迭代关系求出哈达玛变换的H2N矩阵,并利用矩阵求解2-D哈达玛变换。

  (五)霍特林变换

  1.识记:(1)霍特林变换也常称为特征值变换,主分量变换或离散KL变换,它的变换核矩与图象的统计特性有关,是一种最佳变换,常用于衡量其它变换的性能。

  2.领会:(1)霍特林变换核矩阵的表示方法。

  (2)证明霍特林变换是最优的变换。

  3.应用:协方差矩的计算方法,给定图象矩阵,能够求解协方差矩阵。

  第四章  图象增强

  一、考核知识点

  (一)概述和分类

  (二)空域变换增强

  (三)空域滤波增强

  (四)频域增强

  (五)局部增强

  (六)彩色增强

  二、考核要求

  (一)概述和分类

  1.识记:图象增强技术作为一大类基本的图象处理技术,其目的是对图象进行加工,以得到对具体应有徕说视觉效果更“好”,更“有用”的图象。由于具体应用的目的和要求不同,因而所需的具体增强技术也不相同。从根本上说,并没有图象增强的通用标准,观察者是某种增强技术优劣的最终判断者。

  (二)空域变换增强

  1.识记:(1)直接灰度变换的几种方法,包括图象求反、增强对比度、动态范围压缩、灰度切分等基本概念。图象求反是将原图灰度值翻转,而对比度增强是增强原图象的各部分的反差。动态范围压缩与增强对比度正好相反,而灰度切分与增强对比度相仿,是要将某个灰度值范围变得比较突出。

  (2)直方图的基本概念。直方图以图形方式直观地反映了图象各个灰度值的分布概率。

  (3)直方图均衡化的概念,通过将原始图的直方图变换为均匀分布的形式,增加灰度值的动态范围,从而达到增强图象整体对比度的效果。

  (4)直方图规定化用于将直方图变换为指定的形状。

  (5)通过对多幅图象进行图象间的运算,从而实现图象增强的基本方法。

  2.领会:(1)用直接灰度变换法增强图象的基本方法。

  (2)直方图规定化的基本方法。

  3.应用:直方图均衡化的具体实现方法,详细的计算过程。

  (三)空域滤波增强

  1.识记:(1)空域滤波是在图象空间借助模板进行领域操作完成的,根据其实现原理和达到的效果共分为四类,即线性平滑、锐化和非线性平滑、锐化。平滑能够减弱或消除傅里叶空间的高频分量,但不影响低频分量;而锐化能减弱或消除傅里叶空间的低频分量,得不影响高频分量,根据需要而选用。

  (2)线性平滑滤波器和非线性平滑滤波器的基本实现方法。

  (3)两种锐化滤波器的基本实现方法。

  2.领会:平滑的作用与实现步骤,中值滤波器的特点与实现步骤。

  (四)频域增强

  1.识记:(1)卷积的概念与频域增强的实现步骤。

  (2)理想低通滤波器的特点,转移函数的数学描述。

  (3)物理上可实现的巴特沃斯低通滤波器的转移函数特点。

  (4)理想高通滤波器的转移函数特点与数学描述。

  (5)巴特沃斯高通滤波器的转移函数特点。

  (6)带通和带阻滤波器的滤波特性描述。带通滤波器允许一定频率范围内的信号通过而阻止其它频率范围内的信号通过,而带阻与之相反。

  (7)同态滤波的基本实现方法与特点,同态滤波是一种在频域中同时图象亮度范围进行压缩和将图象对比度进行增强方法。

  2.领会:(1)高通与低通滤波效果的对比。

  (2)同态滤波的流程图实现。

  (五)局部增强

  1.识记:(1)在实际应用中常常需要对图象某些局部区域的细节进行增强。解决办法就是根据所关心的局部区域的特性来计算变换或转移函数,并将这些函数用于所关心的局部区域,以得到所需要的增强效果。在具体操作时,比全局增强法多了一个选择确定局部区域的步骤,而对每个局部区域仍可采用常规的图象增强法。

  (2)局部增强的具体实现方法。

  (六)彩色增强

  1.识记:(1)伪彩色是对原来灰度图象中不同灰度值的区域赋予不同的颜色以更明显地区分它们。实际上是一个人为着色的过程,具体实现方法有亮度切割法,从灰度到彩色的变换法和频域滤波法。

  (2)三种变换方法的特点与具体实现方法。其中频域滤波法实现最为复杂,但其合成的颜色反映了不同的频率分量,前两种方法是反映不同的灰度值。

  (3)真彩色图象增强的基本实现步骤。

  第五章  图象恢复和重建

  一、考核知识点

  (一)概述和分类

  (二)退化模型和对角化

  (三)无约束恢复

  (四)有约束恢复

  (五)交互式恢复

  (六)几何失真校正

  (七)投影重建

  二、考核要求

  (一)概述和分类

  1.识记:(1)图象恢复也称图象复原,是图象处理中的一大类技术。与图象增强的相同之处是都要得到在某种意义上改进的图象,即改进视觉质量。不同之处是,图象增强技术一般要借助于人的视觉系统的特性以取得看起来较好的视觉结果,而图象恢复则认为图象是在某种情况下退化或恶化了,现在需要根据相应的退化模型和知识重建或恢复原始的图象。

  (2)在给定模型下,图象恢复技术可分为无约束和有约束两大类。根据是否需要外来干预,图象恢复技术又可分为自动和交互两大类。根据处理所在域,又可分为频域和空域两大类。

  (二)退化模型和对角化

  1.识记:(1)图象退化模型的描述,线性系统的几个性质。

  2.领会:(1)退化模型H矩阵的特点,根据退化模型和退化后的图象恢复原始图象的矩阵计算方法。

  (2)循环矩阵对角化的表示方法。

  (3)退化模型对角化的表示方法。

  (4)无约束和有约束恢复的向量表示法。

  3.应用:(1)利用退化模型恢复原始图象的具体矩阵表示。

  (三)无约束恢复

  1.识记:(1)逆滤波的物理意义与数学描述。

  2.领会:(1)根据已知条件消除匀速直线运动造成的模糊的具体计算过程。

  (四)有约束恢复

  1.识记:(1)维纳滤波的基本概念,它是一种最小均方误差滤波器。

  (2)相关矩阵的特点,计算方法对于大多数图象来说象素面间的相关不超过20-30象素,所以典型的相关矩阵只在主对解线方向有一个条带不为零,而右上角和左下角均为零。

  (3)逆滤滤恢复和维纳滤波恢复结果的对比。

  (4)维纳滤波与有约束最小平方滤波结果的对比。

  2.领会:(1)满足给定约束条件时最优解的向量表示。

  (2)有约束最小平方恢复过程的具体运用。

  (五)交互式恢复

  1.识记:(1)消除图象中正弦干扰的基本方法。

  (2)对于有多个正弦干扰存在的条件下,首先要提取干扰模式的主要频率,然后通过设置相应原带通滤波器来滤除干扰,再通过恢复图象的频谱来调整滤波器的中心频率,最终滤除噪声。

  2.领会:正交式恢复消除正弦干扰的数学描述。

  (六)几何失真校正

  1.识记:(1)在许多实际的图象采集过程中,图象中象素之间的空间关系会发生变化,这时可以说图象产生了几何失真或几何畸变,此时需要通过几何变换来校正失真图象中的各象素位置以重新得到象素间原来的空间关系。

  (2)对图象的几何失真的校正主要包括两个步骤:空间变换和灰义插值。

  (3)空间变换是对图象平面上的象素进行重新排列以恢复原空间关系。

  (4)灰度插值是对空间变换后的象素赋予相应的灰度值以恢复位置的灰度值。

  (七)投影重建

  1.识记:(1)投影重建一般指从一个物体的多个(轴向)投影图重建目标图象的过程。在投影时丢失了沿射线方向的分辨能力,只剩下一维信息。而重建则利用多个投影恢复了二维的分辨力。

  (2)利用投影重建的原理和方法工作的系统有许多类,如透射断层成象、发射断层成象、反射断层成象、磁共振成象等。总得来说,如果测量到的数据具有物体某种感兴趣的物理特性在空间分布的积分的形式,那么就需要用投影重建的方法来获得物体内部的图象。

  (3)傅里叶反变换重建功立业的基本步骤和定义。

  (4)傅里叶变换投影定理的数学描述(5)傅里叶反变换重建的三个主要步骤(6)卷积逆投影重建的主要方法,包括连续公式推导、离散计算和扇束投影重建。

  (7)傅里叶反变换重建法和卷积逆投影法的比较。

  (8)级数展开建法的基本实现方法和特点。

  (9)综合重建法的具体应用,如迭代变换法、迭代重建投影、角谐函数法和正弦多项式展开等。

  2.领会:(1)从投影重建图象的基本实现方法。

  (2)迭代变换法的基本实现方法。

  3.应用:(1)卷积逆投影重建法的具体应用。

  第六章  图象编码

  一、考核知识点

  (一)图象编码概述和分类

  (二)基本概念和理论

  (三)简单编码方法

  (四)预测编码

  (五)变换编码

  (六)国际标准简介

  二、考核要求

  (一)图象编码概述和分类

  1.识记:(1)一幅2-D数字图象可表示为将一个2-D亮度函数通过采样和量化而得到一个2-D数组。由于数据量很大,从而对存储、处理和传输都带来许多问题。为了减少数据量,于是提出了图象编码的问题。

  (2)数据是信息的载体,对给定量的信息可用不同的数据量来表示。对于给定的信息,设法减少表达这些信息的数据量称为数据压缩。

  (3)压缩数据量的重要方法是消除冗余数据,从数学角度来说就是要将原始图象转化为从统计角度看尽可能不相关的数据集。

  (4)信息保存型图象压缩常用于图象存档,在压缩和解压缩过程中没有信息损失。信息损失型常能取得较高的压缩率,但图象经压缩后,不能通过压缩恢复原状。

  (二)基本概念和理论

  1.识记:(1)数据是用来表示信息的。如果不同的方法为表示给定的信息使用了不同的数据量,那么使用较多数据量的方法中,有些数据必然代表了无用的信息,这就是数据冗余的概念。它是数字图象压缩中的关键概念。

  (2)数据冗余的公式描述(3)码本是指用来表达一定量的信息或一组事件所需的一系列符号。对每个信息或事件所赋的码符号序列称为码字,每个码字里的符号个数称为码字的长度。

  (4)由于象素间的相关性而带来的数据冗余称为象素间冗余。由于相邻图象帧而带来的数据冗余称为帧冗余。

  (5)由于眼睛对不同的视觉信息具有不同的敏感度而带来的数据冗余称为心理视觉冗余。因为去除心理视觉冗余数据能导致定量信息的损失,这一过程也称为量化。

  (6)用于描述解码图象相对原始图象的偏离程度的一种信息损失测度称为保真度,常用的准则有主观和客观两种,客观保真度便于计算,主观保真度更符合人眼的视觉习惯。

  (7)信源编码器的作用是减少或消除输入图象中的编码冗余,象素间的冗余以及心理视觉冗余,包括映射器、量化器和符号编码器三个独立的操作,而对应的信源解码器包括符号解码器和反映射器两个独立操作。

  (8)信道编码器通过把可控制的冗余加入信源编码后的码字以减少信道噪声的影响。

  2.领会:(1)数据冗余的计算方法,自然码和变长码编码效果比较。

  (2)图象编码系统的基本模型框图(3)信源编码器和信源解码器的工作过程(4)信道编码器和信道解码器的工作过程(5)熵的基本概论,计算方法。自信息量和互信息量的计算方法。

  (6)无失真编码定理的描述,信道编码定理和信源编码定理的描述。

  3.应用:(1)二元信源和二元对称信源有关问题的求解。

  (2)图象信息内容的估计。

  (三)简单编码方法

  1.识记:(1)变长编码就是用较少的比特数表示出现概率较大的灰度级,而用较多的比特数表示出现概率较小的灰度级。

  (2)位平面编码是一种基于将多灰度图象分解成一系列的二值图,然后对每一幅二值图再用二元压缩方法进行压缩的技术。这种技术除了能消除或减少编码冗余外,也能消除或减少图象中的象素间冗余。

  2.领会:(1)哈夫曼编码的基本原理,算术编码的基本原理。

  (2)位平面分解的基本过程,常数块编码的基本方法。

  (3)1-D游程编码和2-D游程编码的基本方法。

  (4)几种编码方法的比较。

  3.应用:(1)哈夫曼编码一详细编码过程及平均码长、熵、冗余度的计算。

  (2)算术编码的详细编码过程。

  (3)RAC编码方法的实现。

  (四)预测编码

  1.识记:(1)预测编码的基本思想是通过仅提取每个象素中的新信息并对它们编码来消除象素间的冗余。

  (2)无损预测编码的系统的组成,有损预测编码系统的组成。

  2.领会:(1)无损预测编码和有损预测编码的基本工作原理。

  (2)DPCM编码的基本原理与实现方法。

  (3)最优量化的基本原理,与概率密度函数的关系。

  3.应用:(1)DM编码的编码方法,粒状噪声与斜率过载的产生原因分析。

  (2)最优预测器的基本求解过程。

  (五)变换编码

  1.识记:(1)变换编码的基本实现原(2)对于一个给定的编码应用,如何选择变换取决于可容许的重建误差和计算要求。变换具有将图象能量或信息集中于某些系数的能力,均方重建误差与所用变换的该性质直接相关。

  2.领会:(1)变换编码的矩阵描述和均方误差的向量表示。

  (2)各种变换编码方法优缺点的对比及常用的变换编码方法实现。

  (3)了图象的选择标准以及子图象大小对编码效果的影响。

  (4)比特分配的基本原则与方法,包括分区编码和阈值编码。

  (5)分区编码的基础是信息论中的不确定性原理。根据这个原理,具有最大方差的变换系数带有最多的图象信息,应当保留在编码过程中。

  (六)国际标准简介

  1.识记:(1)图象压缩编码技术的基本分类。

  (2)二值图象压缩的常用标准介绍,包括G3和G4还有JBIG.(3)静止图象压缩标准介绍,包括JPEG和JPEG2000.(4)序列图象压缩标准介绍,包括H.261,MPEG系列等。

  2.领会:(1)JPEG基本系统的组成与编码器的实现原理。

  (2)H.261基本实现原理。

  (3)MPEG系列的发展与应用场合的变化。

  Ⅲ、有关说明和实施要求

  为了使本大纲的规定在个人自学、社会助学和考试命题中得到贯彻和落实,兹对有关问题说明如下。并进而提出实施要求。

  一、关于考核目标的说明

  为使考核内容具体化和考试要求标准化,本大纲在列出考试内容的基础,对各章规定了考核目标,使自学应考者能够进一步明确考试内空和要求,更有目的地系统学习教材,使社会助学者更全面地有针对性地分层次进行辅导,使考试命题能够更加明确命题范围,更准确地安排试题的知识能力层次的难易度。

  本大纲在考核目标中,按照识记、领会、应用三个层次规定其应达到的能力层次要求。三个能力层次是递进等级关系,各能力层次的含义是:

  识记:能知道有关的名词、概念、知识的意义,并能正确认知和表述。

  领会:在识记的基础上,能全面地把握基本概念,基本规范,基本方法,能掌握有关概念、规范、方法和区别与联系,并内化成自己实际工作的能力。

  应用:在识记和领会的基础上,能对问题进行正确的阐述和分析计算,能运用所学知识处理和解决实际问题。

  二、自学教材

  《语音信号处理》(修订版),胡航编著,哈尔滨工业大学出版社,2002年出版。

  《图象工程上册-图象处理和分析》,章毓晋编著,清华大学出版社,1999年出版。

  三、自学方法指导

  1.在全面系统学习的基础上掌握基本概念、基本知识,基本方法和技巧。本课程内容涉及语音信号处理和数字图象处理两大部分的各个方面。知识、范围比较广泛,自学者应首先全面系统地学习各章,深刻领会语音和图象信号处理的一般理论。其次,应当识记语音和图象信号处理的基本概念、基本知识、具体问题的基本分析方法和技巧,同时注意各部分内容之间的联系。然后,在全面系统的基础上掌握重点,有目的地深入学习重点章节,但切忌在没有了解全貌的情况下孤立地去抓重点,押题目。

  2.要把学习语音和图象信号处理的基本理论和分析具体问题结合起来自学,自学应考者应该懂得,语音和图象信号处理这门课程是一门理论性与实践性都很强的课程,在学习中切忌死记硬背,而应当把课程内容与具体问题联系起来,力求能够运用所学基本理论知识进行语音和图象信号的实际分析与处理,以增强感性认识,更深刻地领会教材内容,将知识内化为自身的素质和能力,以提高自己分析解决语音和图象方面问题的能力。

  四、对社会助学的要求

  1.社会助学者应根据本大纲规定的考试内容和考核目标,认真钻研指定教材,明确本课程与其他课程不同的特点和学习要求,对自学应考者进行切实有效的辅导,引导他们防止自学中的各种偏向,把握社会助学的正确方向。

  2.要正确处理基本知识的应用能力的关系,努力引导自学应考者将识记、领会同应用联系起来,把基本知识转化为实际工作能力,在辅导的基础上,着重培养和提高自学应考都的素质和思想水平。

  3.要正确处理重点和一般的关系。课程内容有重点与一般之分,但考试内容是全面的,而且重点与一般是相互影响的,不是截然分开的,社会助学者应指导自学应考者全面系统地学习教材,掌握全部考试内容和考试知识点,在此基础上再突出重点。总之,要把重点学习同兼顾一般结合起来,切勿孤立地抓重点,把自学应考者引向猜题押题。

  五、关于命题考试的若干要求

  1.本课程的命题考试,应根据本大纲所规定的考试内容和考试目标来确定范围和考核要求,考试命题覆盖到各章,并适当突出重点章节,体现本课程的重点内容。

  2.试题要合理安排难度结构,难易可分为易,较易,较难、难四个等级,每份试卷中,不同难易试题的分数比例一般为,易占20%,较易占30%,较难占30%,难占20%.必须注意,试题的难易程度与能力层次不是一个概念,在各能力层次中都会存在不同难度的问题,切勿混淆。

  3.本课程考试试卷可能采用的题型有:单项选择题、名词解释、简要分析题和计算题。各种题型的具体样式参见本本纲附录。

江苏省教育考试院

本文转载链接:江苏自学考试语音与图象信号处理教材大纲

分享到:
  • 站内搜索
  • 课程搜索
  • 试题搜索

热门搜索:教材 报名 查分 免考 考试计划