欢迎来到在线AI转换官网

商品订单:
20220413010000863561761978207919
支付金额:¥10,905.00
支付方式:
请打开手机微信,扫一扫完成支付

使用教程

语音处理基础知识

  前置知识


  激励:信号处理中的输入


  谐振:等同于共振,不同领域的不同称谓。当电路中激励的频率等于电路的固有频率时,电路的电磁振荡的振幅也将达到峰值,这就称作谐振。


  白噪声:指功率谱密度在整个频域内均匀分布的噪声。


  音素:phoneme,语音中最小的基本单位。音素是人类能区分一个单词和另一个单词的基础。音素构成音节,音节又构成不同的词和短语。音素可分为元音和辅音


  元音:又称母音,是音素的一种。元音是在发音过程中由气流通过口腔不受阻碍的发出的音。不同的元音是由口腔不同的形状造成的。元音和共振峰关系密切


  辅音:又称子音。辅音是气流在口腔或咽头受到阻碍而形成的音。


  清音:发清音时声带不振动,因此清音没有周期性。清音由空气摩擦产生,在分析研究时等效为噪声。


  浊音:发声时声带振动的产生音称为浊音。辅音有清有浊,而大多数语言中元音均为浊音,浊音具有周期性


  发清音时声带完全舒展,发浊音时声带紧绷在气流作用下作周期性运动


  预加重是一种在发送端对输入信号高频分量进行补偿的信号处理方式。


  短时加窗处理:音频信号是动态变化的,为了能传统的方法对音频信号进行分析,假设音频信号在几十毫秒的短时间内是平稳的。为了得到短时的音频信号,要对音频信号进行加窗操作。窗函数平滑的在音频信号上滑动,将音频信号分成帧。分帧可以连续,也可以采用交叠分段的方法,交叠部分称为帧移,一般为窗长的一半。窗函数可以采用汉明窗、汉宁窗等。在时域上处理时,分帧之后处理手段的名称一般都在处理手段前加“短时”修饰。