首页>技术中心>技术资讯>随机共振在强噪声环境中语音增强应用

随机共振在强噪声环境中语音增强应用

发布时间：2017-11-22

1引言

语音增强的主要目标就是从含噪语音中提取尽可能纯净的原始语音,去除语音通信过程中引入的噪声以及通信设备内部的电噪声以及其他讲话者的干扰,从而改善语音质量,提高语音可懂度。

目前常用的语音增强算法有基于时域的卡尔曼滤波法、梳状滤波器法[1]等,有基于频域的频谱相减法[2],维纳滤波法[3]等,它们是通过对噪声特征进行分析,针对噪声特征进行最大化的消除,将噪声作为信号有害的干扰源,然而随着噪声信号不断增强,尤其在强噪声环境中,传统的语音增强变得及其困难。

Benzi等在1981年提出随机共振[4],用以解释古气象学中冰川期与暖气候期周期性交替出现的现象。随机共振研究方向是非线性随机问题,它可以通过调节噪声强度使噪声中的语音弱信号产生共振得到增强,改变了传统上去除噪声从而增强语音信号的理念,目前广泛的应用于弱故障、弱缺陷或其它弱特征信号的检测和估计中[5] [6]。

当语音信号含有噪声干扰时,可以利用随机共振原理进行分析语音信号,进行语音增强的研究。本文基于多阈值非周期随机共振原理,提出一种通过自适应调节,添加最佳噪声的方法,使语音信号在阈值最优随机共振,从而到达含噪语音信号增强。

2非周期随机共振

随机共振的研究一般限于弱信号(阈下信号),在一定程度上有效地解决弱故障、弱缺陷或其它弱特征信号的检测问题,因为在弱信号的监测中,阈上信号一般是被认为噪声的存在是不利于系统对输入信号的响应。而在Stocks提出的阈上随机共振[7],先前对H-H(Hodgkin-Huxley)神经元模型非周期信号响应研究表明H-H神经元模型,存在阈下非周期随机共振现象,但引入噪声可以增强神经元对非周期输入信号的响应,而且在一个合适的噪声强度上,神经元输出互信息率达到了最大值,这时就产生了阈上非周期随机共振现象。

由于H-H神经元模型本质上是二阶模型,经对H-H神经元模型的二阶简化模型阈值特性的相平面分析,表明该二阶简化模型等价于阈值单元模型,其阈值跨越可以选定多阈值。而语音信号处于[-1, 1]区间内,信号更多是以非周期信号的形式出现。由此本文提出,利用H-H神经元模型阈上非周期随机共振的原理,提出多阈值阈上随机共振,来实现对强噪声语音增强。

3基于非周期随机共振语音增强算法基本原理及算法步骤

3.1评价方法

验证本文所提自适应随机共振语音增强算法的有效性,分别求得增强前后语音的信噪比(SNR)并对增强前后的语音进行听觉实验。评价指标(SNR)的定义如下:

式(4)中,μ为噪声强度改变的步长,sgn为符号函数,SNR为含噪语音信号信噪比,σ为噪声强度。

3.3算法步骤

根据基本思想阐述,本文进一步的应用于单声道的语音增强系统中。

1)分析输入含噪语音信号s(n),设置最佳噪声迭代步数H、每一步需要加噪次数Z及噪声强度改变的步长μ;

2)添加相互独立且噪声强度相等δ的高斯白噪声Z次到输入含噪语音信号s(n);

3)将每次添加白噪声得到语音信号Sij(n)根据式(2)进行阈值分类,根据式(3)将每次输出的yt(n)得到yf(n);

4)如果当前的迭代步数f=H,则输出语音信号为最优的语音增强信号yf(n),反之,转向步骤(2),根据式(4)改变噪声强度。

3.4多阈值非周期随机共振算法初值选取及算法原理图

由于添加噪声次数Z同算法随机共振效果紧密联系,Z取值越大,算法随机共振效果越明显,复原的效果也更好。但Z的增大同样也会导致算法执行效率的降低,兼顾两者,而且经过实验测试,本文取Z =150。最佳噪声迭代步数H决定了迭代的收敛特性,H取值越大,算法迭代的结果就越趋近于某一收敛值;但同时随着H取值增大,算法执行所需要时间也就越长,因而在实际仿真应用中要兼顾两者考虑,本文取H =300。经仿真实验,取步长μ=0.2为定值。

4仿真结果与分析

实验中采用的语音材料在实际道路环境中采集的道路噪声,用于随机共振处理的噪声选自NOISE-92数据库,噪声类型为白噪声。语音信号和噪声信号均8Hz采样, 16bit量化。根据本文提出的语音增强算法,采用语音库中的多种纯净语音样本进行反复试验,不同的信噪比合成各种实验所需的含噪语音信号。

图2表示利用本文提出的多阈值随机共振方法进行语音增强,以及于传统的减谱法进行语音增强效果比较。不同的噪声强度下,采用本文提出的语音增强算法和传统的减普法仿真结果如表1所示。且进行两种算法结果的线性比较如图3所示。

从图2(b)可以看出,在强噪声环境中将噪声作为是能够实现对语音信号增强,但是仍然有噪声残留,同时比较传统减谱法的语音增强(图2(c)),明显可以看出本文提出的方法处理效果优于传统减谱法,因而本文提出的算法能够很好增强在强噪声环境中语音信号。

通过对反复实验的数据进行分析,由表1和图3可见,在噪声较弱的情况下,相对于传统减谱法,本文方法没有显示出优越性,复原的效果甚至比传统方法差;但是随着噪声逐渐增强,相对于强背景噪声,本文方法明显优于传统算法,且随着噪声强度的增加,语音增强效果越好。针对传统的语音增强方法,削弱噪声来间接地增强有用信号,而处于最优随机共振状态的语音阈值系统是将噪声能量转化为有用信号的能量以此来增强输出信号,由此噪声的强弱对于本文方法抑噪能力的影响相对小。

5结论

本文基于阈上非周期随机共振原理,提出一种通过自适应调节添加最佳噪声的方法,达到语音信号阈上最优随机共振,从而实现语音增强。与传统的算法区别在于:利用了噪声来实现语音增强,而不是去除噪声。从而产生语音阈上非周期随机共振现象,并且对噪声的变化具有鲁棒性,提出了语音增强的新方法。

摘自：中国计量测控网

本文由乔科化学&云试剂商城整理编辑，如有侵权请联系删除