李明
摘要:将正交匹配追踪应用于语音增强领域,提出了一种新的语音增强方法。分析时频域的实验结果表明,该方法在低信噪比下能较好地还原语音信号的有用信息。
关键词:语音增强,正交匹配追踪,时频分析
中图分类号:TN912.35文献标识码:A 文章编号:1674-098X(2017)12(a)-0000-00
语音增强的目的是从带噪语音信号中提取出尽可能纯净的原始语音,从而提升语音质量,提高语音的可懂度[1]。实际环境中,语音通常会受到外界环境的干扰,尤其是在传输媒介中引入的噪声,电器设备的噪声,以及其他说话人的干扰等,表现形式为周期性噪声、冲激噪声和高斯白噪声等。纯净的语音信号一般只能在实验室采集,为此语音增强技术已发展为语音信号处理中的一个重要组成部分。语音增强最为经典的方法是谱减法,其基本思想是利用语音信号的短时和平稳性,将带噪语音信号的短时谱减掉估计噪声的短时谱,从而得到较为纯净的语音信号[2]。然而,谱减法由于在频域会出现随机尖峰,相应时域则会出现一些类正弦信号的叠加现象。1993年,Mallat提出从高度冗余的完备字典中选择最为匹配的原子来逼近原始信号的方法,该方法具有很好的自适应能力[3]。本文将正交匹配追踪应用于低信噪比下的语音增强,实验结果表明,该方法能较好地还原有用语音信息成分。
1. 算法原理
正交匹配追踪 (OMP)是在匹配追踪(MP)的基础上提出的,其算法核心是将所构原子库空间的原子按Gram-Schmidt正交化方法进行正交化处理,然后用类似于MP算法将信号在这些正交原子构成的空间上进行分解[4]。由于该方法在递归过程中增加了原子正交化的环节,因此确保了每次迭代得到的结果最优。其算法步骤如下:
(1)假设D为信号稀疏分解的过完备原子库, 为待处理的信号序列,信号残余 ,已选原子的集合 为空集,迭代次数 。
(2)从字典D中选出与待分解信号 最为匹配的原子 ,需满足以下条件:
(1)
(3)更新已选原子的集合 。
(4)根据最小二乘法求得投影系数 ,信号 ,残余 。
(5)更新迭代次数 ,判断残余信号与原始信号的能量比 是否小于设定值,若不满足则返回步骤(2),若满足则输出重构信号: ,残余 。
由此可知,OMP是一种将信号依据原子逐步分解的过程。首先,在原子库中选取与信号最为匹配的原子,然后将匹配的成分从原信号中减去残余;在之后的每次迭代中,选择与残余最为匹配的原子,并将所有选中的原子正交化,在其原始信号上进行投影,并提取匹配部分、留下残余。按照这种方式反复迭代,直到残余信号的能量小于设定的阈值或达到最大迭代次数。该方法利用过完备原子库D 对带噪信号进行分解,从而去除噪声干扰[5]。
2. 实验结果与分析
分析图1和图2可知,在低信噪比環境下,文中所提方法能较好地去除高斯白噪声对纯净语音信号的干扰,语音增强后的频谱图更为清晰地反映了纯净语音信号的有用细节信息。
3. 结语
本文将自适应信号处理中的正交匹配追踪算法应用于语音增强领域,提出了一种新的语音增强方法。实验结果表明,该方法在低信噪比下能较好地还原原始语音信号的有用信息,鲁棒性较好。
参考文献:
[1] 芦靖. 单通道语音增强算法的研究与应用[D]. 西安:西安电子科技大学, 2009.
[2] Xu H Y. Speech Enhancement based on Compressed Sensing Technology[J]. Sensors & Transducers, 2014,181(10):141-145.
[3] Mallat S G, Zhang Z. Matching pursuits with time-frequency dictionaries[J]. IEEE Transactions on Signal Processing, 1993, 41(12): 3397-3415.
[4] 郭昕, 于凤芹. 基于匹配追踪与子空间联合的语音增强[J]. 电声技术, 2008, 32(9): 52-55.
[5] 王林, 蔡改改, 高冠琪, 等. 基于改进MP的稀疏表示快速算法及其滚动轴承故障特征提取应用. 振动与冲击, 2017, 36(3): 176-182.