一、一种抗噪声语音识别系统的设计(论文文献综述)
张国明[1](2021)在《基于非线性特性的语音安全和声波通信关键技术研究》文中指出随着物联网技术与人工智能的快速发展,人与设备、设备与设备之间的交互和通信变得越来越普遍和智能。声波作为一种重要的信息载体,已被广泛应用于人机交互(Human–Computer Interaction,HCI)和设备与设备(Device-to-Device,D2D)之间的通信。然而以语音识别系统为代表的智能人机交互技术在带来便捷的同时,也面临着新的安全风险;对于声波通信来说,由于智能设备自身音频接口的特点,如何实现通信过程的无声且高效传输成为声波通信广泛应用的关键。本文针对智能语音设备的安全分析、防护问题以及智能设备间无声高速的声波通信问题,提出了相应的解决方案。1.针对智能语音设备面临的安全问题,本文分析了麦克风电路的硬件特性,并首次发现了电路中存在的非线性作用。基于该硬件漏洞提出并实现了一种无声的攻击方式:“海豚音攻击”(Dolphin Attack)。“海豚音攻击”通过对任意语音命令进行高频调制并利用电路中的非线性作用,可以以无声的方式将语音命令注入麦克风电路中,随后语音信号将被解调和恢复,从而被语音助手识别,最终控制智能设备进行相应的操作,包括无声激活Siri,并在i Phone上发起Face Time通话等。因此,攻击者可以在用户不知道的情况下操纵其智能设备,造成隐私泄露,财产损失等一系列的安全问题。2.针对智能语音助手面临的安全风险,本文提出了“海豚音攻击”安全防护技术,设计并实现了一种轻量级无需增加设备硬件的安全检测方法:Ear Array,它不仅可以对“海豚音攻击”进行检测,还可以确定攻击者的方位。本质上,无声的语音指令是一种频率较高的超声波信号,在空气中传播时,其固有的衰减速度比低频可听的声音衰减更快,特别是在遇到障碍物(智能设备)时,其衍射能力较弱,智能设备周围的超声波声场分布变得不均匀。基于声波传输的物理特性,提出了高频攻击指令和正常语音指令的传播模型并验证了可行性。通过智能设备上内置的多个麦克风对声场不同位置的声音进行捕获,提取与声场分布相关的特征,结合机器学习(Machine Learning,ML)的方法,实现对攻击信号的识别。为了提高Ear Array的性能,本文还首创的提出了一种新型的空间麦克风阵列形式,这也为智能设备生产厂商在设计麦克风阵列时提供建设性的参考建议。最终,本文使用两个自制的麦克风阵列对Ear Array的性能进行验证,实验表明Ear Array对攻击检测的准确度可达99%,定位准确度为97.89%。该方法可以很方便的移植到智能设备上,为语音识别系统的安全提供有力的保障。3.针对智能设备无法同时实现无声且高速率声波通信的问题,本文提出了一种基于非线性作用的声波通信方法。由于无需增加额外的硬件,声波通信已成为智能设备间通信的研究重点并可以服务于多种移动应用,例如移动支付,数据共享等。目前,声波通信的研究集中于如何使用可听频带或不可听(超声波)频带进行通信。前者获利用了比较宽的频带,通信速率比较高,但可以听得到声音,用户体验性差;后者使用超声波频带,虽然听不见,但可用的带宽(20–24k Hz)有限(大多数智能设备音频接口的采样率为48k Hz),因此通信速率较低。为了解决无声和高通信速率无法同时实现的问题,本文从全新的维度提出了一种智能设备间声波通信的方法:Ultra Comm。Ultra Comm采用正交频分复用技术(Orthogonal Frequency Division Multiplexing,OFDM)将传输信息调制到可听的频段(频带范围:0-20k Hz),在发射之前,将该声波信号调制到超声波上以实现高速和无声的通信,在接收端,利用麦克风电路的非线性效应,对接收到的高频信号进行解调,恢复出OFDM信号,然后对此信号进行解码。本文提出并建立了一种基于非线性的声波通信模型,从理论上分析了Ultracomm的最大吞吐量。最后,本文在7种不同的智能设备上实现并验证了Ultra Comm的性能,其通信速率高达16.24kbps,是目前最高通信速率的4倍。
洪进[2](2020)在《GOQD@SiO2核壳结构超快湿度传感器及其在语音识别方面的应用研究》文中认为噪声环境下语音识别一直以来是一个难题。当前,噪声环境下语音识别主要有语音增强、语音特征提取、语音模型参数调整三种方式。这几种方式在一定程度上可以抵抗噪声的干扰,但都不能从根本上解决噪声的干扰。本文提出了一种基于GOQD@Si O2核壳结构的新型超快湿度传感器,鉴于传感器超快响应速度以及噪声不敏感的特性,以此湿度传感器为声电换能器,设计了一种抗噪声语音识别系统。湿度传感器以交错电极为载体,氧化石墨烯量子点(GOQD)为湿敏材料,以强阳离子聚合物聚二烯丙基二甲基氯化铵(PDDA)为组装基底,通过静电自组装的方法将GOQD组装在二氧化硅微球表面,最终在交错电极上形成GOQD@PDDA@Si O2核壳结构。测试结果表明传感器具有3毫秒的超快响应速度,灵敏度达到了33.47KΩ/RH%。另外,从传感器的微观结构和氧化石墨烯量子点的特性分析了传感器具有超快响应速度的原因,利用交流复阻抗谱揭示传感器在高湿和低湿环境下的湿敏机理。通过对字母的响应特性的研究分析,揭示了超快湿度传感器在语音识别方面的可行性。识别系统利用FPGA控制ADC对发音时口腔周围湿度变化信号进行采集,并通过UART传输至电脑;对信号进行前期处理得到语音信号的起始点以及持续时长,从而得到语音信号的有效信号,对信号做了短时傅里叶变换(Short-time Fourier transform)将时域电压信号变换成频域信号;然后对信号做主成分分析(Principal component analysis)将信号投影至低维空间内,降低信号的维度并得到其特征向量;对信号做线性判别式分析(Linear discriminant analysis)并对其进行分类;最后利用基于MATLAB的上位机实时显示识别结果,实现了信号的实时可视化识别。搭建了测试环境,验证上述语音识别系统的抗噪声干扰性能,分别在嘈杂环境下和安静环境下对部分单词进行了识别实验。证明了此系统在安静环境下和嘈杂的环境下语音识别正确率均超过了90%。为在噪声环境下语音识别提供了一种可行的解决方案。
黄荣[3](2020)在《噪声背景下声纹识别算法的研究》文中研究说明随着声纹识别技术不断向前发展,声纹识别在近年来出现了一个快速发展的新局面,声纹识别以其便捷性、稳定性和低成本性等特点在军事安全、医疗健康和司法鉴定等多个领域得到广泛应用,并逐渐成为生物识别技术中的主流之一。虽然在无噪环境中,声纹识别已经取得非常好的效果,但是在实际应用过程中,因为各种背景噪声的影响,声纹识别往往达不到理想的效果。因此,本文对噪声背景下声纹识别相关技术的研究具有重要的意义,通过对整个声纹识别系统的分析与研究,本文的工作及创新点主要包括以下几个方面:研究声纹特征参数提取算法。通过分析基于gamatone滤波器的GFCC特征提取算法,然后针对GFCC特征在提取过程中采用对数压缩存在的不足进行改进和优化。本文结合幂函数的非线性压缩特性,在基于GFCC特征提取算法基础上提出了一种改进的自适应压缩ACGFCC特征提取算法,并在高斯混合模型通用背景模型的框架下进行了实验和仿真,实验表明,本文提出的自适应压缩ACGFCC特征在信噪比为5dB的噪声环境下平均识别率达到80%,在信噪比为10dB的噪声环境下平均识别率达到95%和在无噪声环境下平均识别率达到97%。提高了系统的识别率,具有良好的抗噪性能。研究声纹识别模型的抗噪性能。针对声纹识别在训练环境和现实应用环境因为噪声而不能很好匹配的问题,本文利用谱减法对声纹模型参数进行优化,提出了一种基于谱减法的模型参数优化算法,并结合高斯混合模型通用背景模型对优化后的模型进行了仿真和验证。实验表明,在噪声背景情况下,通过识别语音的声纹模型在对数谱域减去噪声模型得到相对纯净的声纹模型的方法能够提高系统1%到2%的准确率。因此该方法在一定程度上可以解决训练环境和实际应用环境因为噪声而导致的失配问题。
谈佳华[4](2019)在《带噪语音条件下声纹识别的优化》文中指出声纹识别又叫说话人识别,作为一种人工智能技术,它慢慢从研究走进了人们的生活,给人类带去便利。由于声纹识别的性能会受到噪声的干扰,因此,在实际应用中,其性能并不能达到像纯净语音那样的识别效果。据前期研究,噪声对不同模型的声纹识别都具有不同程度的影响。不同的噪声可使声纹识别的等错误率提升至原来的1.2~4倍不等。由此可见,噪声是影响识别结果的关键因素之一。因此,解决噪声对声纹识别产生的干扰问题是一项很有意义的研究工作。当前,针对提高噪声条件下声纹识别效果的研究,大致有三种研究思路:(1)对带噪声的语音进行抗噪处理;(2)研究更具有抗噪特性的声纹特征;(3)数据增强和优化声纹识别的模型结构。本文将从方法1和方法3入手,改进现有的声纹识别技术框架,提高噪声条件下声纹识别的效果。在语音抗噪方面,从用于分离多说话人语音的PIT系统中提取基本结构,用于语音的抗噪。做数据增强时,本文尝试了三种方式,以便更好地提高模型的抗噪能力。在声纹识别模型方面,对比多种模型后,本文选择了可以考虑到上下文影响的LSTM作为识别模型,并在模型中加上Attention机制,以探究其对模型鲁棒性的影响;损失函数选择效果较好的GE2E损失函数。实验结果表明,改进后的模型对噪声条件下的声纹识别效果有所提升,等错误率下降了 60%~70%。
秦天芸[5](2019)在《加性噪声下录音设备来源取证研究》文中认为数字音频作为日常生活中常见的数字媒介载体,在法庭案件中,常被作为证据提供给法院。因此,对数字音频来源性、真实性、完整性的验证至关重要。鉴别音频的录制设备来源真伪作为数字音频取证技术关注的热点问题之一,已经取得一定的成果。然而,其研究对象几乎为安静环境下录制的语音,很少考虑噪声环境下的情况。由于在噪声环境下对录音设备来源进行辨识更具有现实意义并且手机已经成为目前主流的录音设备,所以本文研究了加性噪声下手机来源识别方法,主要从如下四个方面开展了研究工作:1.针对数据库的构建,录制了涉及7个品牌24款不同型号的手机的干净语音数据库和含噪语音数据库,即CKC-SD、TIMIT-RD干净语音数据库,CKC-SD、TIMIT-RD含噪语音数据库。基于构建的数据库,检测现有两种性能优异的来源识别算法的噪声鲁棒性,实验结果说明,尽管目前识别算法对干净语音有着很好的识别性能,但噪声鲁棒性差,不能推广至噪声环境。2.研究不同手机录制的语音的语谱图,具体分析了不同品牌手机录制的语音被嵌入的设备差异信息以及相同品牌不同型号手机录制的语音被嵌入的设备差异信息。此外,还通过研究环境噪声对设备差异的影响、去噪处理对设备差异的影响等问题,为本论文后续工作奠定了研究基础。3.根据不同设备在频域上的差异,发现手机录音设备的识别关键在于对同品牌不同型号手机设备的区分,因此本文提出了一种基于常Q变换和多场景噪声训练的手机来源识别算法。实验结果表明,本算法保持对不同品牌手机的区分性能的同时,也提升了同品牌内手机的识别率,在CKC-SD和TIMIT-RD数据库上,对干净语音的平均识别准确率分别为97.08%、99.29%,对含噪语音的平均识别率超过90%,极大的提升了算法对含噪语音的识别能力。4.通过分析不同设备差异信息在不同频域上的差别,提出来一种基于融合特征和卷积神经网络的手机来源识别算法。实验结果表明,本算法将使用不同时频变换方式提取得到的短时傅里叶变换的频谱分布特征,梅尔频率倒谱系数特征和常Q变换的频谱分布特征这三个特征串联构成的融合特征作为设备区分性特征,在CKC-SD和TIMIT-RD含噪数据库上的识别率分别为94.06%、92.44%。此外还通过设备差异特点和大量实验来探究适用于录音设备来源取证领域的卷积神经网络的输入层输入选择和框架设计的一些原则。
王晓波[6](2019)在《面向语音端点检测的关键电路优化设计》文中提出随着物联网的发展,语音识别技术受到越来越多的关注。语音端点检测作为语音识别预处理模块中的关键模块,检测正确率和速度直接影响语音识别的正确率和速度。时频端点检测算法由于其抗噪性较强且有一定实时性而被广泛用于语音端点检测的硬件加速。本文针对已有的时频端点检测电路进行优化设计,在保证正确率的条件下,进一步提高语音端点检测的速度与硬件资源利用率。本文首先根据时频语音端点检测算法的软件仿真,确定了端点检测电路的关键模块:分帧模块和谱熵计算模块;为了减少分帧电路硬件资源占有率,本文改进了已有的先存后算的分帧电路结构,设计了一种先进行预计算,然后存储所计算的中间数据的分帧电路。在需要使用数据时,只要取出之前的预计算数据进行一步计算即可得到计算结果;为了减少谱熵计算电路的延时,本文设计了基于流水线的谱熵计算电路结构,一方面对其中耗时较多的FFT单元进行了流水线设计,另一方面通过计算流程的转换,去除了谱熵计算中各个步骤间的数据依赖关系,使得谱熵计算电路能够实现流水线计算。本文采用ISE工具在搭载了Xilinx Artix-7芯片的FPGA开发板上对所设计的电路进行了验证。实验结果表明:本文设计的端点检测电路在信噪比0dB下能够达到90%以上的检测准确率;计算延迟与同类EZV-EDG端点检测电路相比减少了18%,最高频率达到了130.730MHz;Register和LUT硬件资源与DoV端点检测电路和谱减端点检测电路相比降低了10%以上。结果表明本文设计实现了一种实时性、抗噪性、硬件资源利用率较好的语音端点检测电路。
崔锐[7](2017)在《噪声环境下鲁棒性说话人识别算法研究》文中提出语音信号可以传递出有关于说话人的多种信息,如语言信息(说话的内容),说话者信息(身份,情感,生理特征等),环境信息(背景,信道等)等。说话人识别是指,通过从说话人提供的语音信号中提取出中能反映其身份特征的矢量序列来识别说话人的技术。近年来,说话人识别的性能在实验室环境下已经相当高,但在实际应用中,由于背景噪声和信道畸变等影响会导致其识别率大大下降。为了将说话人识别技术推广到实际应用环境中,解决噪声问题对系统识别率的影响,本文在梅尔频率倒谱(MFCC)特征提取和矢量量化(VQ)建模的基础上,设计了噪声环境下的鲁棒性说话人识别系统,并分别从系统的特征空间和模型空间两个方面切入,对实际环境中的抗噪声鲁棒性算法做了深入的研究。现有的许多单一抗噪技术,如信号空间的语音增强算法、特征空间的特征调整算法、模型空间的噪声补偿算法等,都需要先根据信噪比估计环境噪声,然后再对特定噪声做去噪或补偿处理。当环境中噪声已知或只存在平稳噪声时,这类方法能够达到不错的降噪效果,比如基于电话信道的说话人识别系统。但当说话人识别技术应用到更复杂的环境中时,噪声往往是未知的,且会随着时间的变化而发生变化,这就会导致系统识别率严重下降。为了解决这个问题,本文研究了两种抗噪声算法,针对环境噪声引起的信号特征被破坏和训练与识别环境失配的问题给出了解决方案。首先,在特征空间研究了一种基于语音增强和特征缺失结合的鲁棒性算法,通过从增强信号中获得的重要信息自动生成缺失的特征掩模,用于检测可靠的说话人特征。其中,为了增强输入的说话人语音信号,并进一步为计算缺失特征掩模提供有用的信息,本文采用最佳修改的对数频谱幅度(OM-LSA)语音估计与最小控制递归平均(MCRA)噪声估计结合的鲁棒性增强算法。MCRA估计噪声功率谱可以做到计算有效且偏差较小,因此对于低输入信噪比和存在潜在加性噪声的情况是鲁棒的,其最大的优点在于能够快速跟踪噪声谱中的突变。OM-LSA估计器也表现出良好的噪声抑制特性,去除噪声的同时仍然保留了弱语音分量。此外,为了解决噪声引起的训练与识别环境失配的问题,在模型空间引入了并行模型合并(PMC)算法,通过在识别阶段将估计的加性噪声和卷积噪声叠加到纯净语音训练的说话人模型上的方法,达到解决上述问题的目的。本文在白噪声和Babble噪声环境下,对说话人识别系统中所采用的鲁棒性算法分别进行测试得到结果:(1)将OM-LSA与MCRA结合的增强算法与仅用OM-LSA处理带噪语音相比,其PESQ值平均分别提高了0.335和0.419;(2)增强和特征缺失结合的算法在低信噪比和非平稳噪声环境下表现优越;(3)模型空间引入了PMC算法后,在30dB输入信噪比的情况下系统可以实现100%的识别率,其中PMC算法对系统识别率贡献了10.9%的正确率。
李垚飞[8](2014)在《基于HMM抗噪语音识别方法的研究与改进》文中提出随着科学技术的发展和计算机的广泛应用,人们希望能够用更加直接快速的方式与计算机进行交流,使其能够听懂人类的自然语音,为了实现这个更高的目标,语音识别技术随之而生,并且从研究至今已经取得了相当大的进展。目前,语音识别在无噪声干扰的环境下,已经取得了很好的效果,技术也相当的成熟。但考虑现实的噪声环境,语音识别技术就会遇到一些瓶颈,识别的效果会大幅的下降,主要原因就是噪声的复杂性以及其对语音特征参数的影响,使得待识别模版与训练模版匹配程度不高,造成识别率的下降。因此,使语音识别技术能充分实践应用,就必须解决环境噪声这个最大障碍,并进一步研究抗噪语音识别系统。本文主要针对环境噪声问题研究了语音识别的抗噪技术,随着语音识别抗噪声技术的研究及发展,目前抗噪技术主要有三种:语音增强,抗噪语音特征提取,抗噪语音模型参数调整。基于以上三种技术,语音识别抗噪声技术的研究重点就在不同的环境噪声下选用合理的技术且能有效的组合以上技术,使语音识别系统达到较好的识别性能。本文研究的重点是语音增强阶段和特征参数提取阶段语音识别的抗噪问题。首先介绍了语音识别的基本原理及系统的各个组成部分包括预处理、模式识别与匹配、特征参数提取等。由于小波变换不论在时域上还是在频域上都具有良好的局部信号分析能力,是一种较好的信号分析方法,并且广泛应用于信号去噪等多个领域。在小波变换的基础上引入了仿生小波分析方法,详细研究了仿生小波变换理论,结合仿生小波系数相关性的特点,着重研究了仿生小波相关性去噪方法。其次从实际应用出发,在分析和研究了传统语音增强方法的基础上,并结合其优缺点,提出一种基于仿生小波的相关性去噪方法,并通过Matlab仿真验证该去噪方法的有效性。在语音特征参数提取阶段,以MFCC的提取方法为前提,结合仿生小波抗噪算法,提出一种基于仿生小波变换的抗噪语音特征参数-BWTMFCC特征参数,用于语音识别特征参数提取。最后通过软件平台建立一个简单的非特定人、小词汇量的语音识别系统,将基于仿生小波的语音增强法和BWTMFCC特征参数提取方法应用于系统中,通过实验对比不同的特征参数系统的识别率来验证算法的有效性。
姜树彪[9](2014)在《语音增强技术研究及在语音识别中的应用》文中研究指明语音是生活中最重要的信息载体,然而它很容易受到噪声的污染,从而干扰信息的传递。语音增强,它能将重要的语音信号从嘈杂的带噪语音中分离出来,将噪声的影响尽可能地减少。语音识别技术在现实生活中应用越来越广泛,安静环境中的语音识别技术已经日趋成熟,而噪声环境下的语音识别技术仍然是一个难题。语音识别系统要实现抗噪就必须要尽量减少噪声的干扰,因此将语音增强技术结合到语音识别中来实现识别系统的抗噪性,具有很大的研究意义。本文的研究工作主要分成三个部分。第一,深入研究了几种传统的语音增强算法,包括谱减法、维纳滤波和最小均方误差估计算法,并在此研究基础上对这些算法进行了详细的仿真实验。基于实验的基础上,对比分析这些算法各自的优缺点,并从信噪比和语音失真两方面去评价这些语音增强方法。最后,对各种算法加以总结得出不同噪声要求的情况下比较合适的语音增强算法。第二,对语音识别技术进行了分析和比较研究,着重分析了预处理、端点检测等几个语音识别实现需要解决的关键性技术。在此基础上,我们实现了主流的动态时间规整和隐马尔可夫算法。从识别率上,对两种算法进行了分析,并实验比较了这些语音识别系统抗噪性的差异。第三,提出了一种基于语音增强技术的语音识别算法。该算法将语音增强与语音识别进行联合处理,即在识别之前先进行语音增强处理。实验证明,实现的语音识别系统具有良好的抗噪性。通过比较几种语音增强算法在语音识别上应用结果及分析,得出了语音识别应用中较好的语音增强算法。设计了一个多引擎的语音识别系统,该系统抗噪性和识别率上,都比传统的识别算法效果更出色。
李克粉[10](2013)在《噪声环境下的语音识别方法研究与改进》文中进行了进一步梳理随着科学技术的发展和计算机的普及,人们对于计算机的交流方式提出了更高的要求,这促进了语音识别技术的发展,并使之成为语音处理领域中的一个重要研究方向。语音识别从研究至今已经取得了很大的进展。目前,在实验室环境即无噪声干扰的环境下,语音识别系统的识别率已经达到了很高的水平,但在噪声环境下识别性能会大幅下降,主要原因就是噪声的干扰使得训练模版与待识别模版不匹配,从而造成识别率的下降。因此,噪声是语音识别技术广泛实用化的最大障碍,对噪声环境下语音识别系统的研究也就变得尤为重要。本文主要研究了白噪声环境下的语音识别技术,介绍了语音识别的基本原理及系统的各个组成部分包括预处理,端点检测,特征参数提取,模式识别与匹配等。目前抗噪技术主要有三种:语音增强,抗噪语音特征提取,抗噪语音模型参数调整。随着语音识别抗噪声技术的研究及发展,如何在实际的语音识别系统中将以上的技术合理地结合起来,使语音识别系统在不同的噪声环境中均能达到较高的性能,是抗噪声语音识别研究的一个重要方向。本文研究的重点是预处理阶段和特征参数提取阶段语音识别的抗噪问题。小波变换不论在时域上还是在频域上都具有良好的局部信号分析能力,它是一种较好的信号分析方法,并且广泛应用于信号去噪等多个领域。本文引入了小波分析方法,详细研究了小波变换理论,分析了小波变换的特点,着重研究了小波阈值去噪方法。本文着重研究了两种抗噪方法:语音增强方法和抗噪语音特征参数提取方法。给出将两种方法相结合的抗噪方法,该方法的基本原理是:首先,在语音识别系统的前端增加语音增强部分,针对传统阈值去噪方法存在的问题,给出一种新的阈值去噪方法,并通过Matlab仿真验证了该去噪方法的有效性。其次,在语音特征参数提取阶段,本文给出一种新的基于小波变换的抗噪语音特征参数—TDWTMFCC特征参数,并将其与DWTMFCC参数相结合,用于语音识别特征参数提取。本文将上述改进过的两种抗噪方法(语音增强法和特征参数提取方法)相结合应用于一个非特定人、小词汇量的语音识别系统中,通过Matlab仿真实验对比验证了该组合去噪方法的有效性。
二、一种抗噪声语音识别系统的设计(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、一种抗噪声语音识别系统的设计(论文提纲范文)
(1)基于非线性特性的语音安全和声波通信关键技术研究(论文提纲范文)
致谢 |
摘要 |
Abstract |
第一章 绪论 |
1.1 课题背景及研究意义 |
1.1.1 语音识别系统安全分析和防护 |
1.1.2 声波通信 |
1.2 国内外研究现状 |
1.2.1 智能语音识别系统安全分析与防护研究现状 |
1.2.2 智能终端设备声波通信研究现状 |
1.3 研究内容 |
1.3.1 语音识别系统安全分析 |
1.3.2 语音识别系统安全防护 |
1.3.3 基于非线性作用的声波通信 |
1.3.4 论文组织结构 |
第二章 语音识别系统安全分析 |
2.1 引言 |
2.2 语音识别系统相关系统 |
2.2.1 语音助手 |
2.2.2 麦克风 |
2.2.3 人类听觉范围 |
2.2.4 威胁模型 |
2.3 “海豚音攻击”设计 |
2.3.1 语音指令生成 |
2.3.2 语音指令调制 |
2.3.3 攻击设备 |
2.4 攻击的可行性验证 |
2.4.1 语音助手及设备的选择 |
2.4.2 实验设置 |
2.4.3 实验结果 |
2.5 实验验证与评估 |
2.5.1 不同语言对攻击成功率的影响 |
2.5.2 背景噪声的影响 |
2.5.3 语音指令的声压水平的影响 |
2.5.4 攻击距离的影响 |
2.5.5 使用智能手机作为攻击设备 |
2.5.6 便携式攻击设备 |
2.5.7 使用传统扬声器的可行性验证 |
2.6 远距离攻击 |
2.6.1 使用超声换能器阵列进行远距离攻击 |
2.6.2 有声和无声的临界点 |
2.7 本章小结 |
第三章 语音识别系统安全防护技术 |
3.1 引言 |
3.2 声学基础知识 |
3.2.1 “海豚音攻击”信号的形态变化 |
3.2.2 语音信号的特点 |
3.2.3 声波的衰减 |
3.2.4 智能设备的麦克风阵列 |
3.3 声学衰减模型 |
3.3.1 理论分析 |
3.3.2 声场仿真 |
3.3.3 声场验证 |
3.3.4 声学衰减验证 |
3.4 防御方案设计 |
3.4.1 系统概述 |
3.4.2 音频信号预处理 |
3.4.3 特征提取 |
3.4.4 攻击检测和定位 |
3.5 实验验证与性能分析 |
3.5.1 原型实现 |
3.5.2 实验设置 |
3.5.3 整体性能 |
3.5.4 距离的影响 |
3.5.5 角度的影响 |
3.5.6 载波频率的影响 |
3.5.7 环境噪声的影响 |
3.5.8 不同语音指令的影响 |
3.5.9 几种规避策略的影响 |
3.5.10 窗口时间和样本重叠时间对检测准确度的影响 |
3.5.11 声压的影响 |
3.5.12 带三个麦克风的智能手机 |
3.6 问题讨论以及未来工作 |
3.6.1 智能手机 |
3.6.2 智能音箱 |
3.6.3 基于硬件的防御 |
3.7 本章小结 |
第四章 基于非线性特性的智能设备声波通信 |
4.1 引言 |
4.2 非线性声学 |
4.2.1 麦克风电路 |
4.2.2 非线性作用的原理 |
4.3 声波通信系统模型 |
4.3.1 无声通信的通信速率 |
4.3.2 Ultra Comm的通信速率。 |
4.4 基于非线性作用的声波通信技术 |
4.4.1 初始化过程 |
4.4.2 数据帧结构设计 |
4.4.3 数据帧设计 |
4.4.4 OFDM信号调制 |
4.4.5 接收器设计 |
4.5 实验验证与性能评估 |
4.5.1 实验设置 |
4.5.2 性能测试 |
4.5.3 性能评估 |
4.6 Ultra Comm的局限性 |
4.7 本章小结 |
第五章 总结与展望 |
5.1 工作总结 |
5.2 研究展望 |
参考文献 |
攻读博士期间主要研究成果及参与的科研项目 |
(2)GOQD@SiO2核壳结构超快湿度传感器及其在语音识别方面的应用研究(论文提纲范文)
摘要 |
abstract |
第1章 绪论 |
1.1 引言 |
1.2 研究现状 |
1.2.1 声学传感器研究现状 |
1.2.2 湿度传感器研究现状 |
1.2.3 语音识别算法研究现状 |
1.3 论文结构安排 |
第2章 GOQD@SiO_2核壳结构传感器制作和测试 |
2.1 湿敏材料和换能器件选取 |
2.2 传感器制作过程 |
2.3 传感器表征 |
2.3.1 湿敏材料TEM与 FTIR |
2.3.2 传感器表面湿敏薄膜SEM图 |
2.3.3 传感器水滴接触角 |
2.4 传感器性能测试 |
2.4.1 湿敏特性 |
2.4.2 响应与恢复特性 |
2.4.3 湿滞特性 |
2.5 湿度传感器响应机制 |
2.6 超快湿度传感器对语音信号的响应特性 |
2.7 本章小结 |
第3章 基于超快湿度传感器的语音识别系统硬件设计与实现 |
3.1 基于超快湿度传感器的语音识别系统总体架构 |
3.2 声电转换电路 |
3.3 湿度信号采集电路 |
3.4 信号传输电路 |
3.5 主控电路 |
3.6 本章小结 |
第4章 基于超快湿度传感器的语音识别系统软件设计 |
4.1 有效信号截取 |
4.2 信号时频分析 |
4.2.1 傅里叶变换分析 |
4.2.2 短时傅里叶变换分析 |
4.3 主成分分析 |
4.4 信号分类 |
4.5 基于湿度传感器的语音识别上位机设计 |
4.5.1 串口参数设置 |
4.5.2 信号的实时接收与有效信号截取 |
4.5.3 信号现场训练和识别 |
4.6 本章小结 |
第5章 基于湿度传感器的语音识别系统测试 |
5.1 FPGA系统仿真验证 |
5.1.1 信号采集和预处理验证 |
5.1.2 串口发送模块功能验证 |
5.1.3 信号更新与分帧验证 |
5.2 上位机测试 |
5.2.1 实时波形显示与信号截取界面测试 |
5.2.2 信号训练和识别功能 |
5.3 语音识别系统联合测试 |
5.3.1 安静环境下识别测试 |
5.3.2 噪声环境下的识别测试 |
5.4 本章小结 |
总结与展望 |
工作总结 |
工作展望 |
致谢 |
参考文献 |
攻读硕士学位期间发表的论文 |
(3)噪声背景下声纹识别算法的研究(论文提纲范文)
摘要 |
ABSTRACT |
缩略语表 |
第一章 绪论 |
1.1 研究背景与意义 |
1.2 国内外研究现状 |
1.2.1 声纹识别国内外研究现状 |
1.2.2 噪声背景下声纹识别研究现状 |
1.3 研究目标及内容 |
1.4 论文章节安排 |
第二章 相关理论基础及方案设计 |
2.1 语音信号产生基本原理 |
2.2 声纹识别基本概念 |
2.3 声纹识别系统框架 |
2.3.1 语音信号预处理 |
2.3.2 语音特征参数 |
2.3.3 声纹模型 |
2.4 系统方案设计 |
2.5 系统评价指标 |
2.6 本章小结 |
第三章 改进的自适应压缩ACGFCC特征提取算法 |
3.1 GFCC特征提取 |
3.2 ACGFCC特征提取算法思想 |
3.3 自适应压缩ACGFCC特征提取 |
3.4 ACGFCC特征提取流程图及复杂度分析 |
3.5 实验结果与分析 |
3.5.1 实验环境 |
3.5.2 语音实验数据 |
3.5.3 实验参数设置 |
3.5.4 识别结果与分析 |
3.6 本章小结 |
第四章 基于谱减法的声纹模型参数优化 |
4.1 谱减法原理 |
4.2 GMM模型 |
4.2.1 高斯混合模型 |
4.2.2 GMM_UBM模型 |
4.3 模型参数训练 |
4.3.1 K-Means算法 |
4.3.2 EM算法 |
4.3.3 基于MAP的模式匹配 |
4.4 声纹模型参数优化 |
4.4.1 噪声估计 |
4.4.2 GMM参数优化 |
4.5 实验结果与分析 |
4.6 本章小结 |
第五章 总结与展望 |
5.1 论文总结 |
5.2 后续展望 |
致谢 |
参考文献 |
(4)带噪语音条件下声纹识别的优化(论文提纲范文)
摘要 |
Abstract |
1 绪论 |
1.1 研究目的和意义 |
1.2 声纹识别技术的分类 |
1.3 国内外研究概况及技术发展 |
1.3.1 国内外研究历史及概况 |
1.3.2 声纹识别技术的发展 |
1.4 研究内容与技术路线 |
1.4.1 声纹识别系统现存的问题 |
1.4.2 研究内容 |
1.4.3 技术路线 |
1.5 论文组织结构 |
2 噪声与声纹识别系统 |
2.1 噪声的定义 |
2.2 噪声的分类 |
2.2.1 加性噪声、乘性噪声 |
2.2.2 平稳噪声、缓变噪声、冲击噪声 |
2.2.3 全频带噪声、窄带噪声 |
2.3 噪声对声纹识别效果的影响 |
2.4 声纹识别系统中的抗噪技术 |
2.4.1 语音抗噪 |
2.4.2 数据增强 |
2.4.3 优化模型结构及损失函数 |
2.5 本章小结 |
3 基于PIT系统的语音抗噪 |
3.1 语音抗噪系统实现流程 |
3.2 获取带噪声语音 |
3.3 提特征处理 |
3.4 模型结构及系统实现 |
3.4.1 PIT系统 |
3.4.2 选用PIT系统的研究思路 |
3.4.3 模型结构及系统实现 |
3.5 系统抗噪效果评价标准 |
3.6 实验数据及实验结果分析 |
3.6.1 实验数据 |
3.6.2 实验结果分析 |
3.7 本章小结 |
4 噪声条件下声纹识别模型的优化 |
4.1 声纹识别系统实现流程 |
4.1.1 声纹识别系统实现流程 |
4.1.2 实验思路 |
4.2 数据增强处理 |
4.2.1 调节信噪比 |
4.2.2 调节训练集中纯净语音与带噪声语音数量比 |
4.3 提取声纹特征 |
4.3.1 MFCC |
4.3.2 其他特征 |
4.4 数据预处理 |
4.5 模型结构及改进方法 |
4.5.1 基础模型结构 |
4.5.2 Attention机制 |
4.6 评价标准 |
4.7 实验数据及实验结果分析 |
4.7.1 实验数据 |
4.7.2 实验结果分析 |
4.8 本章小结 |
5 总结与展望 |
5.1 总结 |
5.2 展望 |
参考文献 |
个人简介 |
第一导师简介 |
第二导师简介 |
致谢 |
(5)加性噪声下录音设备来源取证研究(论文提纲范文)
引言 |
1 绪论 |
1.1 研究背景与意义 |
1.2 录音设备来源识别国内外研究现状 |
1.3 本文主要工作与章节安排 |
2 语音数据库及来源识别算法的噪声鲁棒性检测 |
2.1 语音数据库构建 |
2.1.1 CKC-SD语音数据库 |
2.1.2 TIMIT-RD语音数据库 |
2.1.3 含噪语音数据库 |
2.2 来源识别算法的噪声鲁棒性检测 |
2.2.1 基于MFCC的录音设备来源识别 |
2.2.2 基于子带能力差异特征的录音设备来源识别 |
2.3 本章小结 |
3 不同录音设备差异分析 |
3.1 不同录音设备录制的干净语音差异分析 |
3.2 不同录音设备录制的含噪语音差异分析 |
3.3 去噪处理对录音设备差异的影响 |
3.4 本章小结 |
4 噪声环境下基于常Q变换的手机来源识别算法 |
4.1 常Q变换 |
4.2 特征提取 |
4.3 多场景训练的识别算法框架 |
4.4 实验与分析 |
4.4.1 实验设置 |
4.4.2 参数选择 |
4.4.3 不同特征的比较 |
4.4.4 不同分类器的比较 |
4.4.5 多场景和单场景训练方法的比较 |
4.4.6 不同来源识别算法的比较 |
4.5 本章小结 |
5 噪声环境下基于融合特征的手机来源识别算法 |
5.1 特征分析 |
5.1.1 STFTSDF |
5.1.2 MFCC |
5.1.3 CQTSDF |
5.2 CNN和来源识别算法 |
5.2.1 CNN |
5.2.2 来源识别算法 |
5.3 实验与结果分析 |
5.3.1 特征比较 |
5.3.2 CNN实验分析 |
5.4 本章小结 |
6 总结与展望 |
6.1 本文工作总结 |
6.2 未来工作展望 |
参考文献 |
在学研究成果 |
致谢 |
Abstract |
摘要 |
(6)面向语音端点检测的关键电路优化设计(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 研究背景及研究意义 |
1.1.1 研究背景 |
1.1.2 研究意义 |
1.2 国内外研究现状 |
1.3 研究内容和设计指标 |
1.3.1 研究内容 |
1.3.2 设计指标 |
1.4 论文组织结构 |
第二章 语音端点检测系统介绍 |
2.1 语音端点检测系统简介 |
2.1.1 语音识别系统中的语音端点模块 |
2.1.2 时频结合语音端点检测算法原理介绍 |
2.1.3 时频结合语音端点检测算法模块介绍 |
2.2 语音特征参数介绍 |
2.2.1 语音特征参数选择 |
2.2.2 时域参数原理介绍 |
2.2.3 频域参数原理介绍 |
2.3 时频结合语音端点检测电路设计 |
2.3.1 语音端点检测算法电路设计方案 |
2.3.2 时频端点检测电路模块设计 |
2.3.3 关键电路分析 |
2.4 本章小结 |
第三章 端点检测预处理电路优化设计 |
3.1 语音端点检测预处理电路分析 |
3.1.1 预加重电路 |
3.1.2 分帧电路 |
3.1.3 加窗电路 |
3.2 分帧-特征提取电路优化设计 |
3.2.1 过零率分帧电路 |
3.2.2 平均能量分帧电路 |
3.2.3 熵谱-分帧电路 |
3.3 仿真验证与实验结果 |
3.3.1 仿真验证 |
3.3.2 分帧电路优化实验结果 |
3.4 本章小结 |
第四章 端点检测计算电路优化设计 |
4.1 语音端点检测计算电路分析 |
4.1.1 短时能量和过零率电路 |
4.1.2 谱熵参数计算电路 |
4.1.3 判决电路 |
4.2 谱熵计算电路优化设计 |
4.2.1 FFT流水线结构 |
4.2.2 频谱处理计算结构 |
4.2.3 时频参数同步电路 |
4.3 仿真验证和结果分析 |
4.3.1 电路功能仿真验证 |
4.3.2 谱熵参数计算电路实验结果 |
4.4 本章小结 |
第五章 端点检测电路验证 |
5.1 实验平台 |
5.1.1 软件环境介绍 |
5.1.2 硬件环境介绍 |
5.1.3 验证数据集 |
5.2 实验结果和分析 |
5.2.1 系统功能验证 |
5.2.2 系统计算效率 |
5.2.3 硬件资源开销 |
5.3 本章小结 |
第六章 总结与展望 |
6.1 总结 |
6.2 展望 |
致谢 |
参考文献 |
攻读硕士学位期间的研究成果 |
附录 |
(7)噪声环境下鲁棒性说话人识别算法研究(论文提纲范文)
摘要 |
ABSTRACT |
符号对照表 |
缩略语对照表 |
第一章 绪论 |
1.1 研究背景和意义 |
1.2 说话人识别技术的发展和现状 |
1.3 鲁棒性说话人识别技术 |
1.4 论文研究内容和章节安排 |
第二章 说话人识别系统研究 |
2.1 说话人识别原理和问题建模 |
2.2 语音信号预处理 |
2.2.1 采样和量化 |
2.2.2 预加重 |
2.2.3 分帧加窗 |
2.3 说话人识别特征参数 |
2.3.1 特征参数的评价方法 |
2.3.2 特征参数分类 |
2.4 说话人识别模型 |
2.5 噪声环境下的说话人识别 |
2.5.1 噪声的分类 |
2.5.2 说话人识别中的抗噪声算法 |
第三章 鲁棒性说话人识别系统设计 |
3.1 系统设计方案概述 |
3.2 系统各模块说明 |
3.2.1 训练阶段 |
3.2.2 识别阶段 |
3.3 MFCC特征参数提取 |
3.3.1 MFCC的原理 |
3.3.2 Mel滤波器组 |
3.3.3 MFCC特征参数提取 |
3.4 VQ说话人建模方法 |
3.4.1 矢量量化原理和问题建模 |
3.4.2 基于k-means算法的码书设计过程 |
3.4.3 矢量量化的失真测度 |
第四章 说话人识别的鲁棒性算法研究 |
4.1 OM-LSA语音估计算法 |
4.1.1 OM-LSA增强原理 |
4.1.2 最优修正的增益函数 |
4.1.3 先验信噪比估计 |
4.1.4 语音端点检测 |
4.2 MCRA噪声估计算法 |
4.3 OM-LSA与MCRA结合的增强算法 |
4.4 基于OM-LSA与MCRA增强算法的特征缺失算法研究 |
4.4.1 特征缺失方法概述 |
4.4.2 缺失特征重建方法 |
4.4.3 语音增强改进的缺失特征检测方法 |
4.5 基于PMC的模型空间补偿算法研究 |
第五章 系统实现与实验结果 |
5.1 实验语音库 |
5.2 语音增强实验结果与分析 |
5.2.1 评价指标 |
5.2.2 实验设计与实验结果分析 |
5.3 系统实验结果与分析 |
5.3.1 增强与缺失特征结合算法性能测试 |
5.3.2 PMC算法性能测试 |
第六章 总结与展望 |
6.1 论文完成的工作 |
6.2 遗留问题及后续工作的考虑 |
参考文献 |
致谢 |
作者简介 |
(8)基于HMM抗噪语音识别方法的研究与改进(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 研究背景与意义 |
1.2 语音识别技术的发展及应用 |
1.3 语音识别的基本原理 |
1.4 语音识别面临的主要技术问题 |
1.5 论文的内容及结构 |
1.5.1 本文的主要研究内容 |
1.5.2 论文的结构 |
第二章 语音信号的抗噪声技术 |
2.1 语音信号的主要特性 |
2.1.1 语音的分类 |
2.1.2 人耳感知特性 |
2.2 噪声特性及其分类 |
2.2.1 加性噪声和乘性噪声 |
2.2.2 平稳噪声、缓变噪声与冲激噪声 |
2.2.3 全频带噪声和窄带噪声 |
2.2.4 噪声对语音识别的影响 |
2.3 语音信号预处理的基本方法 |
2.3.1 带噪语音模型 |
2.3.2 谱相减法(SS) |
2.3.3 自适应滤波器降噪法 |
2.3.4 小波变换法 |
2.4 本章小结 |
第三章 隐马尔可夫模型原理 |
3.1 隐马尔可夫模型 |
3.1.1 马尔可夫链 |
3.1.2 HMM的定义 |
3.1.3 HMM的结构 |
3.2 HMM基本算法 |
3.2.1 前向后向算法 |
3.2.2 Viterbi算法 |
3.2.3 Baum-Welch算法 |
3.3 语音识别训练方法 |
3.4 本章小结 |
第四章 基于仿生小波变换的语音增强及特征参数 |
4.1 特征参数提取 |
4.1.1 线性预测系数(LPC) |
4.1.2 线性预测倒谱系数(LPCC) |
4.1.3 MFCC特征提取 |
4.2 基于仿生小波变换的相关性去噪 |
4.2.1 相关性去噪原理 |
4.2.2 仿生小波变换 |
4.2.3 仿生小波相关性去噪的实现 |
4.2.4 基于仿生小波变换的语音增强实验及结果分析 |
4.3 基于仿生小波变换的语音特征参数提取 |
4.3.1 小波变换的Mel频谱参数提取 |
4.3.2 仿生小波的Mel频谱特征参数提取 |
4.3.3 基于仿生小波的语音特征提取实验及结果分析 |
4.4 本章小结 |
第五章 实验及结果分析 |
5.1 抗噪声的语音识别系统 |
5.2 实验测试与分析 |
5.2.1 实验平台的建立 |
5.2.2 测试结果分析 |
5.3 本章小结 |
总结与展望 |
参考文献 |
攻读学位期间发表的论文 |
致谢 |
(9)语音增强技术研究及在语音识别中的应用(论文提纲范文)
中文摘要 |
Abstract |
第一章 绪论 |
1.1 课题研究背景及意义 |
1.2 研究历史及现状 |
1.3 语音及噪声模型特性 |
1.4 论文工作及章节安排 |
第二章 语音识别技术比较研究 |
2.1 语音识别的分类 |
2.2 语音识别的系统设计 |
2.2.1 预处理 |
2.2.2 端点检测 |
2.2.3 特征参数提取 |
2.2.4 语音识别算法 |
2.3 语音识别算法评价标准 |
2.4 基于DTW和HMM的语音识别系统实验 |
2.4.1 实验用软件及设备 |
2.4.2 实验参数设置及语音内容 |
2.4.3 实验结果及分析 |
第三章 语音增强算法比较分析 |
3.1 语音增强的基本理论 |
3.1.1 语音信号模型 |
3.1.2 语音增强系统 |
3.2 谱减法 |
3.3 最小均方误差估计 |
3.4 维纳滤波 |
3.5 算法评价标准 |
3.6 实验结果及分析 |
第四章 基于语音增强的抗噪声语音识别 |
4.1 基于语音增强的语音识别系统 |
4.1.1 语音增强算法评述 |
4.1.2 基于语音增强的语音识别系统设计 |
4.2 抗噪声语音控制系统 |
4.3 实验结果 |
总结与展望 |
参考文献 |
致谢 |
个人简历 |
在读期间已发表和录用的论文 |
(10)噪声环境下的语音识别方法研究与改进(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 研究背景及意义 |
1.2 语音识别系统的分类 |
1.3 国内外研究历史及现状 |
1.3.1 国外研究历史 |
1.3.2 国内研究历史 |
1.3.3 语音识别技术发展现状及趋势 |
1.4 语音识别存在的问题 |
1.5 本文主要研究内容及结构安排 |
第2章 语音识别系统原理概述 |
2.1 语音识别系统的结构框架 |
2.2 语音信号的预处理 |
2.2.1 语音信号的预加重 |
2.2.2 加窗分桢 |
2.2.3 端点检测 |
2.3 特征参数提取 |
2.3.1 线性预测系数(LPC) |
2.3.2 线性预测倒谱系数(LPCC) |
2.3.3 美尔频率倒谱系数(MFCC) |
2.4 语音识别模型 |
2.5 本章小结 |
第3章 语音识别系统的抗噪声技术 |
3.1 噪声的分类 |
3.1.1 加性噪声、乘性噪声 |
3.1.2 平稳噪声、缓变噪声与冲激噪声 |
3.1.3 全频带噪声和窄带噪声 |
3.2 噪声对语音识别的影响 |
3.3 各种抗噪声语音识别技术 |
3.3.1 语音增强 |
3.3.2 抗噪型语音特征提取技术 |
3.3.3 噪声环境的模型参数调整 |
3.4 本章小节 |
第4章 基于小波变换的语音识别与去噪技术 |
4.1 语音信号处理中的小波技术 |
4.1.1 小波变换基础知识 |
4.1.2 多分辨率分析 |
4.1.3 Mallat 算法 |
4.2 基于小波变换的语音去噪 |
4.2.1 离散小波变换的原理 |
4.2.2 小波阈值去噪 |
4.3 基于小波变换的语音特征参数提取 |
4.4 本章小结 |
第5章 仿真实验及结果分析 |
5.1 抗噪声的语音识别系统模型 |
5.1.1 预处理 |
5.1.2 基于小波阈值去噪法的语音增强 |
5.1.3 端点检测 |
5.1.4 基于离散小波变换的 DWTMFCC/TDWTMFCC 特征参数提取 |
5.1.5 HMM 模型 |
5.2 仿真实验 |
5.2.1 基于小波变换的语音增强实验及结果分析 |
5.2.2 基于小波变换的语音特征提取实验及结果分析 |
5.2.3 基于小波变换的组合去噪方法识别实验及结果分析 |
5.3 本章小节 |
结论 |
参考文献 |
附录 |
攻读硕士学位期间发表的学术论文 |
致谢 |
四、一种抗噪声语音识别系统的设计(论文参考文献)
- [1]基于非线性特性的语音安全和声波通信关键技术研究[D]. 张国明. 浙江大学, 2021(01)
- [2]GOQD@SiO2核壳结构超快湿度传感器及其在语音识别方面的应用研究[D]. 洪进. 西南交通大学, 2020(07)
- [3]噪声背景下声纹识别算法的研究[D]. 黄荣. 电子科技大学, 2020(07)
- [4]带噪语音条件下声纹识别的优化[D]. 谈佳华. 北京林业大学, 2019(04)
- [5]加性噪声下录音设备来源取证研究[D]. 秦天芸. 宁波大学, 2019(06)
- [6]面向语音端点检测的关键电路优化设计[D]. 王晓波. 东南大学, 2019(06)
- [7]噪声环境下鲁棒性说话人识别算法研究[D]. 崔锐. 西安电子科技大学, 2017(04)
- [8]基于HMM抗噪语音识别方法的研究与改进[D]. 李垚飞. 广东工业大学, 2014(10)
- [9]语音增强技术研究及在语音识别中的应用[D]. 姜树彪. 福州大学, 2014(09)
- [10]噪声环境下的语音识别方法研究与改进[D]. 李克粉. 江苏科技大学, 2013(08)