一、利用DSP的电话网语音识别技术的应用研究(论文文献综述)
蔡政策[1](2011)在《VOIP声学回声消除归一化算法研究》文中研究指明在当今网络技术飞速发展,Internet广泛普及的情况下, IP电话具有良好的发展前景,特别对于矿井以及其它已建成有线局域网络或无线局域网络的工业特殊环境,更有其独特的应用优势。因此开展基于无线IP语音通话技术的研究,有着良好的实际应用意义和重要的理论研究价值。回声消除算法是VoIP应用中一项重要的基础算法,对于改善VoIP电话的实际应用体验,真正将其推向实际应用有着重要意义。VoIP电话回声消除硬件实现比较困难且费用高,软件相对来讲能够节省成本,软件实现主要是对算法的改进,对用户而言有一定的灵活性,用户只需要调整回声消除算法中相关参数,达到较好的回声消除目的。论文首先介绍了课题的来源、目的、意义;其次对IP电话的发展背景、发展历程、编码技术、技术发展情况、工作原理、系统组成和网络电话设备功能实现的软硬件设计方法进行了详细的论述。紧接着对VoIP的基本概念、系统组成和语音识别、关键技术、特点及回声消除原理进行了阐述,本文提出了采用LMS自适应滤波算法和基于归一化的LMS自适应滤波算法改善回声影响的方案,重点对LMS(Least Mean Square,最小均方算法)自适应滤波算法的工作原理、性能分析、LMS算法和归一化LMS算法的核心部分做了详细的阐述,并与经典的RLS、LMS Newton自适应滤波算法优缺点进行了比较。使用MATLAB仿真工具对本文提出的改进算法进行了仿真实验和性能分析,证实了基于归一化LMS算法在收敛速度和收敛性能上均得到改善,对回声消除技术在矿井中基于DSP平台的应用进行了模块化设计;最后,对全文进行总结和展望。
黎泽清[2](2010)在《多媒体电话机发送和接收系统的设计与研究》文中进行了进一步梳理本多媒体电话机主要为了弥补普通固定电话机交流形式单一的不足,对固定电话机终端进行改进,在普通固定电话机上增加液晶显示功能、图文传输功能和书写功能。利用数字信号处理器(DSP, Digital Signal Processor)进行信息处理、程序控制,并实现各功能之间的转换。采用频分复用技术,使图文信号和语音信号在电话线信道的不同信道的同时传输,在保证正常通话的同时,也能顺利发送和接收图文信号,利于双方交流。该新型通信设备有效地消除各地方言造成的误会;满足在远程教学过程中对图形、路线、设计的直观显示,利于双方对问题的有效探讨;为听力和语言能力有障碍的聋哑人之间的交流提供方便,极大地降低对使用者的限制;在某些特殊情况下,具有保密功能。发送系统端,在双方电话处于接通的状态下,首先,发话人在手写板上写字、画图,通过手写输入模块来实现图文信号的采集和输入,送入DSP进行处理并将处理后的数据发送到液晶显示模块进行显示。同时,DSP采用FSK方式对图文信号调制,使图文信号在电话线信道的高频段中进行传输。通过音频芯片TLV320AIC23B实现对调制解调后的图文信号进行DA转换,最后,将DA转换后的模拟图文信号与经过低通滤波后的语音信号一起送入到固定电话网中。接收系统端,电话机从固定电话网中接收到由发送端传送过来的语音和图文混合信号,之后分别送入低通和高通滤波电路,将混合信号分解成独立的语音和图文信号。1)语音信号送入电话机的受话器中转换为声音。2)图文信号由模数转换模块转换为数字信号送入DSP中,由DSP对图文信号进行解调,最后再将解调后的信号送入液晶显示模块进行显示。
肖圣兵[3](2002)在《利用DSP的电话网语音识别技术的应用研究》文中研究表明从电话网络语音的特点出发,研究和提出了一种在实环境下利用DSP实现的电话网语音识别方案,通过户外实际环境下的电话语音识别实验,这种方法的有效性得到了验证。
郭际[4](2019)在《基于M-CTD(移网隐私号)的平台有效性及安全性分析》文中研究表明随着现代社会的发展变化,个人隐私的重要性越来越得到广泛的重视,而因为个人隐私泄露所导致的不泄密事件也越发增多。如何在互联网信息化、大数据化的浪潮中保护好个人隐私同时能够让使用者更加有效和安全的使用互联网服务已经成为了制约互联网继续向深入发展的重要关键问题。移网隐私号(M-CTD)平台是在互联网和运营商通信网络之间构建的一个具有多种交互能力的云计算CaaS平台,通过所搭载的集成接口为用户提供快速便捷的全面互联网通讯服务。使用移动网号码作为虚拟中间号,实现双向显示虚拟号码,建立个人信息的保护屏障。其特点有:1)通过号码解析技术,屏蔽隐藏使用者号码信息,使得使用者在使用服务的同时,从最根本的信息数据的最底层保护个人隐私的不外泄。相较于一些已有的保护系统和机制来说有着根本性的革新,从而大大增加了机制的安全性,有效性。2)相对于已有的一些通信隐私保护机制,其在一些情况下,固网号码容易被标记获取,接通率较为低,操作运行较为繁琐,而在M-CTD平台运营的过程中,移网号码更加灵活,可信度更高,可以提较高的接通率。3)M-CTD平台还可以在语音业务中融合短信功能,使用者可以通过使用隐私号码进行移网隐私号之间的短信互发,在语音通信间实现保护隐私的基础上,实现了短信通信间的隐私保护。本文根据市场需求及用户需求,结合相关的M-CTD实践案例,采取文献研究法与案例研究法,通过分析和研究已有的海内外企业界和学术界关于互联网时代下用户隐私保护问题,结合通信运营商最新产品方向,分析基于M-CTD的平台有效性及安全性。首先,介绍选题的背景及意义。综合阐述了互联网发展下的网络隐私保护现状,网络隐私被侵犯的严重后果及现行相关法律法规。从根源上说明M-CTD平台出现的市场需求及用户需求,探讨了M-CTD平台的发展背景。其次,介绍M-CTD平台的总体构架和其所能实现的功能功用,通过介绍M-CTD平台的组网构架,信令流程(语音,文字)等所使用的技术,阐述其如何通过虚拟号码实现隐私保护和实现用户呼叫的全流程实现。然后,以钉钉办公平台为例介绍M-CTD产品的应用;基于安全可靠的需求,比较M-CTD平台的隐私号码绑定模式;以江苏联通所搭建的M-CTD平台为实例,介绍M-CTD平台的安全性特点及有效性保障。最后,阐述M-CTD平台现如今的发展趋势,方向和演进的侧重点,通过对未来技术及制度上的合理构想,探讨如何进一步发展M-CTD平台的功能,使之安全性,可靠性进一步提高。通过本文基于M-CTD的平台有效性及安全性分析,表明该产品在隐私保护领域起到了积极影响。在此研究基础上,为企业未来技术及制度上具体实施策略具有重要的借鉴意义。
冯瑶[5](2016)在《基于语音识别的远程控制系统的研究与实现》文中研究指明人机相互交流已经成为当前科技的发展趋势,让机器听懂人的语音指令并完成一系列控制已不再是天方夜谭。国内外对语音识别技术的研究正在迅速的发展,甚至一些科技公司也加入到对语音识别的研究领域中。而随着互联网和无线通信的普及和覆盖范围越来越广,语音识别技术可以通过网络远程控制智能机器。实际应用也已经遍布于工业生产、智能农业管理系统、家居的智能化等方面。正是在这种背景下,本文研究了结合远程控技术的基于嵌入式系统的孤立词语音识别技术。论文首先对孤立词语音识别系统的基本组成框架结构进行介绍,包括语音信号的预处理过程、端点检测算法、特征参数提取、模板的训练和识别这五个环节。其中在端点检测算法中,分析了单独采用时域或者频域参数时的效果并不理想,从而本文采用时频参数结合来确定语音信号的起始点和终止点;在特征参数提取中重点分析了MFCC特征参数;在最后孤立词的语音识别算法中,重点分析本文采用的动态时间规整算法,并针对传统算法计算量过大这一问题提出改进措施。在硬件方面中,本文对基于DSP芯片的语音识别手持端以及基于STC80C52的远程控制终端进行设计,并使用GSM模块实现通信,形成完整的远程语音识别控制端的硬件系统。在软件方面,通过对语音信号采集流程、语音信号预处理及端点检测算法流程和语音识别算法等各子程序的设计,给出流程。并通过AT指令对远程控制模块进行编程设计。最后论文通过对GSM模块发送指令的测试,系统端点检测效果的测试,以及在PC端和系统中识别率的测试这三个实验充分说明了该系统的有效性和可行性。
张勇[6](2014)在《一种二/四线转换话音检测技术的设计》文中认为针对模拟四线话音接入程控电话网的需求,通过话音检测技术实现二/四线的话音转换,提出一种采用DSP实现话音检测技术的解决方案。该方案通过DSP芯片将模拟两线话音通过话音检测、剪音等技术实现模拟两线通过话音检测模块输出四线话音和PTT信号,该技术在复杂环境下的话音检测成功率,保证了话音和PTT信令传输的可靠性。
李德鹏[7](2012)在《VoIP相关技术的研究》文中认为这篇文章主要介绍了VoIP的相关技术,重点介绍了G.729语音编码标准。VoIP语音网关是当前IT通信研究的重点,对于通信的发展有重要的现实意义。VoIP的主要思想是通过VoIP网关实现在电话网和Internet网上进行语音通信的技术,即实现电路交换的电话网和数据交换的Internet网的语音通话,使得电话网和Internet网在任何地方都可以相互联网进行通信。但是由于Internet网络固有的一些缺陷,在其上进行实时语音通信存在许多技术问题,如通信带宽、时延、误码率等问题。.同时,还有电路交换的语音通信和数据交换的语音通信的信令发起、转换、控制等,都是比较难解决的问题。由于VoIP网关涉及到许多技术问题,很难在短时间内进行全面的研究。在这篇文章中,简单介绍了VoIP网关相关的技术,重点介绍了G.729的语音编码技术。G.729编码标准是当前VoIP网关所用的主流编码标准,此编码标准对8kHz采样,16bit线性PCM量化的输入语音进行编码,是一种8kbit/s电话带宽的语音编码标准。频谱利用率是当前通信系统需要考虑的重要方面,而语音通信又是当前通信最重要的应用。所以在语音通信方面,用尽可能小的带宽,传输高质量的语音信号,而G.729标准正满足了低码率、高质量的语音通信的要求。但是,算法实现的运算量大,对硬件运算速度要求高。所以需要对G.729编码标准在不降低语音质量的情况下,尽可能的降低计算复杂度,以利于用相对经济的硬件来实现。通过对G.729标准的研究得出语音编码算法的运算量主要集中在码书搜索和LP参数的运算上,本文集中对G.729自适应码书搜索算法和固定码书搜索算法进行研究并做出了改进,在保证语音质量的前提下,降低了运算量。同时,通过Simulink建模,来仿真实际通信中不同的误码率对通信语音质量的影响。最后利用TMS320VC5402的DSP开发对G.729实现,在应用DSP对G.729实现中,要将C语言代码进行优化,以降低编解码的运算复杂度,使得DSP的运算复杂度和存储容量均有很大的降低。文中前两章对VoIP网关的发展现状和前景以及有关的技术进行了介绍;第3章介绍了G.729语音编码原理,以及G.729的6.4的扩展;第4章对G.729标准进行Simulink建模,并对不同的信道误码进行模拟;第5章简单地介绍了DSP硬件结构,G.729算法的改进和C语言代码的优化及DSP实现。
曹洁[8](2011)在《基于DSP的语音信号滤波技术研究》文中研究指明语音滤波技术是语音信号处理的一个重要研究领域,随着数字信号处理技术的高速发展,DSP芯片已经成为语音信号处理的主要工具,在单片DSP芯片上实时实现较复杂的语音编解码算法成为可能,同时可方便地实现算法更新,从而能够在不更换硬件的情况下实现功能的升级。语音信号滤波又是语音处理系统研究中的一个关键问题,滤波的效果会直接影响语音信号的质量,而DSP技术的不断提高,保证了滤波效果的实时性和准确性,如何将语音信号滤波技术移植到DSP上也就成为一个重要的问题。恰当的建立模型、合理地确定算法、选定参数、设计可行的系统都是本课题研究的主要内容。本文针对语音信号的特点,首先对传统的语音处理的方法进行了分析推导,以CCS软件为基础,用DSP特有的混合编程的方式实现了经典的FIR滤波器与IIR滤波器,然后用TI公司5000系列DSP-TMS320VC5509作为核心芯片,设计了一个语音采集及滤波系统,通过CCS平台和DSP编程,对基于汉明窗的滤波算法进行实验,在选取不同输入信号的情况下,对滤波效果进行比较,验证了本文研究方法的可行性。结果表明:利用本文所用的语音信号处理的算法,采集各种环境下不同的语音输入信号,取得了较好的降噪效果。
席丽娜[9](2011)在《基于DSP的网络电话网关的设计》文中指出已经研制了一种采用软交换技术的企业网络电话通信系统,该系统基于计算机网络组成的网络电话通信系统,节省了各种费用,充分利用了局域计算机网络的带宽资源。目前该网络电话通信系统已经能够实现企业内部用户的电话通信,但不能与公共电话网(PSTN)的电话用户进行电话通信,因此,需要研制一个网络电话网关,实现网络电话通信系统与公共电话网(PSTN)的电话通信。本文研制了一种采用软交换技术,基于局域计算机网络电话通信系统的网络电话网关。提出了基于DSP的网络电话网关的设计方案。采用DSP芯片TMS320C5402和CPLD芯片EPM240T100C5N设计了硬件电路,包括主控制器,环路中继,DTMF接收和转发,忙音检测,以太网接口,存储器等模块;通过优化MGCP协议,制定了WMGCP呼叫控制协议;利用CCS编程环境,采用C语言编写了网络电话网关的软件,包括主程序、WMGCP呼叫控制协议的呼叫控制子程序、以太网UDP/IP协议的通信子程序和底层硬件驱动子程序。制作了实验样机并进行了实验。该网络电话网关具有媒体流映射、呼叫处理与控制和接入核心网络的功能,实现了企业内部与公共电话网的电话通信。该网络电话网关具有采用技术先进、性能好、成本低等特点。不仅可以应用于企业,还可以在教育、科技、电业、银行和公安系统等方面推广应用,具有显着的经济效益和社会效益。
赵欢[10](2010)在《面向嵌入式计算平台的自动语音识别关键技术研究》文中研究说明在未来几十年,先进通信将迅速改变人们的生活和工作方式,随时、随地使用一定范围内的设备进行实时通信和实时数据处理将逐渐成为现实,基于嵌入式计算平台的自动语音识别(Automatic Speech Recognition, ASR)是关键技术之一。许多在实验室表现优异的ASR系统,一旦应用到复杂的实际噪声环境就马上变得不稳定;另一方面,鲁棒性高的识别系统往往依赖于高计算量,只适合运行于PC平台甚至高性能服务器。如何降低ASR系统的计算复杂度使之适合嵌入式平台,并提高其在复杂噪声环境下的鲁棒性,是嵌入式ASR研究的重点和难点。目前,嵌入式ASR应用系统多为分布式结构,即在目标设备上装载语音识别前端,将复杂的语音识别后端放置在服务器。本文着重研究基于嵌入式计算平台的自动语音识别前端关键技术。作为ASR的第一步,有效的语音端点检测可减少系统后续处理时间,排除无声段噪声干扰,提高语音识别准确率。本文提出了两种语音端点检测新方法。其一,将时域对数能量特征与频域谱熵特征相结合,提出基于对数能量谱熵的端点检测方法,由于其计算简单可应用于中低端嵌入式平台;其二,针对抗噪性能优良但计算稍复杂的非线性语音特征端点检测,提出基于样本熵的语音端点检测方法,有望应用于高端嵌入式平台。仿真实验表明,两种新方法在低信噪比环境下,比传统的能量法、谱熵法、能量谱熵法、对数能量法等都具有更好的鲁棒性,能更好地区分语音和噪声,检测准确率更高。语音增强是从含有噪声的语音信号中尽可能消除噪声,还原出纯净语音信号。完全消噪是不可能的,实际系统中的语音增强以抑制背景噪声、保护和提高感知语音质量为目的。基于短时谱估计的语音增强算法由于计算简单最适宜嵌入式平台,但有时会造成语音失真。本文分析比较了几种典型短时谱估计算法计算复杂度,针对其中乘加计算量最小的RL算法进行改进,引入人耳掩蔽效应,提出基于Bark域的RL改进算法,并进一步降低了计算量。实验表明,改进后的算法能显着抑制噪声,并有更好的语音质量,有效减少了语音失真。语音特征提取是ASR前端的最后一个环节也是最重要的环节,特征提取质量对识别结果起决定性作用。美尔频率倒谱系数(Mel-Frequency Cepstral Coefficient, MFCC)以其良好的性能成为ASR系统标准前端,本文针对标准MFCC提取过程进行了两点改进:一是调整了汉明窗系数,提高窗函数性能;二是将子带频谱质心(Subband Spectrum Centroid, SSC)加入MFCC过程。传统语音特征提取利用了语音幅度信息却忽略了频谱信息,由于各频带频谱峰值位置受背景噪声影响相对较小,具有更好的鲁棒性,而SSC非常接近频谱中的峰值位置,本文将SCC引入MFCC,提出基于美尔子带频谱质心(Mel Subband Spectrum Centroid, MSSC)的语音特征提取新方法。HTK仿真实验表明,新汉明窗及MSSC语音特征提取新方法与传统MFCC法比较,低信噪比环境下的识别率平均提高了17.13%。将上述语音端点检测算法、语音增强算法和语音特征提取算法集成为一个ASR前端实验系统。本文选择ADI公司的多媒体高性能ADSP-BF533作为嵌入式平台,将该前端系统进行优化并成功移植,验证了其在嵌入式平台上实现的可行性。最后,将上述部分研究成果用于移动学习平台原型系统设计,并进一步研究了教学资源知识表示技术,提出了一种本体概念相似度计算新方法;研究了AMR-WB编码器优化技术,提出了一种快速固定码本搜索方法。该原型系统在中山读书郎公司的儿童早教机、学生掌上电脑和数码读书机系列产品中得到成功应用,产生了巨大的经济效益。产品开发的实践证明,本文研究成果可广泛应用于嵌入式计算平台。
二、利用DSP的电话网语音识别技术的应用研究(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、利用DSP的电话网语音识别技术的应用研究(论文提纲范文)
(1)VOIP声学回声消除归一化算法研究(论文提纲范文)
摘要 |
ABSTRACT |
致谢 |
第1章 绪论 |
1.1 课题的目的和意义 |
1.2 网路电话国际、国内发展状况 |
1.2.1 国内发展状况 |
1.2.2 国际发展状况 |
1.3 本文研究内容 |
1.4 论文结构 |
第2章 IP 电话概述、VoIP 的基本原理和关键技术 |
2.1 IP 电话的演进及发展 |
2.1.1 IP 电话的演进及迅速发展的背景和原因 |
2.1.2 IP 电话的语音编码技术 |
2.1.3 目前IP 电话技术发展情况 |
2.2 IP 电话的工作原理及系统组成 |
2.2.1 PC-Phone 和Phone-Phone 原理图 |
2.2.2 IP 电话系统组成 |
2.3 IP 电话设备功能实现的软硬件设计方法 |
2.3.1 IP 电话的基本功能 |
2.3.2 IP 电话设备的硬件设计方法 |
2.3.3 IP 电话设备软件设计方法 |
2.4 VoIP 的基本概念、系统组成和语音识别 |
2.4.1 VoIP 的基本概念、基本原理 |
2.4.2 VoIP 模型的基本结构图 |
2.4.3 VoIP 系统基本组成 |
2.4.4 VoIP 语音识别 |
2.4.5 VoIP 的主要特点和关键技术 |
2.5 本章小结 |
第3章 自适应滤波算法与归一化LMS 算法仿真 |
3.1 RLS 算法 |
3.2 LMS Newton 算法 |
3.3 LMS 法和归一化LMS 算法 |
3.3.1 LMS 算法的工作原理 |
3.3.2 LMS 的性能分析 |
3.3.3 LMS 算法 |
3.3.4 改进的归一化 LMS 算法 |
3.4 仿真实验与分析 |
3.4.1 关于MATLAB 语言的简述 |
3.4.2 NLMS 算法的仿真实现和分析 |
3.5 本章小结 |
第4章 VoIP 回声消除技术在矿井中的应用设计 |
4.1 回声产生的原因与消除 |
4.1.1 回声产生的原因 |
4.1.2 回声消除原理 |
4.2 VoIP 回声消除技术在矿井中的硬件设计实现 |
4.2.1 VoIP 回声消除技术 |
4.2.2 基于DSP 平台的回声消除技术 |
4.2.3 基于DSP 的系统设计流程 |
4.3 基于DSP 平台的VoIP 回声消除在矿井应用中的设计 |
4.3.1 VoIP 矿井系统的功能模块设计 |
4.3.2 矿井通话终端的 DSP 硬件总体设计 |
4.3.3 矿井通话终端的软件总体设计 |
4.3.4 矿井系统软件的模块化设计 |
4.4 本章小结 |
第5章 总结和展望 |
5.1 总结 |
5.2 展望 |
参考文献 |
攻读硕士学位期间发表的论文 |
(2)多媒体电话机发送和接收系统的设计与研究(论文提纲范文)
摘要 |
Abstract |
1 绪论 |
1.1 本课题的目的和意义 |
1.2 固定电话网及固定电话的优势 |
1.2.1 固定电话是传送亲情的主要通信工具 |
1.2.2 固定电话是最环保的通信工具 |
1.2.3 固定电话技术的巨大潜力 |
1.2.4 我国拥有完善的固定电话网 |
1.3 多媒体固定电话机在国内外的发展现状 |
1.4 基于固定电话网的多媒体通信技术 |
1.5 课题的来源 |
1.6 论文内容安排 |
2 多媒体电话机的总体设计方案 |
2.1 多媒体电话机的框架图及工作原理 |
2.2 多媒体电话机所需软硬件的选择 |
2.2.1 Ti TMS320C6713简介 |
2.2.2 DSP在通信领域的应用 |
2.2.3 CCS编译环境及软件开发流程 |
2.2.4 液晶显示设备 |
2.2.5 手写输入设备 |
2.3 多媒体电话机的各功能模块 |
2.3.1 多媒体电话机的图文显示模块 |
2.3.2 多媒体电话机的图文输入模块 |
2.3.3 多媒体电话机的数据处理及调制解调模块 |
2.3.4 多媒体电话机的入网设计 |
3 多媒体电话机发送系统的设计 |
3.1 发送系统的框图及工作原理 |
3.2 手写输入信号的采集与处理 |
3.2.1 DSP UART接口与手写板的连接与电路设计 |
3.2.2 接口连接的编程实现 |
3.2.3 对手写信号的分析与处理 |
3.3 电话信道的频分复用和基于DSP的FSK调制方式 |
3.3.1 2FSK的调制原理 |
3.3.2 基于DSP的图文信号调制 |
3.4 图文信号的数模转换及接口电路设计 |
3.4.1 TLV320AIC23B与DSP的接口电路设计 |
3.4.2 TLV320AIC23与DSP连接的编程实现 |
4 多媒体电话机接收系统的设计 |
4.1 接收系统的框图及工作原理 |
4.2 液晶显示模块的设计 |
4.2.1 液晶显示模块的接口电路设计 |
4.2.2 DSP与液晶显示模块的编程实现 |
4.2.3 对手写输入数据的处理与液晶显示 |
4.3 基于DSP的FSK解调方式 |
4.3.1 FSK的解调原理 |
4.3.2 分数延迟FIR滤波器的设计 |
4.3.3 FSK解调的编程实现 |
5 多媒体电话机的入网设计 |
5.1 公共电话网络 |
5.2 电话机发送和接收的原理 |
5.2.1 受话电路 |
5.2.2 送话电路 |
5.2.3 侧音消除电路 |
5.3 DSP与公共电话网的连接 |
5.4 设计多媒体电话机的备用电源 |
6 结论 |
参考文献 |
攻读硕士学位期间发表的论文及所取得的研究成果 |
致谢 |
(4)基于M-CTD(移网隐私号)的平台有效性及安全性分析(论文提纲范文)
摘要 |
Abstract |
专用术语注释表 |
第一章 绪论 |
1.1 选题背景及意义 |
1.2 M-CTD的发展背景 |
1.3 论文的研究内容及结构安排 |
1.3.1 本文的研究方向 |
1.3.2 论文内容安排 |
1.3.3 全文工作的意义 |
第二章 M-CTD平台的工作架构 |
2.1 M-CTD平台总体构架 |
2.1.1 M-CTD平台所实现的功能及方法 |
2.1.2 M-CTD平台的大体结构 |
2.2 M-CTD平台通信网络组网架构 |
2.3 移动网局内语音呼叫流程 |
2.4 移动网局间文字消息呼叫流程 |
2.5 本章小结 |
第三章 M-CTD产品应用的安全性分析 |
3.1 通过虚拟号码实现隐私号码保护的技术方案及解决思路 |
3.2 信令全流程中的位置更新与鉴权 |
3.3 SIP在移网隐私号中的应用 |
3.3.1 SIP的总体运用 |
3.3.2 SIP实现的功能 |
3.3.3 运用SIP协议的应用优势 |
3.4 M-CTD平台相较于其他隐私保护呼叫机制的优势 |
3.4.1 IP电话 |
3.4.2 电话专号 |
3.4.3 通过软件实现号码变换、虚拟号码 |
3.5 M-CTD平台的安全优势 |
3.6 本章小结 |
第四章 M-CTD产品应用的有效性分析 |
4.1 M-CTD产品的应用 |
4.1.1 M-CTD产品的使用机制 |
4.1.2 以钉钉办公平台为例的应用过程 |
4.2 M-CTD平台的号码绑定模式 |
4.2.1 平台绑定模式 |
4.2.2 长期绑定模式 |
4.2.3 即时绑定模式 |
4.3 M-CTD各种绑定的应用特点 |
4.4 基于M-CTD平台的系统应用的有效性 |
4.5 本章小结 |
第五章 M-CTD(移网隐私号)平台的演进及未来发展方向 |
5.1 M-CTD平台的现有演进方向 |
5.1.1 现有状况下M-CTD平台的一些发展中的问题 |
5.1.2 如何继续提升M-CTD平台的可靠性,安全性 |
5.2 关于对未来M-CTD平台的发展的展望 |
5.2.1 结合AI智能功能发展 |
5.2.2 延伸大数据方向的发展 |
5.2.3 通过云计算实现发展 |
5.3 本章小结 |
第六章 总结与展望 |
参考文献 |
致谢 |
(5)基于语音识别的远程控制系统的研究与实现(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 课题研究背景及意义 |
1.2 国内外研究现状 |
1.2.1 语音识别技术的发展 |
1.2.2 远程控制技术的发展 |
1.3 论文的主要研究内容 |
第2章 语音识别算法 |
2.1 语音识别系统的基础结构 |
2.2 语音信号的预处理 |
2.3 基于能熵比的端点检测算法 |
2.3.1 短时能量 |
2.3.2 子带谱熵 |
2.3.3 端点检测算法 |
2.4 语音特征参数提取 |
2.5 DTW语音识别算法 |
2.5.1 动态规划原理 |
2.5.2 DTW的基本原理 |
2.5.3 DTW算法的改进 |
2.6 本章小结 |
第3章 系统硬件电路实现 |
3.1 系统硬件总体设计概述 |
3.2 DSP核心电路 |
3.3 音频采集模块 |
3.4 存储模块 |
3.4.1 FLASH模块 |
3.4.2 SDRAM模块 |
3.5 远程控制模块 |
3.5.1 GSM模块概况 |
3.5.2 远端单片机控制模块 |
3.6 系统其他模块 |
3.6.1 JTAG调试模块 |
3.6.2 系统时钟模块 |
3.6.3 系统的复位电路设计 |
3.7 本章小结 |
第4章 系统软件流程设计 |
4.1 软件总体模块设计 |
4.2 软件开发平台与配置 |
4.2.1 CCS4集中开发环境 |
4.2.2 基于CSL芯片库的使用 |
4.3 语音采集模块 |
4.3.1 语音模块寄存器设置 |
4.3.2 语音采集的实现 |
4.4 语音预处理与端点检测的实现 |
4.4.1 语音预处理 |
4.4.2 端点检测 |
4.5 语音识别算法的实现 |
4.5.1 MFCC特征参数提取 |
4.5.2 DTW距离的计算 |
4.6 GSM与远端控制模块 |
4.6.1 AT指令 |
4.6.2 GSM模块软件设计 |
4.7 本章小结 |
第5章 实验以及系统测试 |
5.1 GSM模块实验 |
5.2 端点检测实验 |
5.3 语音识别率实验 |
5.3.1 计算机端识别率实验 |
5.3.2 系统识别率实验 |
5.4 本章小结 |
结论 |
参考文献 |
攻读硕士学位期间所发表的学术论文 |
致谢 |
(7)VoIP相关技术的研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 VoIP概述 |
1.2 VoIP的关键因素 |
1.3 VoIP的优势 |
1.4 VoIP的发展前景 |
1.5 课题研究内容 |
1.6 论文组织结构 |
第2章 VOIP的相关技术 |
2.1 信令技术 |
2.2 语音编码技术 |
2.3 实时传输技术 |
2.4 服务质量技术 |
2.5 网络传输技术 |
第3章 G.729语音编解码算法原理 |
3.1 G.729语音编码原理 |
3.2 G.729语音解码原理 |
3.3 G.729语音编码结构 |
3.3.1 帧间线谱对量化预测 |
3.3.2 G.729自适应码书搜索算法 |
3.3.3 固定码书搜索 |
3.3.4 增益量化 |
3.3.4.1 增益预测 |
3.3.4.2 增益量化码本的搜索 |
3.4 6.4的G.729语音编码方案 |
3.4.1 对于扩展的6.4kbit/s的要求 |
3.4.2 6.4kbit/s编码器算法介绍 |
3.4.2.1 预处理 |
3.4.2.2 LP分析和量化 |
3.4.2.3 感觉加权滤波器 |
3.4.2.4 自适应码书 |
3.4.2.5 固定码书 |
3.4.2.6 增益量化 |
3.4.2.7 抗稀疏处理和后置处理 |
3.5 利用VC++6.0进行实现 |
第4章 G.729的SIMULINK建模 |
4.1. SIMULINK简介 |
4.2. G.729的SIMULINK建模 |
4.2.1 G.729的Simulink整体传输模型 |
4.2.2 G.729的编码模型 |
4.2.2.1 使用汉明-余弦窗进行加窗 |
4.2.2.2 进行帧分析 |
4.2.2.3 进行子帧分析(Subframe Analysis) |
4.2.3 解码子系统模型 |
4.2.4 信道子系统 |
4.2.5 模拟结果分析 |
4.2.5.1 8kbit/s的G.729解码输出分析 |
4.2.5.2 6.4 kbit/s的G.729解码输出分析 |
第5章 G.729的DSP实现 |
5.1 硬件配置 |
5.2 算法和软件的优化 |
5.2.1 算法的优化 |
5.2.1.1 自适应码书搜索算法的改进 |
5.2.1.2 固定码书的搜索的改进 |
5.2.2 软件的优化 |
5.3 结果分析 |
第6章 展望和结束语 |
6.1. 工作总结 |
6.2. 下一步要做的工作 |
致谢 |
参考文献 |
(8)基于DSP的语音信号滤波技术研究(论文提纲范文)
摘要 |
Abstract |
附图索引 |
附表索引 |
第1章 绪论 |
1.1 课题研究背景及研究意义 |
1.2 国内外语音处理的研究现状 |
1.3 语音处理面临的难点和发展趋势 |
1.4 DSP 技术的发展及应用 |
1.5 论文的主要工作 |
第2章 语音信号滤波算法分析研究 |
2.1 语音信号处理技术概论 |
2.2 常用的语音信号滤波算法分析 |
2.2.1 数字滤波器的基本概念 |
2.2.2 数字滤波器的分类 |
2.2.3 数字滤波器的技术要求 |
2.2.4 数字滤波器的设计概述 |
2.3 FIR 数字滤波器的设计 |
2.3.1 FIR 数字滤波器的原理及结构 |
2.3.2 FIR 滤波器的特性 |
2.3.3 FIR 滤波器的设计 |
2.4 经典滤波器的DSP实现 |
2.4.1 IIR滤波器算法的DSP实现 |
2.4.2 FIR滤波器算法的DSP实现 |
2.5 经典滤波器的比较 |
2.6 本章小结 |
第3章 语音信号滤波技术硬件设计与实现 |
3.1 数字信号处理和DSP 系统 |
3.1.1 实时数字信号处理技术的发展 |
3.1.2 数字信号处理器的特点 |
3.2 语音信号滤波技术硬件系统概述 |
3.3 主要芯片介绍 |
3.3.1 处理器芯片 |
3.3.2 音频芯片 |
3.3.3 其他芯片 |
3.4 语音信号滤波系统硬件设计 |
3.4.1 AIC23 与微处理器的接口设计 |
3.4.2 SDRAM 与微处理器的接口设计 |
3.4.3 Flash 与微处理器的接口设计 |
3.4.4 电源设计 |
3.5 本章小结 |
第4章 语音信号滤波技术的软件设计 |
4.1 概述 |
4.1.1 软件开发平台CCS 简介 |
4.1.2 编程语言的选择 |
4.2 TMS320VC5509 系列DSP 代码编写规则 |
4.2.1 TMS320VC5509 的指令流水线 |
4.2.2 编程规则 |
4.3 滤波算法的实现 |
4.4 本章小结 |
第5章 结果分析与系统调试 |
5.1 实验设计 |
5.2 实验结果分析 |
5.3 本章小结 |
结论与展望 |
参考文献 |
致谢 |
附录A 本论文软件程序 |
A.1 IIR 滤波器软件程序 |
A.2 FIR 滤波器软件程序 |
A.3 语音信号滤波软件程序 |
(9)基于DSP的网络电话网关的设计(论文提纲范文)
致谢 |
摘要 |
Abstract |
1 引言 |
1.1 电话通信的国内外发展状况 |
1.2 课题的研究目的与意义 |
1.3 本论文主要研究内容及结构安排 |
2 软交换技术 |
2.1 软交换技术简介 |
2.2 软交换的网络结构 |
2.3 软交换技术的特点 |
3 网络电话通信系统中网络电话网关的设计方案 |
3.1 网络电话通信系统的基本组成 |
3.2 网络电话网关的设计方案 |
3.3 网络电话网关的功能 |
4 基于DSP 的网络电话网关的硬件设计 |
4.1 基于DSP 的网络电话网关的硬件总体设计 |
4.2 主控制器模块 |
4.3 环路中继模块 |
4.4 DTMF 接收和转发模块 |
4.5 忙音检测模块 |
4.6 以太网接口模块 |
4.7 存储器模块 |
4.8 电源和JTAG 接口模块 |
4.9 CPLD 的逻辑编程 |
4.9.1 CPLD 集成开发环境 QuartusⅡ |
4.9.2 逻辑控制模块 |
4.10 本设计中的信令系统 |
4.10.1 用户话机发出的信令 |
4.10.2 交换机发出的信令 |
4.10.3 信令的传输过程 |
5 基于DSP 的网络电话网关的协议 |
5.1 UDP/IP 协议栈 |
5.1.1 ARP 协议 |
5.1.2 IP 协议 |
5.1.3 UDP 协议 |
5.1.4 RTP 协议 |
5.2 呼叫控制协议WMGCP |
5.2.1 MGCP 协议 |
5.2.2 WMGCP 协议 |
5.2.3 单呼的呼叫流程 |
5.2.4 全呼的呼叫过程 |
6 基于DSP 的网络电话网关的软件设计 |
6.1 DSP 集成开发环境 CCS |
6.2 基于DSP 的网络电话网关的软件设计思路 |
6.3 主程序的设计 |
6.4 底层硬件驱动程序的设计 |
6.5 UDP/IP 协议栈的设计 |
6.5.1 ARP 协议的设计 |
6.5.2 UDP 协议的设计 |
6.6 呼叫控制协议的设计 |
6.7 信令适配的设计 |
7 基于DSP 的网络电话网关的实验及测试 |
7.1 调试方案 |
7.1.1 硬件调试 |
7.1.2 软件调试 |
7.1.3 脱机运行调试 |
7.2 网络电话通信系统测试 |
结论 |
参考文献 |
作者简历 |
学位论文数据集 |
附录 |
(10)面向嵌入式计算平台的自动语音识别关键技术研究(论文提纲范文)
摘要 |
Abstract |
插图索引 |
附表索引 |
第1章 绪论 |
1.1 研究目的与意义 |
1.2 嵌入式自动语音识别概述 |
1.2.1 嵌入式语音识别系统 |
1.2.2 语音用户界面 |
1.2.3 现行研究存在的问题 |
1.3 研究内容与创新点 |
1.3.1 研究内容 |
1.3.2 创新点 |
1.4 论文组织结构 |
第2章 相关基础理论与研究综述 |
2.1 自动语音识别技术发展及研究综述 |
2.1.1 自动语音识别研究综述 |
2.1.2 自动语音识别技术发展现状 |
2.2 鲁棒语音识别研究综述 |
2.2.1 信号空间鲁棒语音识别技术 |
2.2.2 特征空间鲁棒语音识别技术 |
2.2.3 模型空间鲁棒语音识别技术 |
2.2.4 其他鲁棒语音识别技术 |
2.3 面向嵌入式系统的语音识别 |
2.3.1 嵌入式平台应用的约束条件 |
2.3.2 嵌入式语音识别研究应用现状 |
2.4 自动语音识别理论基础 |
2.4.1 语音信号生成的数学模型 |
2.4.2 统计模式识别方法 |
2.4.3 隐马尔科夫模型 |
2.5 语音信号短时分析技术 |
2.5.1 语音信号的时域分析 |
2.5.2 语音信号的频域分析 |
2.6 语音识别系统组成 |
2.6.1 语音识别系统分类 |
2.6.2 基于模式识别方法的语音识别系统 |
2.6.3 自动语音识别系统 |
2.7 小结 |
第3章 语音端点检测的两种新方法 |
3.1 语音端点检测过程 |
3.1.1 语音端点检测主要步骤 |
3.1.2 语音信号的预处理 |
3.1.3 语音端点检测中的门限 |
3.2 语音端点检测方法综述 |
3.2.1 时域端点检测 |
3.2.2 频域端点检测 |
3.2.3 非线性特征端点检测 |
3.2.4 各种特征参数相结合的端点检测 |
3.3 基于对数能量谱熵的语音端点检测方法 |
3.3.1 对数能量谱熵特征 |
3.3.2 门限估计与端点检测 |
3.3.3 仿真实验与分析 |
3.3.4 算法时间复杂度分析 |
3.4 基于样本熵的语音端点检测方法 |
3.4.1 样本熵用于语音端点检测的可行性 |
3.4.2 样本熵特征的计算 |
3.4.3 门限估计与端点检测 |
3.4.4 仿真实验与分析 |
3.4.5 算法时间复杂度分析 |
3.5 小结 |
第4章 基于Bark域的改进RL语音增强方法 |
4.1 语音增强方法综述 |
4.1.1 基于短时谱估计 |
4.1.2 基于语音生成模型 |
4.1.3 基于人耳听觉掩蔽效应 |
4.2 人耳听觉感知系统及其掩蔽效应 |
4.2.1 人的听觉系统 |
4.2.2 人耳的听觉特性 |
4.3 基于Bark域的噪声谱估计及掩蔽效应语音增强 |
4.3.1 谱减法语音增强及Bark域 |
4.3.2 基于Bark域的噪声谱估计 |
4.3.3 基于Bark域的谱减 |
4.3.4 改进的语音增强算法 |
4.4 改进的语音增强算法性能评估 |
4.4.1 仿真实验及分析 |
4.4.2 语音增强效果的评估 |
4.5 小结 |
第5章 基于子带频谱质心的改进MFCC语音特征提取 |
5.1 语音特征参数 |
5.1.1 LPC特征及其改进 |
5.1.2 MFCC特征及其改进 |
5.2 MFCC特征提取 |
5.2.1 Mel频率简介 |
5.2.2 MFCC标准提取过程 |
5.2.3 MFCC参数的选取 |
5.3 改进的MFCC特征提取 |
5.3.1 汉明窗系数的调整 |
5.3.2 子带频谱质心的研究 |
5.3.3 仿真实验与分析 |
5.4 小结 |
第6章 ASR前端系统在DSP上的优化与移植 |
6.1 Blackfin DSP平台介绍 |
6.1.1 ADSP-BF533的内核结构 |
6.1.2 串行外设 |
6.1.3 ADSP-BF533的DMA及中断 |
6.1.4 ADSP-BF533的锁相环和时钟控制 |
6.1.5 AD1836A音频编解码器 |
6.1.6 Blackfin DSP软件开发环境 |
6.2 基于ADSP-BF533的语音识别前端系统总体结构 |
6.2.1 系统硬件框架 |
6.2.2 系统软件结构 |
6.2.3 语音数据的采集和处理 |
6.3 语音识别前端处理算法的优化策略 |
6.3.1 任务的控制方式 |
6.3.2 基于Blackfin DSP的优化技术 |
6.4 语音识别前端处理算法的移植 |
6.4.1 链接Blackfin处理器 |
6.4.2 系统的资源管理 |
6.5 小结 |
第7章 移动学习平台应用系统的设计与实现 |
7.1 移动学习平台系统功能和总体结构 |
7.1.1 移动学习平台系统结构 |
7.1.2 移动学习平台实现的功能 |
7.2 移动学习平台关键技术 |
7.2.1 教学资源的知识表示 |
7.2.2 多样化的人机交互界面 |
7.2.3 移动学习终端 |
7.3 教学资源编/解码方案以及实时流媒体传输 |
7.3.1 视频编码方式 |
7.3.2 音频编码方式 |
7.4 读书郎移动学习平台系列产品 |
7.4.1 儿童早教机系列 |
7.4.2 学生掌上电脑系列 |
7.4.3 全学科数码读书机系列 |
7.5 小结 |
结论 |
参考文献 |
致谢 |
附录A 攻读学位期间发表的相关学术论文 |
附录B 攻读学位期间参与的科研工作 |
四、利用DSP的电话网语音识别技术的应用研究(论文参考文献)
- [1]VOIP声学回声消除归一化算法研究[D]. 蔡政策. 合肥工业大学, 2011(09)
- [2]多媒体电话机发送和接收系统的设计与研究[D]. 黎泽清. 中北大学, 2010(05)
- [3]利用DSP的电话网语音识别技术的应用研究[J]. 肖圣兵. 信号处理, 2002(06)
- [4]基于M-CTD(移网隐私号)的平台有效性及安全性分析[D]. 郭际. 南京邮电大学, 2019(02)
- [5]基于语音识别的远程控制系统的研究与实现[D]. 冯瑶. 哈尔滨理工大学, 2016(03)
- [6]一种二/四线转换话音检测技术的设计[J]. 张勇. 舰船电子工程, 2014(01)
- [7]VoIP相关技术的研究[D]. 李德鹏. 杭州电子科技大学, 2012(06)
- [8]基于DSP的语音信号滤波技术研究[D]. 曹洁. 兰州理工大学, 2011(10)
- [9]基于DSP的网络电话网关的设计[D]. 席丽娜. 辽宁工程技术大学, 2011(06)
- [10]面向嵌入式计算平台的自动语音识别关键技术研究[D]. 赵欢. 湖南大学, 2010(07)