基于线性预测编码的语音合成技术研究

基于线性预测编码的语音合成技术研究[20200406110657]
摘 要
伴随着电子科学技术和现代化科学快速的进步程度,除了自然语音的交流信息方法以外,人机对讲和智能机械等其他地方也开始运用语音。这些人造的声音同样有语法,词汇,句法结构和语义内容,等等。机上语音和听话人的研究,即语音合成。语音合成技术已经经历了参数合成和拼接合成的发展,然后逐渐把它们放在一起相互结合,促进这种技术发展的力量是人们不断增长的知识水平以及美好新生活对人们的吸引力。
在本课题中,我们通过研究语音合成的成长历程,总结了语音合成体系的组成部分和常用的语音合成技术,谈论了语音合成接下来的成长趋势。语音合成是对利用计算机等设备模拟人类的发声器官,进而生成人工语音的各类技术的统称,其基础和核心是人类发声器官的建模与仿真。波形拼接和参数合成是语音合成中常见方法。本课题关注的重点是以线性预测编码为基础的波形拼接技术。在该技术中,当前的语音样值被视为是之前样值的线性组合,换言之,用全极点模型模拟人类的发声器官。线性预测是第一个在实践中真正使用的技术,是能够用来估量语音基本参数的有不错成效的语音分析技术之一,在许许多多的语音处理技术中。线性预测技术是一种以全极点模型假设为基础以及最小均方预测误差标准下的波近似的技术。在理解线性预测的原理后,我们可以在Matlab平台上实现一个简单的基于LPC语音合成系统的线性预测编码技术(编码/解码),并对其性能进行评估和分析。
 *查看完整论文请 +Q: 3 5 1 9 1 6 0 7 2 
关键字:语音合成LPC技术合成技术
目 录
第一章 概述 1
1.1 课题背景 1
1.2 课题意义 1
1.3 国内外研究现状 2
第二章 语音合成 3
2.1 原理 3
2.2 合成技术 4
2.2.1 共振峰合成 4
2.2.2 发音器官参数合成 4
2.2.3 LPC 合成 5
2.2.4 PSOLA 技术 5
2.2.5 LMA 声道模型技术 5
第三章 LPC语音合成的仿真研究 7
3.1 LPC语音合成原理 7
3.2 LPC线性预测编码仿真过程 8
3.2.1 语音分帧 9
3.2.2 能量计算 9
3.2.3 自相关函数的计算 10
3.2.4 判断清浊音和基音周期 10
3.2.5 利用自相关函数计算LPC系数 10
第四章 LPC语音合成的仿真结果 12
4.1语音信号内容为:hello 12
4.2语音信号内容为:常熟 13
第五章 结论与展望 15
参考文献 16
致 谢 17
第一章 概述
语音合成是对利用计算机等设备模拟人类的发声器官,进而生成人工语音的各类技术的统称,其基础和核心是人类发声器官的建模与仿真。波形拼接和参数合成是语音合成中常见方法。本论文关注的重点是基于线性预测编码的波形拼接技术。在该技术中,当前的语音样值被视为是之前样值的线性组合,换言之,用全极点模型模拟人类的发声器官。
1.1课题背景
在迅速发展的当今信息社会之中,语言是人与人之间最自然、最高效的交流方式。由于电子技术快速的发展着,使得语音信号处理技术也发展越来越快速,语音信号处理系统的使用领域也在一步一步在扩展,能运用的领域也越来越多。伴随着现代化科学发展快速和电子科学技术的成熟,除了自然语言是人们之间的沟通信息的方式之外,人机的对讲和智能机器,以及其他方面也开始运用语语音。人工语言也有词汇、语法、句法结构和语义内容等等,也需要组织语句,使得人们能够听得懂以及获取信息。
在目前,语音合成的最伟大的进步是已经能够实时的将任何文本转换成连续的可以理解自然语言来输出。文本到语音转换,使数据和语音通讯终端中的水平达到一个高度,能够将获得网络信息,短消息服务,电子邮件等大部分的文本信息,还可以用语音来输出。语音合成技术研究的历史已达到二百多年,但随着电子科学技术的发展和数字化信号处理技术的发展而发展起来的才是真正拥有实现意义的现代语音合成技术,主要成效是使机械能够自然连续输出高清晰度,高程度的语音信息。在语音合成技术的成长历程中,主要使用参数合成这种方法的是在钻研的前期时段,其后出现波形拼接方法是因为电子科学技术的迅速发展。语音合成技术正随着信息社会的发展,而快速的发展着。
1.2课题意义
语音合成,也叫做文本到了语音(Text to Speech)的技术,可以用实时的语言将任意的文本信息标准流利的朗读,像人工转换机,相当于给机器装上了嘴巴,解决了让机器像人那样说话的问题。它涉及声学、语言学、计算机科学和其他学科,在我国信息处理领域中是领先的技术,主要解决的问题是如何将文本转换成语音信息来可以听到接收,也即让机器像人一样开口说话。我们所说的“让机械开口说话” 有着本质上的区别和以前的语音播放设备(系统)相比较。语音合成研究目的是使机器设备能够像人一样说话,让人们能够获得更多的信息,可以使人们更好的享受到机器的服务,让人类在机械领域有更进一步的发展,使科技的发展更进一步。语音合成的技术中最为中心的技术之一是线性预测分析,在急速成长的现代语音信号处理中能够成功的处理语音信号, 在语音合成、编码和识别等方面得到了普遍的使用,到现在也还是最有功效的语音分析技术之一。
1.3国内外研究现状
语音合成可以追溯到第十七世纪,法国开发了一个能机械化说话的设备。由于电子的语音合成器十九世纪出现后,语音合成得到了快速成长,语音合成的技术也跟着日益的成长起来。线性预测编码(LPC)分析是最有成效的语音分析技术之一,在语音合成技术中使用这种方法,能够非常准确的在语音合成中的模型参数进行估计。LPC合成技术的本身性质是一种时间波形编码技术,它的目标是为了减少信号在时域上传输时的速度。线性预测技术已经在语音编码和识别中应用,在之后的第二十世纪70年代。同时,依据线性预测参数使用各种方式来集成语音。在第二十世纪80年代开始,国外语音合成技术的发展十分迅速,各种语言的文本到语音转换系统已经成功开发了。尽管中国在汉语语音合成的研究中起步相对比较晚,但我们并没有感到气馁而是不停努力的在研究,我国的语音合成技术也在不断的发展,并且在不断的在追赶着国际上的发展水平,使得我国的语音合成技术得到了最大的进步,在二十世纪80年代初以后它的发展水平基本上同步了国际研究。虽然如此,但是我们并没有因此而松懈下来,还是在不停的奋斗着,使得我们的语音合成技术日益的向成熟化进本。在目前,语音合成最伟大的进步是已经能够实时的将任何文本转换成连续的可以理解的自然语言输出。因为大家的共同努力奋斗,也研究出许多的语音合成技术,使得语音合技术越来越多元化,也越来越先进。
第二章 语音合成
语音合成是对利用计算机等设备模拟人类的发声器官,进而生成人工语音的各类技术的统称,其基础和核心是人类发声器官的建模与仿真。同时,它也是一门先进的技术是跨学科的,涉及心理学、声学等等,目的就是让电脑合成语音。语音合成技术是使用计算机,按照规定的指令来产生语音的技术。语音合成在人机语音中占有非常重大的意义,是其重要的组成部分。
2.1原理
语音合成的主要目的就是让机器说话,将储存的信息转换成语音信息来输出,让人们能够得到更直接的信息。让机器像人一样发出语音,可以参照人类的讲话过程模型,假设在机器中先形成一个说话的内容,其一般用特征代码来表示信息的形成和存在;然后根据复杂的语言规则,用字符代码来把基本发音单元的信息转化成一个序列,并检查上下文的内容,决定的语言语气,口音,必要的停顿节奏特征等,比如语气和陈述,命令,疑问语气等,并给出了象征和相应的表示。这段代码序列相当于一个“代码”。发音要求从“代码”的角度开始产生一组随时间变化的序列,来产生声音通过控制语音合成器,就像大脑神经发出命令,然后用脉冲的方式去给发出声音的器官下达命令,使得舌头,嘴唇,声带,肺和其他部分的肌肉协调产生声音是相同的,因此它是一个完整语音合成的全部过程的流程。语音合成钻研的成长时间是非常的悠久了 ,从技术方法的方面现在发现的语音合成方法可分为波形合成、参数合成、和规则合成。事实上,高级神经在活动之前播放一种声音到脑,即第一个说话的意图,然后再产生一系列的意图形成的相关概念,然后将这概念以句子形式的用声音输出。
人类的言语在不同的层次上语言功能是有差别的,我们不妨把语音合成分成三个层次,如图2-1所示。它们按规则合成分别为:①转换文本为语音(Text-To-Speech);②概念转换为语音(Concept-To-Speech); ③意向转换为语音(Intention-To-Speech)。
这三个层次反映了人类大脑中形成不同流程的讨论内容,涉及人类大脑的高级神经活动。到目前为止,我们理解人类的语言现象仅仅停留在发声的渠道系统,大脑的高级神经活动也很小,这使得语音合成的研究,在很长一段时间内仅能以较低的阶段,即为从文本转换到语音,或者将书面语转换为口语。这意味着,目前,机器仅能达到的阅读水平,更高层次的研究,还需要计算机专家和生物学家的进一步努力钻研。

版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/dzxx/dzkxyjs/2359.html

好棒文