您好,  [请登录] [QQ登录]  [支付宝登录[免费注册]

商品分类

分享到: 百度搜藏 搜狐微博 新浪微博 腾讯微博 QQ收藏 人人网 Facebook Twitter

一种基于DSP的中文语音合成体系计划

发布日期:2011-05-13

    本文提出了基于TI公司的TMS320VC5402的中文语音合成体系方案。整个体系以TMS320VC5402为内核电路举行计划,采取以音节为单位的中性语调,共同基于基音同步重叠相加的PSOLA算法,并用码鼓励线性预测(CELP)编码要领对原始采样音库举行编码压缩。

    
小序 

    随着语音信号处理惩罚技能的不绝生长与成熟,语音合成正渐渐成为信息技能中人机接口的关键技能。DSP芯片,即数字信号处理惩罚器,是专门为快速实现种种信号处理惩罚算法而计划的、具有特别布局的微处理惩罚器,其处理惩罚速率比最快的CPU还快10~50倍。本文先容的便是一种基于DSP的中文语音合成体系的实现要领。 

 
   1 体系总体方案 

    语音合成的最大特点便是要从有限的存储单位中合成出无穷字汇的连续语句来[1]。为了做到这一点,本体系计划了由(1)前端预处理惩罚模块将输入文本文件转换成体系可以处理惩罚的标准格局;(2)韵律规矩库给出当前语言环境下各个音节的韵律特性参数;(3)语音合成器根据给定的韵律特性参数对原始语音库中相应语音单位的声学参数举行调解;(4)将颠末调解的各个语音单位拼接在一起,得到相应于输入文本的连续语音输出等4个根本流程构成。体系基源头根本理框图如图1所示。

    2 硬件体系计划 

    *基金项目:湖南省教诲厅(03C025) 

    该中文语音合成体系的目标是对输入的文本文件可以或许清楚地、天然地、能懂地以连续语音地情势输出。ATMEL公司的AT89S52单片机对键盘输入的文本文件举行表现,再送TMS320VC5402处理惩罚,末了将合成结果输出。硬件布局框图如图2所示。


 

    2.1 键盘电路和表现电路 

    AT89S52的键盘接口电路是采取停止方法的,有键按下时,就孕育产生停止恳求,进入停止处理惩罚,然后通过查问P1.0和P1.1的环境,举行相应的处理惩罚。用电阻和电容够成了消抖电路,以防备电路的误操纵。 

    AT89S52把从键盘输入的文本信息送给LCD表现,同时把数据写到外部存储器CY7C133,然后TMS320 VC5402读取CY7C133上的信息举行处理惩罚。LCD的指令格局如表1所示: 
    表1 LCD的指令格局

RS  R/W

DB7  DB6  DB5  DB4  DB3  DB2  DB1  DB0


此中RS, R/W共同决定选择哪一个寄存器,如表2所示: 

    表2 寄存器选择

RS

R/W

操纵

0

0

指令寄存器写入

0

1

忙标记和地点

1

0

数据寄存器写入

1

1

数据寄存器读出


    2.2 TMS320VC5402与AT89S52的通讯 

    AT89S52和TMS320VC5402各自独立事变,其信息和数据互换通过共享一片外部存储器来实现,它们之间信号联结通过硬连接和软件果断来实现[2]。 

    外部存储器采取的是CY7C133,它是高速的2K X 16bit的静态异步双端口RAM,其存储速率为25ns。它有两套独立的地点线、数据线和控制信号线,容许两个控制器件中的数据通过共同连接的存储器来举行通讯。该双端口RAM容许两个控制器同时读取任意存储单位(包括同时读同一单位),但不容许同时写大概一读一写同一地点单位。 

    对付TMS320VC5402,数据存储器CY7C133的映射地点为4000H~47FFH。 

    对付AT89S52,数据存储器CY7C133的映射地点为2000H~27FFH。 

  
  3 软件体系计划 

    汉语作为一种有调语言,其韵律特性非常巨大。为了从有限的存储单位中合成出无穷字汇的连续语句来,必须在肯定的韵律规矩下对语音库单位的韵律参数举行调解,以得到切合当前语流环境的音变单位[3]。 

    根据得到音变单位的要领差别,可将语音合成器分成两种范例:(1)波形拼接合成;(2)参数合成(又称源/滤波器合成)。本体系采取波形拼接合成的要领直接对波形的时域和频域波形举行调解以得到所必要的音变单位。 

    大略的波形拼接法很难举行音高和音长(时间长度)调解。因此,本体系采取中性语调音节直接拼接共同基音同步波形叠加(PSOLA)算法,并用码鼓励线性预测(CELP)编码要领对原始采样音库举行编码压缩的要领。根本流程图如图3所示。




    4 结束语 

    本体系利用SCM及时表现输入的文本文件,可以或许将合针言音和输入文本文件实现比拟输出,直观性强;具有清楚度、能懂度和天然度高;合成算法运算巨大度低,可以或许用只管即便小的音库来实现对容量有限的存储空间的占用程度的请求。 

    
参考文献: 

    [1] 戴逸民,梁晓雯,裴小划一.基于DSP的当代电子体系计划[M].北京:电子产业出版社.2002 
    [2] 易克初,田斌,付强.语音信号处理惩罚.北京:国防产业出版社,2000 
    [3] 黄海波,蒋伟荣,程登良.通用语音处理惩罚体系的DSP实现[J]微谋略机信息2006,5,173-175