用TTS技術(shù)開發(fā)具有文本朗讀功能的應(yīng)用程序(轉(zhuǎn))之一(2008-05-15 20:21:33)轉(zhuǎn)載標(biāo)簽:聲音的合成ttsit 分類:相關(guān)學(xué)術(shù)
摘 要:TTS技術(shù)已經(jīng)越來越廣泛地應(yīng)用到現(xiàn)代計(jì)算機(jī)的各個(gè)領(lǐng)域,本文介紹了利用微軟的Microsoft Speech SDK 5.1提供的TTS(text-to-speech)技術(shù)開發(fā)具有語音朗讀功能的應(yīng)用程序。
關(guān)鍵字:語音合成;TTS;發(fā)聲引擎
中圖分類號(hào):TN912.33;TP311.52 文獻(xiàn)標(biāo)識(shí)碼:A
Create speech-enableed Apllications with TTS Technology
Abstract: The TTS technology is more and more popular in modern computer, this article introduces How to Create speech-enableed Apllications use the Microsoft Speech SDK 5.1
Key word: Speech Synthesis;TTS;speech Engine
1.TTS技術(shù)概述
上世紀(jì)90年代中期以來,隨著個(gè)人計(jì)算機(jī)的硬件和軟件功能越來越強(qiáng),和現(xiàn)代語音技術(shù)的發(fā)展,以前在科幻電影中才能看到的會(huì)說話的電腦已經(jīng)成為現(xiàn)實(shí)。而TTS技術(shù)正是電腦能夠說話的關(guān)鍵技術(shù)之一。
TTS是text-to-speech的縮寫,英文也稱Speech Synthesis即語音合成。語音合成就是一個(gè)將文本轉(zhuǎn)化為語音輸出的過程,這個(gè)過程的工作主要是將輸入的文本按字或詞分解為音素,并且對(duì)文本中的數(shù)字、貨幣單位、單詞變形以及標(biāo)點(diǎn)等要特殊處理的符號(hào)進(jìn)行分析,以及將音素生成數(shù)字音頻然后用揚(yáng)聲器播放出來或者存為聲音文件以后用多媒體軟件播放。
當(dāng)應(yīng)用程序需要發(fā)聲的時(shí)候就調(diào)用語音合成引擎(SPEECH SYNTHESIS ENGINE)進(jìn)行語言合成,將文本處理后通過揚(yáng)聲器用近似于人的聲音“讀”出來,通常還可以通過改變對(duì)語音引擎的設(shè)置改變“說話” 的速度,聲音頻率(低沉或者尖銳),聲音大小,還能模擬口形、唇形和舌位的變化對(duì)聲音的影響。面前計(jì)算機(jī)通過語音合成發(fā)出的聲音效果聽起來就象是錄音磁帶發(fā)出的聲音。
與一些用預(yù)先錄制的聲音文件實(shí)現(xiàn)發(fā)聲的應(yīng)用程序相比,TTS的發(fā)聲引擎只有幾兆大小,不需要大量的聲音文件支持,因此可以節(jié)省很大的儲(chǔ)存空間,并且可以朗讀預(yù)先未知的任何語句,F(xiàn)在已經(jīng)有許多應(yīng)用軟件應(yīng)用TTS技術(shù)實(shí)現(xiàn)語音功能,例如一些播音軟件可以用來讀小說或作校對(duì)工作,還可以朗讀電子郵件,一些電子詞典可以讀出單詞,還可以用于查詢中心自動(dòng)播放服務(wù)信息等。
2.關(guān)于Microsoft Speech SDK
|
|