- 簽證留學(xué) |
- 筆譯 |
- 口譯
- 求職 |
- 日/韓語(yǔ) |
- 德語(yǔ)
經(jīng)常會(huì)出現(xiàn)兩個(gè)不同的單詞,其拼寫(xiě)形式相同而發(fā)音不同(它們稱(chēng)為同形詞[homograph])。例如,動(dòng)詞wind(“You need to wind this up more neatly”)的發(fā)音為[wa?nd],而名詞wind(“blow, blow,thou winter wind”)的發(fā)音為[wind]。這個(gè)問(wèn)題在TTS的應(yīng)用中是非常關(guān)鍵的(因?yàn)樵谝欢ǖ纳舷挛闹?,系統(tǒng)必須判斷究竟應(yīng)該讀這兩個(gè)不同的發(fā)音中的哪一個(gè)),不過(guò),在當(dāng)前的語(yǔ)音識(shí)別系統(tǒng)中,由于某些原因一般會(huì)忽略同形詞的問(wèn)題。書(shū)面印刷的發(fā)音詞典對(duì)于不同的詞類(lèi)都要給出不同的發(fā)音,CELEX在這方面做得很好,因?yàn)镃ELEX的發(fā)音詞典是為ASR設(shè)計(jì)的。在
Pronlex和CMU的發(fā)音詞典中,對(duì)于wind給出了兩種不同的發(fā)音,但沒(méi)有說(shuō)明什么詞類(lèi)用什么樣的發(fā)音。
發(fā)音詞典中通常沒(méi)有收錄很多專(zhuān)有名詞。在很多實(shí)際應(yīng)用中這是一個(gè)很?chē)?yán)重的問(wèn)題。Liberman and Church(1992)曾經(jīng)報(bào)告過(guò),在3300萬(wàn)詞的AP新聞?wù)Z料庫(kù)中,有21%的詞是專(zhuān)有名詞。接著,Liberman和Church公布了一個(gè)專(zhuān)有名詞的詞表,包含1987年從Donnelly市場(chǎng)組織收集的150萬(wàn)個(gè)專(zhuān)有名詞(覆蓋了美國(guó)的7200萬(wàn)個(gè)家庭)。但是,在CELEX(它是根據(jù)傳統(tǒng)詞典編纂的)發(fā)音詞典的52477個(gè)原形詞中,只有1000個(gè)專(zhuān)有名詞。與之對(duì)比的是Pronlex, Pronlex包含兩萬(wàn)個(gè)專(zhuān)有名詞,這只是150萬(wàn)個(gè)詞中的一小部分。只有很少的詞典給出Dr. 這樣的詞條的發(fā)音,Liberman and Church (1992) 指出,Dr. 的發(fā)音可以為doctor或drive,2/3的發(fā)音可以為two thirds,F(xiàn)ebruary third或 two slash three。
現(xiàn)有的發(fā)音詞典還沒(méi)有很好的模型來(lái)處理虛詞(and,l,a和of等)的發(fā)音。這是因?yàn)檫@些虛詞的發(fā)音變化的語(yǔ)音上下文環(huán)境很復(fù)雜。一般在發(fā)音詞典中只包含某些最基本的形式(例如the的發(fā)音為[ei]),再使用其他算法根據(jù)上下文推出它的發(fā)音變體。
TTS和ASR發(fā)音詞典的一個(gè)最重要的區(qū)別在于,TTS的發(fā)音詞典不需要表示方言的變體;例如,在非常精確的ASR的發(fā)音詞典中,需要表示either和tomato的不同發(fā)音,而在TTS的發(fā)音詞典中,只要選擇不同發(fā)音中的一個(gè)發(fā)音就可以了。
責(zé)任編輯:admin