會(huì)員中心 |  會(huì)員注冊(cè)  |  兼職信息發(fā)布    瀏覽手機(jī)版!    精選9.9元!    人工翻譯    英語(yǔ)IT服務(wù) 貧困兒童資助 | 留言板 | 設(shè)為首頁(yè) | 加入收藏  繁體中文
當(dāng)前位置:首頁(yè) > 機(jī)翻技術(shù) > 識(shí)別技術(shù) > 正文

語(yǔ)音識(shí)別和自然語(yǔ)言理解

發(fā)布時(shí)間: 2023-09-11 09:24:25   作者:etogether.net   來(lái)源: 網(wǎng)絡(luò)   瀏覽次數(shù):
摘要: 語(yǔ)音系統(tǒng)目前很好地集成了二元語(yǔ)法模型、詞模型和音素模型,因?yàn)樗鼈兌伎梢杂猛粋€(gè)框架來(lái)表示,即隱馬爾可夫模型。


用二元詞語(yǔ)法對(duì)語(yǔ)音識(shí)別系統(tǒng)加以改進(jìn)可以顯著地提高系統(tǒng)的性能。這啟發(fā)我們,如果采用一個(gè)更加全面而詳盡的模型,會(huì)產(chǎn)生更好的結(jié)果。不過(guò),實(shí)際上,這是很難做到的??梢允褂萌~語(yǔ)法,但是這需要多得多的數(shù)據(jù)。直接集成一個(gè)概率上下文無(wú)關(guān)語(yǔ)法也會(huì)帶來(lái)困難。首先,語(yǔ)音系統(tǒng)目前很好地集成了二元語(yǔ)法模型、詞模型和音素模型,因?yàn)樗鼈兌伎梢杂猛粋€(gè)框架來(lái)表示,即隱馬爾可夫模型。引入上下文無(wú)關(guān)語(yǔ)法機(jī)制作為句法部件難于進(jìn)行有效的集成,并且會(huì)對(duì)識(shí)別的準(zhǔn)確率或者有效性造成負(fù)面的影響。其結(jié)果是,所有現(xiàn)有的口語(yǔ)理解系統(tǒng)都在語(yǔ)音識(shí)別和自然語(yǔ)言理解系統(tǒng)之間維持一個(gè)嚴(yán)格的分界,如圖C.1所示。


圖C.1.png

圖C.1語(yǔ)音理解系統(tǒng)的結(jié)構(gòu)


按照這種劃分,在設(shè)計(jì)接口的時(shí)候還是有很多種做法的。最簡(jiǎn)單的接口,也是最常用的,就是語(yǔ)音識(shí)別輸出所找到的單一的最佳單詞序列。然后,語(yǔ)言處理系統(tǒng)在這個(gè)基礎(chǔ)上進(jìn)行處理,并期望沒(méi)有嚴(yán)重的識(shí)別錯(cuò)誤。將這種做法更一般化的一種方法稱(chēng)為N-best方法,在N-best方法中,語(yǔ)音識(shí)別輸出它所找到的N個(gè)最佳序列。這允許句法分析器在第一個(gè)結(jié)果失敗時(shí)嘗試其他解釋。雖然很多系統(tǒng)都具有使用N-best方法的能力,不過(guò)實(shí)踐證明這只是使得準(zhǔn)確率略微有所提高,但比起由此導(dǎo)致的額外的處理開(kāi)銷(xiāo)來(lái)說(shuō),這樣做并不值得。其中的一個(gè)原因是,N個(gè)最佳的序列本質(zhì)上是相同的,只在一到兩個(gè)單詞上有區(qū)別。這樣,如果語(yǔ)音識(shí)別系統(tǒng)識(shí)別錯(cuò)了某一個(gè)特定的單詞,將很有可能在輸出的N個(gè)最佳選擇中都有同樣的錯(cuò)誤。


取代N-best的一種有趣的方法是輸出詞格。在這種方法中,語(yǔ)音識(shí)別系統(tǒng)輸出一個(gè)格子,這個(gè)格子給出了輸入中最可能的單詞。一個(gè)詞格給出了提供一種大量可能句子的壓縮表示形式,并為基于句法分析器和語(yǔ)義解釋的錯(cuò)誤恢復(fù)提供了一個(gè)表達(dá)能力足夠豐富的環(huán)境。注意,你可以將詞格看做chant句法分析器的初始線(xiàn)圖。在某個(gè)位置出現(xiàn)某個(gè)單詞有多種選擇這一事實(shí)對(duì)基本的句法分析算法沒(méi)有影響。


這種通用技術(shù)目前還沒(méi)有被充分研究,因?yàn)槟壳暗南到y(tǒng)大多都使用高度領(lǐng)域化的技術(shù)來(lái)優(yōu)化其短期性能。舉例來(lái)說(shuō),在航空旅行信息系統(tǒng)(ATIS,Air Travel Information System)領(lǐng)域中開(kāi)發(fā)了多個(gè)不同的口語(yǔ)理解系統(tǒng),這些系統(tǒng)基于航空時(shí)刻表來(lái)回答問(wèn)題。因?yàn)檫@個(gè)應(yīng)用領(lǐng)域非常集中而且狹窄,所以第11章描述的特定領(lǐng)域的解釋技術(shù)可以用于正確地解釋一個(gè)查詢(xún),即使其中的一部分被錯(cuò)誤地識(shí)別也沒(méi)有太大的影響。研究者發(fā)現(xiàn),在短期內(nèi)改進(jìn)特定領(lǐng)域解釋的啟發(fā)式方法比探索語(yǔ)音識(shí)別和自然語(yǔ)言處理系統(tǒng)之間更通用、更健壯的接口來(lái)得更有效。當(dāng)應(yīng)用變得更為復(fù)雜時(shí),這種現(xiàn)狀應(yīng)該會(huì)有所改變。


即使在給定受限領(lǐng)域的情況下,ATIS領(lǐng)域的系統(tǒng)性能也給人以深刻的影響。一般而言,一個(gè)典型的ATIS系統(tǒng)包括大約2000個(gè)單詞,獨(dú)立于說(shuō)話(huà)者,使用標(biāo)準(zhǔn)的不帶特殊信號(hào)處理硬件的標(biāo)準(zhǔn)工作站完成語(yǔ)音識(shí)別任務(wù)時(shí)幾乎沒(méi)有可察覺(jué)的延遲。系統(tǒng)使用一個(gè)包含數(shù)百個(gè)事先沒(méi)有見(jiàn)過(guò)的查詢(xún)語(yǔ)句的集合進(jìn)行測(cè)試。1993年,最好的語(yǔ)音識(shí)別系統(tǒng)達(dá)到了95%的單詞準(zhǔn)確率??傮w最好的系統(tǒng)對(duì)于88%的查詢(xún)語(yǔ)句可以產(chǎn)生合適的回答。



責(zé)任編輯:admin


微信公眾號(hào)

  • 上一篇:沒(méi)有了
  • 下一篇:語(yǔ)音識(shí)別中的問(wèn)題


  • 《譯聚網(wǎng)》倡導(dǎo)尊重與保護(hù)知識(shí)產(chǎn)權(quán)。如發(fā)現(xiàn)本站文章存在版權(quán)問(wèn)題,煩請(qǐng)30天內(nèi)提供版權(quán)疑問(wèn)、身份證明、版權(quán)證明、聯(lián)系方式等發(fā)郵件至info@qiqee.net,我們將及時(shí)溝通與處理。


我來(lái)說(shuō)兩句
評(píng)分: 1分 2分 3分 4分 5分
評(píng)論內(nèi)容:
驗(yàn)證碼:
【網(wǎng)友評(píng)論僅供其表達(dá)個(gè)人看法,并不表明本站同意其觀(guān)點(diǎn)或證實(shí)其描述?!?
評(píng)論列表
已有 0 條評(píng)論(查看更多評(píng)論)