會員中心 |  會員注冊  |  兼職信息發(fā)布    瀏覽手機(jī)版!    精選9.9元!    人工翻譯    英語IT服務(wù) 貧困兒童資助 | 留言板 | 設(shè)為首頁 | 加入收藏  繁體中文
當(dāng)前位置:首頁 > 機(jī)翻技術(shù) > 識別技術(shù) > 正文

語音識別中的問題

發(fā)布時間: 2023-09-06 09:22:17   作者:etogether.net   來源: 網(wǎng)絡(luò)   瀏覽次數(shù):
摘要: 語音非常有效和方便,可以讓你的雙手自由地做其他工作,不過,直到最近,語音識別系統(tǒng)才做到足夠準(zhǔn)確和高速。


語音在人類交流模式中占支配地位。當(dāng)然,書面語言是很重要的,很多知識都是以書面語言的形式一代一代地傳下來的,但在日常的交流中,語音還是最主要的模式。很自然地可以假設(shè)語音也是人機(jī)交互的首選模式。語音非常有效和方便,可以讓你的雙手自由地做其他工作。不過,直到最近,語音識別系統(tǒng)才做到足夠準(zhǔn)確和高速,以支持有效的應(yīng)用。隨著新的識別技術(shù)的產(chǎn)生和更快速的計算機(jī)的出現(xiàn),這種轉(zhuǎn)變非常之快。


語音識別系統(tǒng)分為兩類,分別是孤立詞識別系統(tǒng)和連續(xù)語音識別系統(tǒng)。孤立詞識別系統(tǒng)一次只識別一個單詞。要使用這樣一個系統(tǒng),必須在單詞之間有一個停頓。連續(xù)語音識別系統(tǒng)可以識別我們平常說話那樣的語音,其中的單詞在一個連續(xù)流中一起說出。目前,市場上大部分系統(tǒng)都使用孤立詞識別技術(shù)。連續(xù)語音識別系統(tǒng)處于積極的開發(fā)之中,不過,已經(jīng)很接近實(shí)際的應(yīng)用。其他區(qū)分各種不同系統(tǒng)的主要因素是詞匯量和能夠處理的說話者的范圍。一些低端系統(tǒng)可以識別單個用戶的30個左右的單詞,而高端系統(tǒng)能夠識別多個說話者的20000個單詞。當(dāng)比較不同系統(tǒng)的識別率的時候,很重要的一點(diǎn)是要記住,要在大詞匯量、多說話者的連續(xù)語音識別中達(dá)到很高的準(zhǔn)確率是非常困難的。


雖然在口語和書面語言的處理中都可以使用一些相同的基本技術(shù),如句法分析、語義解釋和上下文解釋,但還是存在一些顯著的區(qū)別,會對這兩種系統(tǒng)的設(shè)計發(fā)生影響。舉例來說,對于口語輸入,系統(tǒng)必須處理不確定性。在書面語言中,系統(tǒng)準(zhǔn)確地知道要被處理的單詞。而在口語中,用戶說的是什么只是一個猜測。而且,口語在結(jié)構(gòu)上和書面語很不相同。實(shí)際上,有時一份完全能夠理解的語音的記錄在閱讀時卻令人無法理解。口語的表現(xiàn)更增量化,每次一個短語,包含了書面語中所沒有的豐富的語調(diào)信息??谡Z中還包含很多更正,說話者用來糾正或者修改他剛才說的話。更進(jìn)一步,口語對話有豐富的表示認(rèn)可或者確認(rèn)的交互,以維持一次對話,而這些在書面形式中都不會出現(xiàn)。


口語理解系統(tǒng)的基本結(jié)構(gòu)如圖C.1所示,其中整個的自然語言系統(tǒng)都壓縮到了一個框中。說話者發(fā)出的聲音首選通過一個模擬/數(shù)字轉(zhuǎn)換器轉(zhuǎn)換成數(shù)字形式。這種信號通過處理抽取出各種特征,如在不同頻率上的聲音強(qiáng)度和隨著時間流逝聲音強(qiáng)度發(fā)生的變化。這些特征用

做語音識別系統(tǒng)的輸入,語音識別系統(tǒng)一般都采用隱馬爾可夫模型(HMM,Hidden Markov Model)技術(shù)來確定最有可能產(chǎn)生這種語音的詞語序列。然后,語音識別器輸出這種最可能的詞語序列作為自然語言理解系統(tǒng)的輸入。當(dāng)自然語言系統(tǒng)需要產(chǎn)生一個語音的表示時,它將句子傳遞給一個將單詞翻譯成音素序列并決定語調(diào)輪廓的模塊,然后將這些信息傳遞給一個語音合成系統(tǒng),語音合成系統(tǒng)產(chǎn)生口語輸出。


語音理解系統(tǒng)的結(jié)構(gòu).png

圖C.1 語音理解系統(tǒng)的結(jié)構(gòu)



責(zé)任編輯:admin


微信公眾號

  • 上一篇:語音識別和自然語言理解
  • 下一篇:示例:分布式SVM的Pegasos算法


  • 《譯聚網(wǎng)》倡導(dǎo)尊重與保護(hù)知識產(chǎn)權(quán)。如發(fā)現(xiàn)本站文章存在版權(quán)問題,煩請30天內(nèi)提供版權(quán)疑問、身份證明、版權(quán)證明、聯(lián)系方式等發(fā)郵件至info@qiqee.net,我們將及時溝通與處理。


我來說兩句
評分: 1分 2分 3分 4分 5分
評論內(nèi)容:
驗(yàn)證碼:
【網(wǎng)友評論僅供其表達(dá)個人看法,并不表明本站同意其觀點(diǎn)或證實(shí)其描述?!?
評論列表
已有 0 條評論(查看更多評論)