會(huì)員中心 |  會(huì)員注冊(cè)  |  兼職信息發(fā)布    瀏覽手機(jī)版!    精選9.9元!    人工翻譯    英語(yǔ)IT服務(wù) 貧困兒童資助 | 留言板 | 設(shè)為首頁(yè) | 加入收藏  繁體中文
當(dāng)前位置:首頁(yè) > 機(jī)翻技術(shù) > 機(jī)器翻譯 > 正文

PCFG的概率CYK剖析

發(fā)布時(shí)間: 2022-07-30 09:52:23   作者:etogether.net   來(lái)源: 網(wǎng)絡(luò)   瀏覽次數(shù):


正如其他動(dòng)態(tài)規(guī)劃算法那樣(最小編輯距離算法、向前算法、Viterbi算法和Earley算法),CYK算法采用歸納法來(lái)填充概率數(shù)組。為了便于描寫,我們用Wij來(lái)表示從單詞i到單詞j的單詞符號(hào)串。根據(jù) Aho and Ullman(1972),我們有:


* 基底  考慮長(zhǎng)度為1的輸入符號(hào)串(也就是一個(gè)單詞Wi)。在Chomsky范式中,給定的非終極符號(hào)A展開(kāi)為一個(gè)單詞Wi的概率必定只來(lái)自規(guī)則A→Wi,因?yàn)楫?dāng)且僅當(dāng)A→Wi是一個(gè)產(chǎn)生式時(shí),有式1.png)。

* 遞歸 對(duì)于長(zhǎng)度大于1(length>1)的單詞符號(hào)串,當(dāng)且僅當(dāng)至少存在一個(gè)規(guī)則A→BC以及某個(gè)k,1≤k<j時(shí),式2.png,使得B推導(dǎo)出Wij的開(kāi)頭k個(gè)符號(hào)串,C推導(dǎo)出Wij的后面j-k個(gè)符號(hào)串。因?yàn)檫@些符號(hào)串都比原來(lái)的符號(hào)串Wij短,它們的概率已經(jīng)被存儲(chǔ)在矩陣π中,我們把這兩個(gè)片斷的概率相乘,計(jì)算出Wij的概率。當(dāng)然,這時(shí)Wij也可能會(huì)出現(xiàn)多個(gè)剖析,所以要選擇在所有可能的剖析中概率最大的剖析(也就是在所有可能的k值和所有可能的規(guī)則中進(jìn)行選擇)。


圖1給出了這個(gè)概率CYK算法的偽代碼,也取自Collins(1999)和Aho and Ullman(1972)。


圖1.png


圖1概率CYK算法。對(duì)于給定的具有Chomsky范式規(guī)則num_rule的PCFG語(yǔ)法,該算法用于找出由單詞num_words組成的符號(hào)串的最大概率剖析。B是反向指針的數(shù)組,用于恢復(fù)最佳的剖析(Collins,1999;Aho and Ullman,1972)


責(zé)任編輯:admin


微信公眾號(hào)

[上一頁(yè)][1] [2] 【歡迎大家踴躍評(píng)論】
  • 上一篇:關(guān)于PCFG的問(wèn)題
  • 下一篇:概率上下文無(wú)關(guān)語(yǔ)法


  • 《譯聚網(wǎng)》倡導(dǎo)尊重與保護(hù)知識(shí)產(chǎn)權(quán)。如發(fā)現(xiàn)本站文章存在版權(quán)問(wèn)題,煩請(qǐng)30天內(nèi)提供版權(quán)疑問(wèn)、身份證明、版權(quán)證明、聯(lián)系方式等發(fā)郵件至info@qiqee.net,我們將及時(shí)溝通與處理。


我來(lái)說(shuō)兩句
評(píng)分: 1分 2分 3分 4分 5分
評(píng)論內(nèi)容:
驗(yàn)證碼:
【網(wǎng)友評(píng)論僅供其表達(dá)個(gè)人看法,并不表明本站同意其觀點(diǎn)或證實(shí)其描述?!?
評(píng)論列表
已有 0 條評(píng)論(查看更多評(píng)論)