會(huì)員中心 |  會(huì)員注冊(cè)  |  兼職信息發(fā)布    瀏覽手機(jī)版!    精選9.9元!    人工翻譯    英語(yǔ)IT服務(wù) 貧困兒童資助 | 留言板 | 設(shè)為首頁(yè) | 加入收藏  繁體中文
當(dāng)前位置:首頁(yè) > 機(jī)翻技術(shù) > 機(jī)器翻譯 > 正文

“人的剖析”概念及分析

發(fā)布時(shí)間: 2022-08-02 09:24:24   作者:etogether.net   來(lái)源: 網(wǎng)絡(luò)   瀏覽次數(shù):


包括MacDonald(1993)和Jurafsky(1996)在內(nèi)的一些文獻(xiàn)中指出,無(wú)論語(yǔ)言知識(shí)的使用是否具有時(shí)間進(jìn)程的差異,所有這些約束從根本上講都是概率性的。例如,Jurafsky(1996)的貝葉斯句法處理模型顯然是概率性的,Narayanan and Jurafsky(1998)使用概率來(lái)解釋上面的例句(12.29)至例句(12.31)以及類似的花園幽徑句中的難點(diǎn),也是概率性的。在他們的模型中,人的語(yǔ)言處理取一個(gè)歧義的輸入句子,計(jì)算出若干個(gè)不同的并行解釋。對(duì)于每個(gè)這樣的解釋指派一個(gè)概率,使用貝葉斯信念網(wǎng)絡(luò)(belief network),把PCFG概率、句法概率、主題概率和次范疇化概率以及其他上下文概率結(jié)合起來(lái)。例如,當(dāng)人在處理例句(12.29)時(shí),使用圖12.8中的信念網(wǎng)絡(luò),在看了前面的少數(shù)幾個(gè)單詞(The horse raced)之后,貝葉斯模型給例句(12.29a)和例句(12.29b)中的樹(shù)指派主要?jiǎng)釉~(Main Verb,簡(jiǎn)稱MV)解釋以及簡(jiǎn)化關(guān)系從句(Reduced-Relative,簡(jiǎn)稱RR)解釋的概率。這樣要把多個(gè)概率事實(shí)的資源結(jié)合起來(lái),例如動(dòng)詞raced是及物動(dòng)詞的概率(即raced帶直接賓語(yǔ)),horse是奔跑事件(racing event)的主題Theme的概率,名詞短語(yǔ)包含一個(gè)簡(jiǎn)化關(guān)系從句的句法概率。由于race更傾向于作為及物動(dòng)詞(帶一個(gè)直接賓語(yǔ))而不傾向于作為不及物動(dòng)詞,又由于簡(jiǎn)化關(guān)系從句本身的概率很低,如例句(12.29a)和例句(12.29b)所示,模型預(yù)言raced為主要?jiǎng)釉~MV解釋的概率是為簡(jiǎn)化關(guān)系從句RR解釋的概率的300倍。


圖1.png

圖1


圖1把PCFG和次范疇化概率、主題概率以及其他詞匯概率結(jié)合起來(lái)的信念網(wǎng)絡(luò),表示對(duì)于輸入的樣本句子究竟為主要?jiǎng)釉~(MV)解釋還是為簡(jiǎn)化關(guān)系從句(RR)解釋的支持程度


這個(gè)模型進(jìn)一步假定人們不能在同一時(shí)間內(nèi)保持很多的解釋。這或者是由于人們的記憶有限,或者是由于他們強(qiáng)烈地希望選擇一個(gè)簡(jiǎn)單的解釋,這樣就把那些級(jí)別低的解釋修剪掉了。Jurafsky(1996)和Narayanan and Jurafsky(1998)假定,如果某一個(gè)概率比最高的概率解釋低5倍,那么這樣的解釋就要被修剪掉。其結(jié)果使得人們有時(shí)會(huì)把那些正確的解釋修剪掉,而保持了那些得分很高但實(shí)際上不正確的解釋。正是因?yàn)檫@個(gè)原因,在例句(12.29)中,當(dāng)人剖析前一段時(shí),概率低(但“正確”)的簡(jiǎn)化關(guān)系從句RR解釋就被修剪掉了。


這個(gè)模型也可以解釋為什么一些表面上看起來(lái)相似的句子不會(huì)造成花園幽徑句。例如,在例句(12.34)中(Pritchett,1988;Gibson,1991),由于動(dòng)詞found是一個(gè)及物動(dòng)詞,所以found的簡(jiǎn)化關(guān)系從句的解釋的概率大大高于race的簡(jiǎn)化關(guān)系從句的概率。


The bird found in the room died.             (12.34)


圖2說(shuō)明了The horse raced和The horse found在MV/RR概率比值上的差別。

圖2.png



圖2 raced的后概率比值MV/RR處于閾值之上,因此解釋RR被修剪。found和carried的MV/RR都處于歧義消解區(qū)域內(nèi)(Narayanan and Jurafsky,1998)


使用同樣的概率區(qū)分方法,這個(gè)模型也可以解釋例句(12.30)中的花園幽徑效應(yīng);例如,P(N→houses)大于P(V-→houses),等等。Narayanan和Jurafsky的模型還是很初步的,這個(gè)模型主要根據(jù)相對(duì)簡(jiǎn)單的獨(dú)立性假設(shè)和很粗糙的概率模型;當(dāng)前研究的關(guān)鍵焦點(diǎn)是確切地理解當(dāng)人處理句子時(shí)究竟存儲(chǔ)了什么概率?這些概率是怎樣動(dòng)態(tài)結(jié)合起來(lái)的?



責(zé)任編輯:admin


微信公眾號(hào)

[上一頁(yè)][1] [2] [3] 【歡迎大家踴躍評(píng)論】
我來(lái)說(shuō)兩句
評(píng)分: 1分 2分 3分 4分 5分
評(píng)論內(nèi)容:
驗(yàn)證碼:
【網(wǎng)友評(píng)論僅供其表達(dá)個(gè)人看法,并不表明本站同意其觀點(diǎn)或證實(shí)其描述?!?
評(píng)論列表
已有 0 條評(píng)論(查看更多評(píng)論)