會員中心 |  會員注冊  |  兼職信息發(fā)布    瀏覽手機版!    超值滿減    人工翻譯    英語IT服務 貧困兒童資助 | 留言板 | 設為首頁 | 加入收藏  繁體中文
當前位置:首頁 > 翻譯新聞 > 產業(yè)新聞 > 正文

使用WordNet詞匯分類來消除詞歧義

發(fā)布時間: 2017-03-28 12:06:48   作者:etogether.net   來源: 本站原創(chuàng)   瀏覽次數:
摘要: 一種用于消除給定句子使用的詞語歧義的方法,其中該詞被分類為不同的WordNet詞匯類別。其是通過使用超過6000萬字的巨大語料庫...
 
詞義消歧(WSD)通過給定的上下文來確定單詞的正確意義。這是許多自然語言處理(NLP)任務中的重要中間步驟,特別對于信息提取,機器翻譯等領域。一種用于消除給定句子使用的詞語歧義的方法,其中該詞被分類為不同的WordNet詞匯類別。其是通過使用超過6000萬字的巨大語料庫來產生的概率模型,假設每個語句都有一個意義的概念。這是一種基于知識的方法。該論文展示了詞匯界使用WordNet的一種新方法,這是現有的解決WSD問題的知識庫。
 
“這項工作恢復了以前提出的方法,并將其應用于今天大規(guī)模網絡生成的數據。它提供了新的見解,并開啟了許多新的可能性,對于當前的數據爆發(fā)具有可處理性。這項工作回顧了以知識為基礎的方法,過去由于知識獲取瓶頸而被暫停了?!狈律溲芯恐鞸amhith. K說到。
 
 
“這個項目表明數據可以在解決人工智能問題上產生的問題。IIT Bhubaneswar 電氣科學學院 Arun Tilak.S說。該方法根據給定的句子將一個單詞分類為45個WordNet詞匯類別之一。這是基于圍繞目標詞來完成的。字典中的每個單詞都附有與每個類別對應的權重??梢酝ㄟ^使用自我訓練模型的反饋機制來改進模型。
 
將來,新開發(fā)的“密集字詞表示”(Dense Word Representation)模型可用于開發(fā)基于神經網絡的分類器,用于將該詞分類為許多WordNet類別中的一個,以句子的密集表示為輸入。
Affine和IIT- Bhubaneswar自2015年10月起在開展合作,以促進學術和研究的互動,以促進和開發(fā)數據科學,分析和大數據領域的新突破性技術。
 
"Don't Let Ambiguity Cost You" - Word Sense Disambiguation Using WordNet Lexical Categories
 
 
Word Sense Disambiguation (WSD) is the task of identifying the correct sense of a word in the given context. It is an important intermediate step in many Natural Language Processing (NLP) tasks especially in Information Extraction, Machine Translation and many others. A methodology for disambiguating words given a sentence usage is proposed where the word is classified into one of the different WordNet Lexical Categories. A probabilistic model was generated by using huge corpus of more than 60 million words, assuming the concept of one sense per discourse. This is a knowledge based method. The paper shows the lexical community a fresh way to use WordNet- the pre-existing knowledge base for solving WSD problems.
 
原文:http://www.prweb.com/releases/2017/03/prweb14178308.htm
 
 
微信公眾號

我來說兩句
評論列表
已有 0 條評論(查看更多評論)