英文的介系詞片語所引起的歧義是英漢機器翻譯系統翻譯品質不容易提高的主要原之 一。歧義的存在使得翻譯系統很難確定使用者所輸入的英文句子,真正要表達的意思 ,因此翻譯系統就不容易翻譯出意義相切合的中文句子。引起歧義的原因很多,本篇 論文將針對介系詞片語定位問題做一個深入的探討。 關於這個問題,以往在文獻上 有不少人提出解法,但是這些解法有些正確率太低, 有些則不容易由計算機來執行。在本篇論文中,我們提出了一個融合語意與機率的語 意機率模式,來處理介系詞片語定位問題。在做法上,我們從語意的觀點,把動詞、 名詞和介系詞加以分類,然後利用已經剖析好並且標上語意分類的語料進行統計分析 ,以求出各種不同的機率值。利用這些機率值,我們可以計算各個歧義的語意分數, 最後以所得分數的高低,做為解義的依據。 由測試結果顯示,我們的語意機率模式,用來處理計算機相關書籍中的句子時,能夠 達到90%的正確率。和以往別人所提出的做法比較,我們的做法除了能夠達到很高 的正確率之外,因為語意分數的引入,使我們不必再依賴人工事前定好的規則,做為 解義的依據,也因此可以免法維護和修改規則資料庫中的規則時,所必須考慮的複雜 問題。 在本篇論文中,我們將簡述以往和英文介系詞片語定位相關的研究,並詳述我們機率 語意模式中,機率公式的推導、語意分數的計算、語料資料庫的建立以及測試的程序 和結果分析。
|