星期日, 10月 02, 2005

中國機器翻譯技術新突破

在剛剛結束的「國際口語翻譯研究聯盟(C-STAR Ⅲ)」組織的國際機器翻譯核心技術評測中,中國科學院自動化所「網絡內容管理與信息服務」團隊提交的中—英翻譯系統取得了BLEU得分0.528,NIST得分10.25的最好成績。

接近人工翻譯水準

C-STAR是國際上最早從事口語翻譯的國際性組織,這次中─英翻譯評測吸引了包括美國IBM公司、日本ATR、德國亞琛大學、意大利ITC、日本NTT等十二個著名研究機構參加。

據介紹,由中文到英文人工翻譯句子的BLEU得分一般在0.5~0.6,而機械翻譯能取得0.528分,說明該所的翻譯技術在評測應用場景下的翻譯結果已經接近人工翻譯的水平。

長期以來,科技資料的翻譯是科研機構、大學、情報部門以及大型企業的重要工作之一,隨著國際交往的增多,資料翻譯也顯得越來越重要。特別是對於一些大型的引進項目,其外文資料往往數以噸計,這些資料若僅靠人工翻譯,難度可想而知,並且不適應規模化生產,因而,依靠機器翻譯就顯得非常必要了。機器翻譯的發展史表明,伴隨著信息技術的發展以及全球網絡的一體化趨勢,機器翻譯技術得以不斷提高,翻譯軟件的輔助翻譯作用愈發明顯。

據了解,目前,機器翻譯軟件有上百種,根據這些軟件的翻譯特點,大致可以分為三大類﹕詞典翻譯類、漢化翻譯類和專業翻譯類。

機器翻譯領域佳作

詞典類翻譯軟件堪稱是多快好省的電子詞典,它可以迅速查詢英文單詞或詞組的詞義,並提供單詞的發音,為用戶了解單詞或詞組含義提供了極大的便利。漢化翻譯軟件的「智能漢化集成環境」,則為不會英語或英語水平不高的人提供了「語言障礙的全面解決方案」,包括內碼轉換、動態漢化和電子詞典等,很好地滿足了用戶漢化英文軟件、英文網頁,實現對屏幕英文信息的了解和文章的初步翻譯等,對信息獲取、了解文章大意有相當實際的作用。而專業翻譯系統,則專門面向專業或行業用戶。

根據國際上有關專家的分析,機器翻譯要想達到類似人工翻譯一樣的流暢程度,至少還要經歷十五年時間的持續研究。也就是說,在人類還無法明瞭「人腦是如何進行語言的模糊識別和判斷」的情況下,機器翻譯要想達到百分之一百的準確率是不可能的。即使如此,中國科學院自動化所的這套新研製的機械中─英翻譯系統,以接近於人工翻譯的最佳水準,還是為目前的機器翻譯領域奉獻了一篇佳作。

沒有留言: