機器翻譯
计算语言学的子领域 / 維基百科,自由的 encyclopedia
機器翻譯(英語:Machine Translation,經常簡寫為MT,簡稱機譯或機翻)屬於計算語言學的範疇,其研究藉由電腦程式將文字或演說從一種自然語言翻譯成另一種自然語言。簡單來說,機器翻譯是透過將一個自然語言的字辭取代成另一個自然語言的字辭。藉由使用語料庫的技術,可達成更加複雜的自動翻譯,包含可更佳的處理不同的文法結構、辭彙辨識、慣用語的對應等。
目前的機器翻譯軟件通常可允許針對特定領域或是專業領域(例如天氣預報)來加以客製化,目的在於將辭彙的取代縮小於該特定領域的專有名詞上,以藉此改進翻譯的結果。這樣的技術適合針對一些使用較正規或是較格式化陳述方式的領域。例如政府機關公文或是法律相關檔案,這類型的文句通常比一般的文句更加正式與格式化,其機器翻譯的結果通常比日常對話等非正式場合所使用語言的翻譯結果更加符合語法。
目前的翻譯機器,有時可以得到可以理解的翻譯結果,但是想要得到較有意義的翻譯結果,往往需要在輸入陳述式時適當地編輯,以利電腦程式分析。但是,機器翻譯的結果好壞,往往取決於譯入及譯出語之間的詞彙、文法結構、語系甚至文化上的差異,例如英語與荷蘭語同為印歐語系日耳曼語族,這兩種語言間的機器翻譯結果通常比漢語與英語間機器翻譯的結果好。因此,要改善機器翻譯的結果,人為的介入仍顯相當重要。
一般而言,大眾使用機器翻譯的目的只是為了獲知原文句子或段落的要旨,而不是精確的翻譯。總的來說,機器翻譯的效果並沒有達到可以取代人工翻譯的程度,所以無法成為正式的翻譯。
不過現在已有越來越多的公司嘗試以機器翻譯的技術來提供其公司網站多語系支援的服務。例如微軟公司試將其MSDN技術資源庫以機器翻譯來自動翻譯成多國語言,如上文所說,知識庫作為專業領域,其文法較為格式化,翻譯結果亦更加符合自然語言。