繁簡轉換,或稱正簡轉換,指正體字與簡體字的互相轉換,實際使用時通常包括台灣、香港、澳門、中國大陸、新加坡、馬來西亞地區所使用的標準中文之中不同字、詞的相互轉換。中國大陸對漢字簡化並非全部採用「一對一」方式,有部分用字採用「一對多」[1]方式,準確轉換漢字相當困難。目前已經有相當多的專業人士正利用各種方法解決此難題。
「簡正轉換」可以認為是從簡體中文向繁體中文的轉換,又稱「簡正體轉換」、「簡正翻譯」等;相反方向的轉換則是「正簡轉換」、「正簡體轉換」、「正簡翻譯」。從「簡轉繁」較「繁轉簡」困難,一般情況指的是「簡正轉換」。不過,我們往往也可以將「簡正轉換」理解為簡正之間的相互轉換,這時「簡正轉換」、「簡正體轉換」、「簡正翻譯」和「正簡轉換」、「正簡體轉換」、「正簡翻譯」都表示同一種意思。
需求和難點
很多跨國公司和機構都需要將重要的外文文字同時翻譯為簡體中文和繁體中文,而許多重要中文文件往往一經寫出,就要求同時發布簡體中文版和繁體中文版。這些轉換需求中最常見的是多語軟體、多語網站和一些面向多語用戶的重要國際文件。同時生成、發布簡體和繁體文件最直接也最常見的方法就是先編寫簡體中文版或繁體中文版,然後再簡正轉換或正簡轉換,生成與之相對應的繁體版或簡體版。
簡體字和正體字在許多語言表達的細節有差異,如簡體中文的「服务器」,在繁體中文的專業寫法是「伺服器」,簡體中文的「圆珠笔」,繁體中文多用「原子筆」,簡體中文的「斯大林」在台灣稱為「史達林」,簡體中文的「朝鲜」〔此處特指平壤政權〕在繁體中文裡常被稱為「北韓」,簡體中文裡的「悉尼」在台灣稱為「雪梨」(澳大利亞城市),著名RPG Final Fantasy,在中國大陸一般譯為「最终幻想」,而在香港、台灣舊譯為「太空戰士」。
呼籲恢復部分正體字
有人曾致中華人民共和國政府的相關部門,希望能恢復部分(主要是多對一)或全部正體字,從而從根本上消除簡正漢字並存時引起的麻煩,但北京當局未採納。[2]
簡單轉換和專業轉換
電腦專業人員,通過電腦軟體對正簡字作對應處理,雖然在技術上逐漸完善,但最專業的轉換,往往仍需求人工參與。根據轉換專業程度上的差異,簡正轉換大致可分為簡單的「字對字」轉換、經部分修正的簡正轉換和高度專業的專業性簡正轉換。
就是簡單地將每個簡體字轉換為對應的正體字。網路上可以找到大量的免費軟體、網站和轉換代碼,他們做的一般都是字對字的簡單轉換,或在字對字轉換基礎上加上很少的修訂。
大部分所謂的正簡轉換都只能作「一對一」轉換,常見的有「发」對「發」,但「发」則無法轉換成「髮」。
只能用於非正式資料的資料級轉換,大多數情況下目標語用戶能看懂。但由於在地域上詞彙用語的差異,經常容易讓目標地區的讀者產生理解上的困難。轉換品質相當弱。如果一位簡體中文用戶看見下面的句子,即使大致句子結構能看懂,但在句子意思上則難以解讀。
例句:
- 他用數據機發出一個歸位字元。
- 碧咸在寮國見到了布希。
字對字的正簡轉換結果:
- 他用数据机发出一个归位字元。
- 碧咸在寮国见到了布希。
簡體中文中的正確說法:
- 他用调制解调器发出一个回车字符。
- 贝克汉姆在老挝见到了布什。
能正確判別「头发」應對應至「頭髮」而非「頭發」,「喷发」應對應至「噴發」而非「噴髮」。
典型例子是Google翻譯中以簡體中文和簡正中文為目標語的翻譯和Microsoft Word、Excel中的簡正轉換功能。其中Google翻譯中的修訂僅限於字級修訂,而Microsoft Word的轉換品質相對較好,修訂了很多地方,不過轉換結果仍可以找到大量未修訂,不符合目標語表達習慣的地方。
Google只在字級基礎修正,如簡體中文中「头发」和「发现/发生」中的「发」是一個字,但在繁體中這兩個發不一樣(「頭髮」、「發現/發生」),Google修訂了大多數這類情況,但Google並未在詞級修訂,如從簡體中文的「软件」、「服务器」譯入繁體中文時,Google只是譯為「軟件」、「服務器」,並未根據繁體表達習慣譯為「軟體」、「伺服器」。
而Word(以及Bing翻譯)在詞級上作了一些修正,可以讓目標語的用戶感覺親切一些,但如果細究起來,Word的轉換結果在很多地方與真正的目標語表達習慣仍有相當明顯的差距。
再看前面提到的句子,
- 他用數據機發出一個歸位字元。
- 碧咸在寮國見到了布殊。
用Word對上面的初始繁體中文句子做繁轉簡後,結果如下:
- 他用调制解调器发出一个归位字符。
- 碧咸在寮国见到了布殊。
而如用Word對上面的初始簡體中文句子做簡轉繁後,結果如下:
- 他用數據機發出一個回車字元。
- 貝克漢姆在老撾見到了布希。
由專業的母語或近母語語言專家直接校訂,或由經驗豐富的專業人士調配使用專業級轉換軟體,或採用人工加機器的某種合理組合,可以實現最高要求的簡正轉換品質。
應該說,大多數實際目標語讀者的心理期望值在第二級(帶一定修訂的簡正轉換)和第三級(專業級簡正轉換)之間。僅僅第二級的轉換品質也可以滿足部分要求不高的目標語讀者的快速閱讀要求了,但肯定也會讓相當數量的細心讀者感到不滿。而在第三級上,則可以有較大的發揮空間,第三級中的初級品質(如果確實達到的話)可以讓大多數目標語言讀者接受並無困難地理解;而中級,則可以讓這個數達到「絕大多數」;但再高的高級修正品質也有其重要意義,如果說第三級中的初中級品質可以讓原文不因轉換而跌價,那第三級中的高級品質則可以讓原文在轉換後賞心悅目、蓬蓽生輝,它帶來了額外的附加價值。這也是大多數國際頂級公司高度重視文件語言品質,並為其投入大量人力和資源的原因之一。
其他消除簡正歧義的建議
在北大中文論壇討論簡正轉換及使用的人相當多,主要分以下幾種:
錯誤範例
參考資料
參見
Wikiwand in your browser!
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.