KS X 1001
来自维基百科,自由的百科全书
来自维基百科,自由的百科全书
KS X 1001是韓國用於書寫的諺文和漢字的字元編碼規格。以前稱作KS C 5601,現在多稱作KS X 1001,有時也簡稱為KS編碼。
其與JIS X 0208的94×94字集類似,包含諺文2,350字、漢字4,888字、英文字母、數字和假名共,8226字。諺文是由字母組合成一個音節的,但在這種編碼中用一個字元表示一整個音節,難以包括所有可能的組成符號,存在許多無法表示的音節,受到許多批評。百事可樂的韓國法人因 KS X 1001 不含「펲」,在1992年改用 KS X 1001 中存在的諺文「펩」表示。[1]
漢字則是照讀音順序來組態的。韓語原則上一字一音,但也存在破音字,KS X 1001對這樣的漢字在不同的讀音位置重複編碼。這被稱為「預組合字元編碼」(Wansung,韓語:완성,羅馬化:wanseong,直譯:預組合[2])。
雖然也有不一樣的,使用頭音法則,即轉成最先遇到的那個讀音,但如「盧」和「李」如此常用的字也有別的讀音和重複編碼。最多的是有4個重複編碼的「樂」。這個方式的好處是、字的讀音利於機械的判定,但卻也被批評違反字元編碼的大原則。此外,這樣重複編碼的漢字在統一碼和通用字元集中因互換性的關係,中日韓統一表意文字只收錄一個、其它的則收錄於中日韓相容漢字。
KS X 1001在EUC的編碼稱作韓文EUC(EUC-KR)。實際上,KS X 1001 完全沒有被用於其它編碼(ISO-2022-KR完全沒有被使用),單獨的 KS C 5601 通常意指 EUC-KR 。
一些電腦系統將此標準改編成諸多版本。但他們並非完全一致,如將原標準中放在 0x5C 的反斜線改成韓圓(₩)。有些系統則使用非常規方法來擴充此標準。KS X 1001 可編碼成 EUC-KR、Windows-949(EUC-KR 的超集)、ISO-2022-KR 和「雙位元組合型符號」(Johab)。但後二個很少使用。
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.