From Wikipedia, the free encyclopedia
Rakstzīmju kodējums jeb rakstzīmju kopa (angļu: Character encoding jeb character set) ir sistēma, kas paredzēta rakstzīmju kodēšanai noteiktā secībā. Rakstzīmes var būt alfabēta burti, cipari, dažādi simboli. Rakstzīmju kopas visplašāk izmanto datu elektroniskā apstrādē, uzglabāšanā un pārsūtīšanā. Piemēram, Morzes kods, kurā latīņu alfabēta burtus kodē ar gariem un īsiem telegrāfa signāliem, vai ASCII, kurā burtus, ciparus, un citus simbolus kodē ar 7 bitu skaitļiem.
Datoru ēras sākumā radās vajadzība standartizēt teksta rakstzīmju un citu simbolu izmantošanu elektroniskajās sistēmās; ASV izveidoja ASCII (1963.) un EBCDIC (1964.). Drīz vien šīs kopas izrādījās ierobežotas, un tika izgudrotas dažādas metodes, kā tās paplašināt. Daudzo rakstību, tai skaitā ķīniešu, korejiešu un japāņu, atbalstam ir izstrādātas īpašas sistēmas rakstzīmju kodēšanai.
Tradicionāli termini "rakstzīmju kopa" un "rakstzīmju kodējums" bija sinonīmi, tā kā viens standarts noteica gan to, kādas rakstzīmes ir pieejamas, gan to, kā tās kodējamas koda vienību plūsmā (parasti viens simbols vienai koda vienībai).
Unikods un tā paralēlais standarts ISO/IEC 10646 (Universal Character Set) novirzījās no šīs idejas. Tie izvirzīja sekojošus jautājumus: kādas rakstzīmes ir pieejamas, to secības, kā šie secības numuri kodējami kā "koda vienības" un visbeidzot kā šīs vienības kodētas kā oktetu (baitu) plūsma. Šī sadalījuma pamatideja ir izveidot universālu rakstzīmju kopu, kuru varētu kodēt dažādos veidos.
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.