Топ питань
Часова шкала
Чат
Перспективи

КОІ-8

З Вікіпедії, вільної енциклопедії

Remove ads

КОІ-8 (код обміну інформацією, 8 бітів; рос. КОИ-8) — восьмибітова ASCII-сумісна кодова таблиця, розроблена для кодування букв кириличних алфавітів.

Існує також семибітова версія кодування, не повністю сумісна з ASCII — КОІ-7. КОІ-7 і КОІ-8 описані в ГОСТ 19768-74 (зараз нечинний).

Ідея

Узагальнити
Перспектива

Розробники КОІ-8 помістили символи російського алфавіту у верхній частині кодової таблиці таким чином, що позиції кириличних символів відповідають їхнім фонетичним аналогам в англійському алфавіті, в нижній частині таблиці. Це означає, що якщо в тексті, закодованому КОІ-8, прибрати восьмий біт кожного символу, то вийде прочитний текст, хоча й записаний латинськими символами. Наприклад, слова «Русский Текст» перетворяться на «rUSSKIJ tEKST». Як наслідок, символи кирилиці в таблиці виявилися розташованими не в алфавітному порядку.

Існує декілька варіантів кодування КОІ-8 для різних кириличних алфавітів. Російський алфавіт описується в кодуванні KOI8-R, український — у KOI8-U. KOI8-R став фактично стандартом для російської кирилиці в юнікс-подібних операційних системах і електронній пошті.

Андрій Чернов створив документ RFC 1489 («Registration of а Cyrillic Character Set»), який, проте, не належить до категорії RFC-стандартів. Існує RFC 2319 на KOI8-U.

RFC-2319. Стандарт кодування української мови сформований у RFC. Створено ініціативною групою - Павло Гульчук, Юрко Демченко, Євген Шерстобітов, Борис Мостовий, Ігор Романенко, Олександр Єременко, Андрій Стесін.[1]

За набором символів KOI8-R відповідає одному з варіантів альтернативного кодування. Стандарт RFC 1489 також стверджує наявність графічних символів «рамок» (псевдографіки), проте ця вимога виконується досить рідко.

Нижня частина таблиці кодування (латиниця) повністю відповідає кодуванню ASCII.

Remove ads

Кодування KOI8-R (російське)

Більше інформації .0, .1 ...
Remove ads

Інші варіанти

Узагальнити
Перспектива

показані лише неоднакові рядки таблиць, оскільки решта збігається

Кодування KOI8-U (українське)

Більше інформації .0, .1 ...

Кодування KOI8-RU (російсько-українсько-білоруське)

Більше інформації .0, .1 ...

Кодування KOI8-C (кавказьке)

Більше інформації .0, .1 ...

Кодування KOI8-T (таджицьке)

Більше інформації .0, .1 ...

Кодування KOI8-O, KOI8-C (старослов'янська орфографія)

Більше інформації .0, .1 ...

Кодування ISO-IR-111, koi8-e

Більше інформації .0, .1 ...

Кодування KOI8-Unified, koi8-f

Більше інформації .0, .1 ...
Remove ads

Некириличні варіанти KOI-8

В деяких країнах РЕВ були створені модифікації КОІ-8 для національних варіантів латиниці. Базова ідея була та ж сама : при «зрізанні» восьмого біта текст мав лишатися більш-менш зрозумілим. Наприклад, в чеському варіанті КОІ-8 букви Čč повинні перетворюватися на cC, Žž — на zZ тощо. В наш час[коли?] ці кодування не використовуються.

Див. також

Примітки

Посилання

Loading content...
Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads