Топ питань
Часова шкала
Чат
Перспективи
КОІ-8
З Вікіпедії, вільної енциклопедії
Remove ads
КОІ-8 (код обміну інформацією, 8 бітів; рос. КОИ-8) — восьмибітова ASCII-сумісна кодова таблиця, розроблена для кодування букв кириличних алфавітів.
Існує також семибітова версія кодування, не повністю сумісна з ASCII — КОІ-7. КОІ-7 і КОІ-8 описані в ГОСТ 19768-74 (зараз нечинний).
Ідея
Узагальнити
Перспектива
Розробники КОІ-8 помістили символи російського алфавіту у верхній частині кодової таблиці таким чином, що позиції кириличних символів відповідають їхнім фонетичним аналогам в англійському алфавіті, в нижній частині таблиці. Це означає, що якщо в тексті, закодованому КОІ-8, прибрати восьмий біт кожного символу, то вийде прочитний текст, хоча й записаний латинськими символами. Наприклад, слова «Русский Текст» перетворяться на «rUSSKIJ tEKST». Як наслідок, символи кирилиці в таблиці виявилися розташованими не в алфавітному порядку.
Існує декілька варіантів кодування КОІ-8 для різних кириличних алфавітів. Російський алфавіт описується в кодуванні KOI8-R, український — у KOI8-U. KOI8-R став фактично стандартом для російської кирилиці в юнікс-подібних операційних системах і електронній пошті.
Андрій Чернов створив документ RFC 1489 («Registration of а Cyrillic Character Set»), який, проте, не належить до категорії RFC-стандартів. Існує RFC 2319 на KOI8-U.
RFC-2319. Стандарт кодування української мови сформований у RFC. Створено ініціативною групою - Павло Гульчук, Юрко Демченко, Євген Шерстобітов, Борис Мостовий, Ігор Романенко, Олександр Єременко, Андрій Стесін.[1]
За набором символів KOI8-R відповідає одному з варіантів альтернативного кодування. Стандарт RFC 1489 також стверджує наявність графічних символів «рамок» (псевдографіки), проте ця вимога виконується досить рідко.
Нижня частина таблиці кодування (латиниця) повністю відповідає кодуванню ASCII.
Remove ads
Кодування KOI8-R (російське)
Remove ads
Інші варіанти
Узагальнити
Перспектива
показані лише неоднакові рядки таблиць, оскільки решта збігається
Кодування KOI8-U (українське)
Кодування KOI8-RU (російсько-українсько-білоруське)
Кодування KOI8-C (кавказьке)
Кодування KOI8-T (таджицьке)
Кодування KOI8-O, KOI8-C (старослов'янська орфографія)
Кодування ISO-IR-111, koi8-e
Кодування KOI8-Unified, koi8-f
Remove ads
Некириличні варіанти KOI-8
В деяких країнах РЕВ були створені модифікації КОІ-8 для національних варіантів латиниці. Базова ідея була та ж сама : при «зрізанні» восьмого біта текст мав лишатися більш-менш зрозумілим. Наприклад, в чеському варіанті КОІ-8 букви Čč повинні перетворюватися на cC, Žž — на zZ тощо. В наш час[коли?] ці кодування не використовуються.
Див. також
Примітки
Посилання
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads