Топ питань
Часова шкала
Чат
Перспективи

ASCII

З Вікіпедії, вільної енциклопедії

ASCII
Remove ads

ASCII (МФА: [ˈæski], акронім від назви Американський стандартний код для інформаційного обміну, англ. American Standard Code for Information Interchange) в обчислювальній техніці — система кодів, у якій числа від 0 до 127 включно поставлені у відповідність літерам, цифрам і символам пунктуації. Наприклад, 45 відповідає знаку переносу, а 65 — літері «А» великій. Перші 32 коди використовуються для керівних функцій, на зразок введення і стирання попереднього символу, звукового сигналу. Власне, ASCII — це семибітний код, а восьмий біт часто використовується для забезпечення відповідності чи додаткових символів. Такий 8-бітний варіант коду називають розширеним ASCII.

Thumb
95 друкованих символів ASCII з кодами від 32 до 126 (десяткові).

Система широко використовується для зберігання тексту і передачі інформації між комп'ютерами.

Remove ads

Символи розширеного ASCII діапазону друку

Узагальнити
Перспектива
Thumb
Більше інформації Бінарне, Дес. ...

Варто звернути увагу що великі і маленькі літери англійської абетки відрізняються лише одним третім бітом: літера "A" представлена у вигляді 0100 0001, а літера "a" у вигляді 0110 0001. Щоб змінити літеру "A" на літеру "a" треба лише змінити третій біт з 0 на 1. Це можна легко зробити провівши операцію побітового OR цієї літери із числом 0010 0000 (32). Зворотню операцію перетворення маленької літери в велику можна провести за допомогою операції побітового AND з числом 1101 1111 (223). Також можна легко перетворити символ цифри у число взявши чотири останні біти, наприклад символ "9" представлений у вигляді 0011 1001. Якщо взяти останні чотири біти, то вийде 1001, що дорівнює 9 у десятковій системі. Це можна зробити взявши залишок від ділення символу на 1 0000 (16).

Remove ads

Інші назви

Починаючи з липня 1992 реєстри RFC[1] та Internet Assigned Numbers Authority таблиць кодування[2] визнають такі еквівалентні назви ASCII незалежно від реєстру для використання в Інтернеті:

  • ANSI_X3.4-1968 (канонічна назва)
  • ISO-IR-006[3]
  • ANSI_X3.4-1986
  • ISO_646.irv:1991
  • ASCII (варіанти ASCII-7 та ASCII-8)
  • ISO646-US
  • US-ASCII (рекомендована назва MIME[2])
  • us
  • IBM367
  • cp367
  • csASCII

З цього переліку, IANA рекомендує використання «US-ASCII» для позначення ASCII в Інтернеті. Це позначення можна часто зустріти в необов'язковому параметрі «charset» (кодування) в заголовку Content-Type (тип вмісту) деяких MIME-повідомлень, у еквівалентних «meta» елементах HTML документів, та в частині визначення кодування прологу деяких XML документів.

Remove ads

Варіанти

Юнікод

Докладніше: Юнікод

Для забезпечення зворотної сумісності, символи з набору 128 ASCII та 256 ISO-8859-1 (Latin 1) мають такі ж коди Unicode/UCS як і в попередніх стандартах. Таким чином, ASCII можна розглядати як 7-бітну схему кодування дуже малої підмножини Unicode/UCS, і навпаки, UTF-8 сумісний з ASCII для кодів менше 128, із чого випливає, що правильно закодований ASCII файл є водночас і правильним файлом в кодуванні UTF-8.

Примітки

Див. також

Посилання

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads