位元組(英語:byte)是通常用在電腦、手機及智能手錶等裝置上的資訊計量單位,不分資料類型。[1][2] 。一個位元組代表八個位元。從歷史的觀點上,「位元組」表示用於編碼單個字元所需要的位元數量,因此它是許多電腦架構中最小的可定址主記憶體單元。歷史上位元組長度曾基於硬件為1-48 bit不等,最初通常使用6 bit或9 bit為一位元組。今日標準以8 bit作為一位元組。為了消除常見8 位定義中任意大小的位元組的歧義,八個位元在一些規範(例如工業標準、電腦網絡、電信技術等)中常被稱為八位組(octet)。Internet 協定(RFC 791 ) 將 8 位位元組稱為八位位元組。[3]
Quick Facts 位元組的次方單位, 十進制字首 (SI) ...
位元組的次方單位
|
|
二進制字首 (IEC 60027-2)
|
名字 |
符號 |
倍數
|
kibibyte |
KiB |
210
|
mebibyte |
MiB |
220
|
gibibyte |
GiB |
230
|
tebibyte |
TiB |
240
|
pebibyte |
PiB |
250
|
exbibyte |
EiB |
260
|
zebibyte |
ZiB |
270
|
yobibyte |
YiB |
280
|
|
|
Close
國際電工委員會(IEC) 和電氣與電子工程師協會(IEEE) 將位元組的單位符號指定為大寫字母 B。例如MB表示百萬位元組(megabyte);位元(bit)可縮寫成b,例如Mb表示兆位元( megabit),與位元組進行區分。 國際上,單位八位位元組(octet,符號 o)明確定義了八位的序列,消除了術語「位元組」的潛在歧義。
位元組的大小歷來取決於硬件,並且不存在強制規定大小的明確標準。曾經使用過的位元組的大小包含 1 到 48 位。六位字元代碼是早期編碼系統中常用的實現方式,使用六位和九位位元組的電腦在 20 世紀 60 年代很常見。這些系統通常具有 12、18、24、30、36、48 或 60 位的記憶體字,對應於 2、3、4、5、6、8 或 10 個六位位元組。在術語「位元組」變得普遍之前,指令流中的位分組通常被稱為syllable[a]或slab 。
ISO/IEC 2382-1:1993 中記錄的現代事實上的標準(8位元)是相對方便的2 的冪,因為 2 的 8 次方是 256,允許一個位元組使用 0 到 255的二進制編碼值。 國際標準IEC 80000-13定義了這一常見含義。許多型態的應用程式使用可用八位或更少位表示的資訊,並且處理器設計者通常針對這種用法進行最佳化。主要商業計算架構的普及有助於 8 位位元組的普遍接受。現代架構通常使用 32 位字或 64 位字,分別由 4 個或 8 個位元組構成。
位元組一詞是Werner Buchholz於1956年6月在IBM Stretch電腦的早期設計階段發明的,該電腦的定址為位和可變欄位長度(VFL)指令,指令中編碼了位元組大小。這是為了避免意外突變為位元而特意重寫的。
術語「syllable」用於包含指令或指令組成部分的位元組,而不是數據位元組。
Blaauw, Gerrit Anne; Brooks, Jr., Frederick Phillips; Buchholz, Werner, 4: Natural Data Units, Buchholz, Werner (編), Planning a Computer System – Project Stretch (PDF), McGraw-Hill Book Company, Inc. / The Maple Press Company, York, PA.: 39–40, 1962 [2017-04-03], LCCN 61-10466, (原始內容 (PDF)存檔於2017-04-03), […] Terms used here to describe the structure imposed by the machine design, in addition to bit, are listed below.
Byte denotes a group of bits used to encode a character, or the number of bits transmitted in parallel to and from input-output units. A term other than character is used here because a given character may be represented in different applications by more than one code, and different codes may use different numbers of bits (i.e., different byte sizes). In input-output transmission the grouping of bits may be completely arbitrary and have no relation to actual characters. (The term is coined from bite, but respelled to avoid accidental mutation to bit.)
A word consists of the number of data bits transmitted in parallel from or to memory in one memory cycle. Word size is thus defined as a structural property of the memory. (The term catena was coined for this purpose by the designers of the Bull fr computer.)
Block refers to the number of words transmitted to or from an input-output unit in response to a single input-output instruction. Block size is a structural property of an input-output unit; it may have been fixed by the design or left to be varied by the program. […]
- Tafel, Hans Jörg. 寫於RWTH, Aachen, Germany. Einführung in die digitale Datenverarbeitung [Introduction to digital information processing]. Munich, Germany: Carl Hanser Verlag. 1971: 300. ISBN 3-446-10569-7 (德語).
Byte = zusammengehörige Folge von i.a. neun Bits; davon sind acht Datenbits, das neunte ein Prüfbit
(NB. Defines a byte as a group of typically 9 bits; 8 data bits plus 1 parity bit.)
- Programming with the PDP-10 Instruction Set (PDF). PDP-10 System Reference Manual 1. Digital Equipment Corporation (DEC). August 1969 [2017-04-05]. (原始內容存檔 (PDF)於2017-04-05).
- Computer History Museum – Exhibits – Internet History – 1964: Internet History 1962 to 1992. Computer History Museum. 2017 [2015] [2017-04-03]. (原始內容存檔於2017-04-03).
- Jaffer, Aubrey. Metric-Interchange-Format. 2011 [2008] [2017-04-03]. (原始內容存檔於2017-04-03).
- Kozierok, Charles M. The TCP/IP Guide – Binary Information and Representation: Bits, Bytes, Nibbles, Octets and Characters – Byte versus Octet. 3.0. 2005-09-20 [2001] [2017-04-03]. (原始內容存檔於2017-04-03).