字节(英语:byte)是通常用在电脑手机智慧手表等装置上的资讯计量单位,不分数据类型。[1][2] 。一个字节代表八个位元。从历史的观点上,“字节”表示用于编码单个字符所需要的位元数量,因此它是许多电脑架构中最小的可寻址内存单元。历史上字节长度曾基于硬件为1-48 bit不等,最初通常使用6 bit或9 bit为一字节。今日标准以8 bit作为一字节。为了消除常见8 位定义中任意大小的字节的歧义,八个位元在一些规范(例如工业标准、电脑网络电信技术等)中常被称为八位组(octet)。Internet 协议RFC 791 ) 将 8 位字节称为八位字节。[3]

事实速览 字节的次方单位, 十进制前缀 (SI) ...
字节的次方单位
十进制前缀
(SI)
名字 符号 倍数
千字节 kB 103
兆字节 MB 106
吉字节 GB 109
太字节 TB 1012
拍字节 PB 1015
艾字节 EB 1018
泽字节 ZB 1021
尧字节 YB 1024
容字节 RB 1027
昆字节 QB 1030
二进制前缀
(IEC 60027-2)
名字 符号 倍数
kibibyte KiB 210
mebibyte MiB 220
gibibyte GiB 230
tebibyte TiB 240
pebibyte PiB 250
exbibyte EiB 260
zebibyte ZiB 270
yobibyte YiB 280
关闭

国际电工委员会(IEC) 和电气与电子工程师协会(IEEE) 将字节的单位符号指定为大写字母 B。例如MB表示兆字节(megabyte);位元bit)可缩写成b,例如Mb表示兆位元(megabit英语megabit),与字节进行区分。 国际上,单位八位字节(octet,符号 o)明确定义了八位的序列,消除了术语“字节”的潜在歧义。  

字节的大小历来取决于硬件,并且不存在强制规定大小的明确标准。曾经使用过的字节的大小包含 1 到 48 位。六位字符代码是早期编码系统中常用的实现方式,使用六位和九位字节的电脑在 20 世纪 60 年代很常见。这些系统通常具有 12、18、24、30、36、48 或 60 位的存储器字,对应于 2、3、4、5、6、8 或 10 个六位字节。在术语“字节”变得普遍之前,指令流中的位分组通常被称为syllable[a]或slab 。

ISO/IEC 2382-1:1993 中记录的现代事实上的标准(8位)是相对方便的2 的幂,因为 2 的 8 次方是 256,允许一个字节使用 0 到 255的二进制编码值。 国际标准IEC 80000-13定义了这一常见含义。许多类型的应用程式使用可用八位或更少位表示的资讯,并且处理器设计者通常针对这种用法进行优化。主要商业计算架构的普及有助于 8 位字节的普遍接受。现代架构通常使用 32 位字或 64 位字,分别由 4 个或 8 个字节构成。

历史

字节 (byte) 一词由Werner Buchholz英语Werner Buchholz于 1956 年 6 月创造,当时正值 IBM Stretch 电脑的早期设计阶段,该电脑具有位寻址和可变字段长度 (VFL) 指令,指令中编码了字节大小。 这是 bite 的故意拼写,以避免意外更改为 bit。

字节的另一个起源是用于表示小于电脑字大小的位组,特别是四位组,由 Louis G. Dooley 记录,他声称他在 1956 年或 1957 年与 Jules Schwartz 和 Dick Beeler 在麻省理工学院林肯实验室合作开发名为 SAGE 的防空系统时创造了该术语,该系统由兰德公司麻省理工学院IBM 联合开发。后来,施瓦茨的语言 JOVIAL 实际上也使用了这个术语,但作者隐约记得它源自 AN/FSQ-31

早期的电脑使用各种四位二进码十进数表示法和美国陆军 (FIELDATA) 和海军中常见的可打印图形图案的六位代码。这些表示法包括字母数字字符和特殊图形符号。这些集合在 1963 年扩展为七位编码,称为美国资讯交换标准代码 (ASCII),即联邦资讯处理标准,它取代了 20 世纪 60 年代美国政府不同部门和大学使用的不兼容电传打字机代码。ASCII 包括大小写字母的区别和一组控制字符,以方便书面语言的传输以及打印装置功能,例如页面前进和换行,以及对传输介质上数据流的物理或逻辑控制。20 世纪 60 年代初,IBM 积极参与 ASCII 标准化工作,同时在其 System/360 产品线中引入了 8 位EBCDIC,这是早期卡片打孔机中使用的 6 位二进制编码十进制 (BCDIC) 表示法的扩展。 System/360 的突出地位导致人们普遍采用 8 位存储大小,而 EBCDIC 和 ASCII 编码方案在细节上有所不同。

20 世纪 60 年代初,AT&T 在长途中继线上引入了数字电话。这些电话使用了 8 位 μ 律编码。这项大笔投资有望降低 8 位数据的传输成本。

在《电脑编程艺术》第 1 卷(首次出版于 1968 年)中,Donald Knuth 在他假想的 MIX 电脑中使用字节来表示“包含未指定数量的资讯……能够容纳至少 64 个不同值……最多 100 个不同值。因此,在二进制电脑上,一个字节必须由六位组成”。他指出,“自 1975 年左右以来,字节一词的含义已经精确地变成了八个二进制数字的序列……当我们在 MIX 中谈论字节时,我们将局限于该词以前的含义,回溯到字节尚未标准化的时代。”

20 世纪 70 年代八位微处理器的发展使这种存储大小变得流行起来。微处理器(例如 8086 的直接前身 Intel 8080)也可以对一个字节中的四位对执行少量操作,例如十进制加法调整 (DAA) 指令。四位数通常称为半字节,也称为 nybble,用一个十六进制数字表示很方便。

术语八位字节(octet)明确指定了八位的大小。它在通讯协议定义中被广泛使用。

注释

参考资料

延伸阅读

参阅

外部链接

Wikiwand - on

Seamless Wikipedia browsing. On steroids.