信息爆炸(英语:information explosion)是指现代出版信息数据数量的急速增加,以及因如此大量而带来的影响。[1]当可用数据数量增加后,信息管理的问题变得困难,更可能导致信息过载。在线牛津英语词典记载,1964年3月的《新政治家》文章中使用了该词。《纽约时报》在1964年6月7日沃尔特沙利文的一篇文章中,首次在编辑内容中采用这个词,其中将编辑过程描述为“经过多次讨论”(第11页)。[2]这字词的最早的已知使用见于NBC台长在1955年9月27日伦敦广告从业者协会的关于电视的演讲,该演讲于艾奥瓦州WSUI广播电台重播,并于两个月后节录于《Daily Iowan》报纸上。[3]

包括医疗保健、超市以至于政府机关等各行各业,都可观察到资料量大量增加的情形。[4]受此影响的还有新闻传播业,过去其使命是传播信息,但现在这一职责反而因为信息过多而被抑制。[5]

从巨量的电子数据中分析资料以获取知识的方法(比如数据融合英语Data fusion可帮助数据挖掘)自1970年代起便已诞生。定性研究也常被用来分析如此大量的数据。[6]这些方法的主要目的为组织、综合、分类并系统化信息,使其更易被搜索和使用。

增长模式

  • 全球资料存储容量由1986年的2.6 EB(最优化压缩)成长至1993年的15.8 EB,2000年的54.5 EB,和2007年的295 EB。以一片730 MBCD-ROM来计量,这相当于全球每人于1986年拥有少于一片CD-ROM,于1993年拥有4片CD-ROM,于2000年拥有12片CD-ROM,于2007年拥有61片CD-ROM。[7]
  • 全球透过广播单向接受的信息容量,在1986年是432 EB(理想压缩下),在1993年是715 EB,在2000年是1,200 EB,在2007年是1,900 EB。[7]
  • 全球透过电信网络双向交换信息的容量在1986年是0.281 EB(理想压缩下),在1993年是0.471 EB,在2000年是2.2 EB,在2007年是65 EB。[7]

挑战

巨量的信息尽管在许多方面带来不少正面效益,其同时也造成了一些问题,包括隐私、法律、伦理、消息正确性和消息筛选等方面。[8]消息筛选泛指由巨量信息当中准确筛选有用的部分,资料科学家的工作便是担当这方面的角色。其中一个例子便是数据挖掘于卫生保健方便的应用,尤其近年来随着电子健康数据库的普及而更显重要,医师必须能够从巨量信息当中准确筛选信息来诊断病患之病情。另一方面,一些专家也提出警告,大量消息的公开将使得确保信息的匿名更加困难。此外,谁是信息的持有者?其又应如何将信息公开?公开多久的时间?公开频率为何?亦存在法律和伦理层面上之争论。由于信息来源过多,信息的准确性也是一大课题。当一项信息来源被质疑,质疑者可能会要求改正信息中存在疑虑的部分,造成信息的重复。爱德华·胡特(Edward Huth)指出,信息的成本和获取的容易度也是问题之一。信息获取的容易度可借由降低其成本和增加其功能之多样性而降低。胡特认为,交互比对法能有组织性地筛选有用的信息,促使信息获取之成本下降。

网页服务器

2005年8月,全球有7,000万个网页服务器。[9]截至2007年9月,全球共有1.35亿个网页服务器。[10]

参见

参考

外部连接

Wikiwand in your browser!

Seamless Wikipedia browsing. On steroids.

Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.

Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.