资讯爆炸(英语:information explosion)是指现代出版资讯或数据数量的急速增加,以及因如此大量而带来的影响。[1]当可用数据数量增加后,资讯管理的问题变得困难,更可能导致信息过载。在线牛津英语词典记载,1964年3月的《新政治家》文章中使用了该词。《纽约时报》在1964年6月7日沃尔特沙利文的一篇文章中,首次在编辑内容中采用这个词,其中将编辑过程描述为“经过多次讨论”(第11页)。[2]这字词的最早的已知使用见于NBC台长在1955年9月27日伦敦广告从业者协会的关于电视的演讲,该演讲于艾奥瓦州WSUI广播电台重播,并于两个月后节录于《Daily Iowan》报纸上。[3]
包括医疗保健、超市以至于政府机关等各行各业,都可观察到资料量大量增加的情形。[4]受此影响的还有新闻传播业,过去其使命是传播资讯,但现在这一职责反而因为资讯过多而被抑制。[5]。
从巨量的电子数据中分析资料以获取知识的方法(比如数据融合可帮助数据挖掘)自1970年代起便已诞生。定性研究也常被用来分析如此大量的数据。[6]这些方法的主要目的为组织、综合、分类并系统化资讯,使其更易被搜索和使用。
增长模式
- 全球资料存储容量由1986年的2.6 EB(最优化压缩)成长至1993年的15.8 EB,2000年的54.5 EB,和2007年的295 EB。以一片730 MB的CD-ROM来计量,这相当于全球每人于1986年拥有少于一片CD-ROM,于1993年拥有4片CD-ROM,于2000年拥有12片CD-ROM,于2007年拥有61片CD-ROM。[7]
- 全球透过广播单向接受的资讯容量,在1986年是432 EB(理想压缩下),在1993年是715 EB,在2000年是1,200 EB,在2007年是1,900 EB。[7]
- 全球透过电信网络双向交换资讯的容量在1986年是0.281 EB(理想压缩下),在1993年是0.471 EB,在2000年是2.2 EB,在2007年是65 EB。[7]
挑战
巨量的资讯尽管在许多方面带来不少正面效益,其同时也造成了一些问题,包括隐私、法律、伦理、消息正确性和消息筛选等方面。[8]消息筛选泛指由巨量资讯当中准确筛选有用的部分,资料科学家的工作便是担当这方面的角色。其中一个例子便是数据挖掘于卫生保健方便的应用,尤其近年来随着电子健康数据库的普及而更显重要,医师必须能够从巨量资讯当中准确筛选资讯来诊断病患之病情。另一方面,一些专家也提出警告,大量消息的公开将使得确保资讯的匿名更加困难。此外,谁是资讯的持有者?其又应如何将资讯公开?公开多久的时间?公开频率为何?亦存在法律和伦理层面上之争论。由于资讯来源过多,资讯的准确性也是一大课题。当一项资讯来源被质疑,质疑者可能会要求改正资讯中存在疑虑的部分,造成资讯的重复。爱德华·胡特(Edward Huth)指出,资讯的成本和获取的容易度也是问题之一。资讯获取的容易度可借由降低其成本和增加其功能之多样性而降低。胡特认为,交互比对法能有组织性地筛选有用的资讯,促使资讯获取之成本下降。
网页伺服器
参见
参考
外部连接
Wikiwand in your browser!
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.