Google图书(英语:Google Books)是一个由Google研发的搜寻工具,它可以自Google所扫描、经由光学字符识别(OCR)、储存的数位化数据库中搜寻资料。此服务于2004年10月法兰克福书展发布,命名为Google Print。当用户使用关键字搜寻,Google图书搜寻的结果索引会显示在Google网路搜寻服务的上方。用户还可以在Google图书搜寻搜寻书籍。点击Google图书搜寻的结果索引打开页面,使用户可以查看书籍中的页面以及内容相关的广告,链接到出版商的网站和书店。Google以限制网页的浏览数量,来阻止书籍被列印和保护文字内容的复制版权,并追踪用户使用记录,作为通过各种准入限制和保障措施的依据。[1]

Quick Facts 网站类型, 持有者 ...
Google图书
网站类型
数位图书馆
持有者Google
网址books.google.com 编辑维基数据链接
推出时间2004年10月,​20年前​(2004-10
现状营运中
Close

Google图书搜寻允许公有领域的作品和内容,免费全文浏览,并提供PDF的格式下载。对于在美国境外的用户,Google必须确保其没有触犯到用户所在国家的法律,根据Google图书搜寻支援小组的成员说法:“一本书是否属于公有领域往往是一个棘手的法律问题,我们会谨慎处理,直到我们确定本书已进入公有领域。”[2]

关于扫描方面,许多书籍使用Elphel 323相机扫描,这种相机每小时可以照1,000页。[3]

而Google的这个计画受到极大称赞,因为它可能成为前所未有、全球最大的网上主体的人类知识,[4][5]但它仍有著有关侵犯版权上的批评。[6]

计画目的

Google图书扫描图书的目的,并不是给人类阅读,而是用于训练人工智能[7]

扫描数量

Google曾表示,他们目前一天可扫描三千本书籍。到2007年3月为止,Google已经数位化100万本图书。Google拒绝透露项目开支,但《纽约时报》在2008年时估算其花费了约500万美元。[8]在2008年10月28日Google说,通过此项服务,他们有700万本的图书被搜索,其中包括扫描的20,000个出版商的合作伙伴[9]。在这700万册图书当中,有100万本在出版商正式授权下提供“完全预览”服务,另外100万属于在公有领域,其馀500万是绝版或商用。[10]

竞争

  • 微软在2006年开发了一个类似的计画,名叫Live Search Books英语Live Search Books。它持续进行了一段时间,直到2008年5月取消[11]。所有的Live Search Books的资料,现已存在Internet Archive。Internet Archive是非营利性的,它是继Google之后第二大图书扫描计画。截至2008年11月已有超过100万全文公有领域的作品被扫描上网。
  • Europeana主宰约300万份的数位物件,其中包括影像、照片、绘画、音频、地图、手稿、印刷书籍、报纸等,这些档案超过一千项是由欧盟自过去两千年的欧洲历史搜集而成的。[12]

时间表

2004

  • 十二月:Google公布扩张Google Print计画,初期称为Google Print Library Project[13]。Google宣布与几所知名大学和公共图书馆建立伙伴关系,包括密西根大学哈佛大学(哈佛大学图书馆)、史丹佛大学Green Library英语Green Library)、牛津大学博德利图书馆),以及纽约公共图书馆。根据新闻稿和各大学图书馆长所言,Google计画在十年内数位化并提供约1,500万册的Google图书搜寻服务。Google动作之迅速引发了争议,出版商和作者协会质疑这不仅是针对公共领域的图书,同时也挑战了著作权。

2005

  • 九月至十月间:两起对Google提出的诉讼控诉Google公司不尊重版权,未能妥善补偿作者及出版商。其一是集体作者诉讼代表(作家协会Authors Guild英语Authors Guild控诉Google,2005年9月20日);另一是五个大型出版商和美国出版商协会Association of American Publishers英语Association of American Publishers控诉的民事诉讼(McGraw Hill 控诉Google,2005年10月19日。)[6]
  • 十一月:Google将Google Print正式改名为Google图书搜寻[14]这个方案使出版商、作者及他们在此服务中的书籍改了名,称为“Google Books Partner Program”(见Google Library Partners页面存档备份,存于互联网档案馆)),并且与图书馆的合作关系就成为了Google图书馆计划

2006

  • 八月:加州大学系统宣布它们将加入图书搜寻数位化的计画。[15]
  • 九月:马德里Complutense大学图书馆成为加入Google图书计画的第一个西班牙语图书馆。
  • 十月:威斯康星大学麦迪逊分校宣布,它与威斯康星州历史学会的图书馆,将加入图书搜寻数位化计画。合并后,图书馆馆藏变为720万册。
  • 十一月:弗吉尼亚大学加入该计画。该库包含超过5万册和1,700多万份的手稿、珍贵书籍和档案。[16]

2007

  • 一月:得克萨斯州大学奥斯汀分校宣布将加入图书搜寻数位化计划。至少有一万册数位化将是由该大学的13个图书馆定位。
  • 三月:巴伐利亚州图书馆宣布与Google建立合作伙伴关系,来扫描超过100万份在公共领域,和绝版的德语以及英语、法语、意大利语、拉丁语和西班牙语作品。[17]
  • 五月:一本数位化计画的书,被公告为Google及县立、洛桑大学图书馆所纳入。[18]
  • 五月:根特大学的Boekentoren图书馆,将参与Google图书数位化计画,且将把19世纪的图书制成法国和荷兰的语言并上线。[19]
  • 六月:合作委员会(Committee on Institutional Cooperation英语Committee on Institutional Cooperation)宣布,其12个成员图书馆未来六年将参与扫描1,000万本书。[20]
  • 七月:庆应义塾大学成为Google在日本的第一个图书馆合作伙伴,他们将数位化至少12万本公共领域的书籍。[21]
  • 八月:Google宣布,它将数位化达50万本有版权的书籍,也将数位化在康奈尔大学图书馆的公共领域书籍。Google还将提供一个系统,可将数位化复制的所有作品扫描并纳入大学自己的图书馆。[22]
  • 九月:Google新增功能,允许用户在公共领域共享片段的书籍。
  • 九月:Google推出一项新功能,名为“我的图书馆”,允许用户创建个人化的图书馆。他们可以运用标签、审查、利率、或全文检索来选择图书。[23]
  • 十二月:美国哥伦比亚大学成为数位化公共领域的伙伴。[24]

2008

  • 五月:微软逐渐衰微,并打算结束其扫描计画。该计画扫描了75万份书籍和八千万篇杂志文章。[25]
  • 十月:出版业和Google经过两年的谈判后达成协议。Google同意以补偿作者和出版商,来换取将数以百万计的图书提供给公众。[6]
  • 十一月:Google和合作伙伴的图书扫描计画达到了700万大关。其中一百万已达成“完全预览”模式,另外一百万已是可完全浏览和下载的公共领域的作品。[26][10]

Google图书计画参与者

Thumb
哈佛大学哈佛大学图书馆
Thumb
牛津大学博德利图书馆
Thumb
庆应义塾图书馆旧馆
Thumb
纽约公共图书馆

参与计画的成员人数自Google图书馆计划实行之初已成长许多[13];迈索尔大学在许多媒体的报导都提到其为此计划之合作伙伴,[27][28]但他们实际上并没有被Google列为合作伙伴。[29]  

首批参与者

后期加入参与者

争议

违反著作权、合理使用等争议

出版业与作家协会批评该计画列入片段的作品是侵犯版权的行为。2005年秋季,作家协会和美国出版商协会分别控诉Google。Google反驳说,该计画的每个项目皆是合理使用,并且在这数位时代,每一个字都有对应到其出版索引。[6]2006年6月,在诉讼之后,法国出版商宣布它打算控诉法国Google。[30]2006年底,德国控诉被撤回。[31]
2007年3月,Google被告侵犯著作权法的图书搜索服务。微软的副总兼法律顾问托马斯·鲁宾(Thomas Rubin)批评Google一再任意复制作品,并且总是直到有人出面指证才会停手。[32]2008年11月28日,作家协会、出版界和Google签订了和解协议,Google同意支付总共1.25亿美元,包括诉讼费用及建立图书权登记处。该解决方案将在2009年5月得到法院的批准。[6]解决的反应有好有坏,其中一个与Google合作的图书馆表示,如果Google无法找到“更合理的条款”,它会选择撤回与其合作的关系。[33]

弗吉尼亚大学的副教授Siva Vaidhyanathan英语Siva Vaidhyanathan,以法律观点研究一已出版的见解[34],之后他指出Google该计画构成了危险的理论——合理使用,因为索赔的使用其实是不合理的,它可能会导致司法限制这一权利。[35]而之后作家协会控诉Google没有去法院,导致合理使用争端得不到解决方案。

Google许可的公有领域作品也是一个令人关注的议题。[36]一些出版作业是在公有领域进行的,例如美国联邦政府创造的所有作品,但那些作品仍被视如其他版权保护的作品般对待,导致它们在1922年之后遭禁。[37]

语言争议

一些欧洲政治家和知识分子批评Google有语言帝国主义倾向,理由是因为绝大多数的书籍都扫描成英文,这会导致英文成为世界代表性的自然语言,如此一来受欢迎的语文学例如德语、汉语、俄语、法语则会渐渐不被重视,并不公平。在这些批评声浪中出面表达意见的是法国国家图书馆馆长Jean-Noël Jeanneney英语Jean-Noël Jeanneney[38]

Google图书与Google学术搜索

当Google图书大量扫描一些过期学报、杂志时产生了一个问题,就是其扫描时并没有办法将元数据(metadata)也一并扫入。这使得Google学术搜寻只好开办自己的数位化计划,并放置认同这个计画的出版社的过期期刊文章。[39]

参考文献

外部链接

参见

Wikiwand in your browser!

Seamless Wikipedia browsing. On steroids.

Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.

Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.