Google圖書(英語:Google Books)是一個由Google研發的搜尋工具,它可以自Google所掃描、經由光學字元識別(OCR)、儲存的數碼化數據庫中搜尋資料。此服務於2004年10月在法蘭克福書展發佈,命名為Google Print。當用戶使用關鍵字搜尋,Google圖書搜尋的結果索引會顯示在Google網絡搜尋服務的上方。用戶還可以在Google圖書搜尋搜尋書籍。點擊Google圖書搜尋的結果索引打開頁面,使用戶可以檢視書籍中的頁面以及內容相關的廣告,連結到出版商的網站和書店。Google以限制網頁的瀏覽數量,來阻止書籍被列印和保護文字內容的複製著作權,並追蹤用戶使用記錄,作為通過各種准入限制和保障措施的依據。[1]
Quick Facts 網站類型, 持有者 ...
Close
Google圖書搜尋允許公有領域的作品和內容,免費全文瀏覽,並提供PDF的格式下載。對於在美國境外的用戶,Google必須確保其沒有觸犯到用戶所在國家的法律,根據Google圖書搜尋支援小組的成員說法:「一本書是否屬於公有領域往往是一個棘手的法律問題,我們會謹慎處理,直到我們確定本書已進入公有領域。」[2]
關於掃描方面,許多書籍使用Elphel 323相機掃描,這種相機每小時可以照1,000頁。[3]
而Google的這個計劃受到極大稱讚,因為它可能成為前所未有、全球最大的網上主體的人類知識,[4][5]但它仍有着有關侵犯著作權上的批評。[6]
Google圖書掃描圖書的目的,並不是給人類閲讀,而是用於訓練人工智能[7]。
Google曾表示,他們目前一天可掃描三千本書籍。到2007年3月為止,Google已經數碼化100萬本圖書。Google拒絕透露項目開支,但《紐約時報》在2008年時估算其花費了約500萬美元。[8]在2008年10月28日Google說,通過此項服務,他們有700萬本的圖書被搜尋,其中包括掃描的20,000個出版商的合作夥伴[9]。在這700萬冊圖書當中,有100萬本在出版商正式授權下提供「完全預覽」服務,另外100萬屬於在公有領域,其餘500萬是絕版或商用。[10]
- 微軟在2006年開發了一個類似的計劃,名叫Live Search Books。它持續進行了一段時間,直到2008年5月取消[11]。所有的Live Search Books的資料,現已存在Internet Archive。Internet Archive是非營利性的,它是繼Google之後第二大圖書掃描計劃。截至2008年11月已有超過100萬全文公有領域的作品被掃描上網。
- Europeana主宰約300萬份的數碼物件,其中包括影像、相片、繪畫、音頻、地圖、手稿、印刷書籍、報紙等,這些檔案超過一千項是由歐盟自過去兩千年的歐洲歷史搜集而成的。[12]
- 十二月:Google公佈擴張Google Print計劃,初期稱為Google Print Library Project[13]。Google宣佈與幾所知名大學和公共圖書館建立夥伴關係,包括密歇根大學、哈佛大學(哈佛大學圖書館)、史丹福大學(Green Library)、牛津大學(博德利圖書館),以及紐約公共圖書館。根據新聞稿和各大學圖書館長所言,Google計劃在十年內數碼化並提供約1,500萬冊的Google圖書搜尋服務。Google動作之迅速引發了爭議,出版商和作者協會質疑這不僅是針對公共領域的圖書,同時也挑戰了著作權。
- 九月至十月間:兩起對Google提出的訴訟控訴Google公司不尊重著作權,未能妥善補償作者及出版商。其一是集體作者訴訟代表(作家協會Authors Guild控訴Google,2005年9月20日);另一是五個大型出版商和美國出版商協會Association of American Publishers控訴的民事訴訟(McGraw Hill 控訴Google,2005年10月19日。)[6]
- 十一月:Google將Google Print正式改名為Google圖書搜尋。[14]這個方案使出版商、作者及他們在此服務中的書籍改了名,稱為「Google Books Partner Program」(見Google Library Partners (頁面存檔備份,存於互聯網檔案館)),並且與圖書館的合作關係就成為了Google圖書館計劃。
- 八月:加州大學系統宣佈它們將加入圖書搜尋數碼化的計劃。[15]
- 九月:馬德里Complutense大學圖書館成為加入Google圖書計劃的第一個西班牙語圖書館。
- 十月:威斯康星大學麥迪遜分校宣佈,它與威斯康星州歷史學會的圖書館,將加入圖書搜尋數碼化計劃。合併後,圖書館館藏變為720萬冊。
- 十一月:弗吉尼亞大學加入該計劃。該庫包含超過5萬冊和1,700多萬份的手稿、珍貴書籍和檔案。[16]
- 一月:德克薩斯州大學奧斯汀分校宣佈將加入圖書搜尋數碼化計劃。至少有一萬冊數碼化將是由該大學的13個圖書館定位。
- 三月:巴伐利亞州圖書館宣佈與Google建立合作夥伴關係,來掃描超過100萬份在公共領域,和絕版的德語以及英語、法語、意大利語、拉丁語和西班牙語作品。[17]
- 五月:一本數碼化計劃的書,被公告為Google及縣立、洛桑大學圖書館所納入。[18]
- 五月:根特大學的Boekentoren圖書館,將參與Google圖書數碼化計劃,且將把19世紀的圖書製成法國和荷蘭的語言並上線。[19]
- 六月:合作委員會(Committee on Institutional Cooperation)宣佈,其12個成員圖書館未來六年將參與掃描1,000萬本書。[20]
- 七月:慶應義塾大學成為Google在日本的第一個圖書館合作夥伴,他們將數碼化至少12萬本公共領域的書籍。[21]
- 八月:Google宣佈,它將數碼化達50萬本有著作權的書籍,也將數碼化在康奈爾大學圖書館的公共領域書籍。Google還將提供一個系統,可將數碼化複製的所有作品掃描並納入大學自己的圖書館。[22]
- 九月:Google新增功能,允許用戶在公共領域共用片段的書籍。
- 九月:Google推出一項新功能,名為「我的圖書館」,允許用戶創建個人化的圖書館。他們可以運用標籤、審查、利率、或全文檢索來選擇圖書。[23]
- 十二月:美國哥倫比亞大學成為數碼化公共領域的夥伴。[24]
- 五月:微軟逐漸衰微,並打算結束其掃描計劃。該計劃掃描了75萬份書籍和八千萬篇雜誌文章。[25]
- 十月:出版業和Google經過兩年的談判後達成協定。Google同意以補償作者和出版商,來換取將數以百萬計的圖書提供給公眾。[6]
- 十一月:Google和合作夥伴的圖書掃描計劃達到了700萬大關。其中一百萬已達成「完全預覽」模式,另外一百萬已是可完全瀏覽和下載的公共領域的作品。[26][10]
出版業與作家協會批評該計劃列入片段的作品是侵犯著作權的行為。2005年秋季,作家協會和美國出版商協會分別控訴Google。Google反駁說,該計劃的每個項目皆是合理使用,並且在這數碼時代,每一個字都有對應到其出版索引。[6]2006年6月,在訴訟之後,法國出版商宣佈它打算控訴法國Google。[30]2006年底,德國控訴被撤回。[31]
2007年3月,Google被告侵犯著作權法的圖書搜尋服務。微軟的副總兼法律顧問托馬斯·魯賓(Thomas Rubin)批評Google一再任意複製作品,並且總是直到有人出面指證才會停手。[32]2008年11月28日,作家協會、出版界和Google簽訂了和解協定,Google同意支付總共1.25億美元,包括訴訟費用及建立圖書權登記處。該解決方案將在2009年5月得到法院的批准。[6]解決的反應有好有壞,其中一個與Google合作的圖書館表示,如果Google無法找到「更合理的條款」,它會選擇撤回與其合作的關係。[33]
弗吉尼亞大學的副教授Siva Vaidhyanathan,以法律觀點研究一已出版的見解[34],之後他指出Google該計劃構成了危險的理論——合理使用,因為索賠的使用其實是不合理的,它可能會導致司法限制這一權利。[35]而之後作家協會控訴Google沒有去法院,導致合理使用爭端得不到解決方案。
Google許可的公有領域作品也是一個令人關注的議題。[36]一些出版作業是在公有領域進行的,例如美國聯邦政府創造的所有作品,但那些作品仍被視如其他著作權保護的作品般對待,導致它們在1922年之後遭禁。[37]
一些歐洲政治家和知識分子批評Google有語言帝國主義傾向,理由是因為絕大多數的書籍都掃描成英文,這會導致英文成為世界代表性的自然語言,如此一來受歡迎的語文學例如德語、漢語、俄語、法語則會漸漸不被重視,並不公平。在這些批評聲浪中出面表達意見的是法國國家圖書館館長Jean-Noël Jeanneney。[38]
當Google圖書大量掃描一些過期學報、雜誌時產生了一個問題,就是其掃描時並沒有辦法將元數據(metadata)也一並掃入。這使得Google學術搜尋只好開辦自己的數碼化計劃,並放置認同這個計劃的出版社的過期期刊文章。[39]
Kelly, Kevin. Scan This Book!. New York Times Magazine. 2006年5月14日 [2008-03-07]. (原始內容存檔於2021-01-25). When Google announced in December 2004 that it would digitally scan the books of five major research libraries to make their contents searchable, the promise of a universal library was resurrected. ... From the days of Sumerian clay tablets till now, humans have "published" at least 32 million books, 750 million articles and essays, 25 million songs, 500 million images, 500,000 movies, 3 million videos, TV shows and short films and 100 billion public Web pages.
Copyright infringement suits against Google and their settlement:
The original lawsuits in 2005:
Hafner, Katie. History, Digitized (and Abridged). New York Times. March 10, 2007 [2008-04-10]. (原始內容存檔於2020-11-22). Google, on its own, is digitizing books at the Library of Congress, which has its hands full with other items. ... In its quest to scan every one of the tens of millions of books ever published, Google has already digitized one million volumes. Google refuses to say how much it has spent on the venture so far, but outside experts estimate the figure at at least US$5 million. The company has also been scanning and indexing academic journals to make them searchable, and is working with the Patent Office to digitize thousands of patents dating back to 1790.
Siva Vaidhyanathan,. “The Googlization of Everything and the Future of Copyright,” University of California Davis Law Review volume 40 (March 2007), pp. 1207–1231, pdf (頁面存檔備份,存於互聯網檔案館)