arXiv

在線數字檔案,用於科學論文的電子預印本 来自维基百科,自由的百科全书

ArXiv

arXiv(讀音同archive,其中X希臘文χ發音)是一個面向全球科學家和研究人員的開放獲取預印本網站,主要收錄物理學數學計算機科學生物學定量金融學統計學等多個學科領域的論文預印本。該平台自1991年8月創立以來,逐步發展成為公認最成功的開放獲取數字系統之一[2]:56。截至2025年2月 (2025-02),arXiv.org已收集超過260萬篇預印本[3]

事实速览 網站類型, 持有者 ...
arXiv
Thumb
Thumb
網站類型
科學
持有者康乃爾大學
創始人保羅·金斯巴格
網址arxiv.org
商業性質
註冊可選
推出時間1991年8月14日,​33年前​(1991-08-14
ISSN2331-8422
OCLC228652809
关闭

arXiv提供了一個免費、開放的知識庫,使研究人員能夠在正式投稿至期刊前或並行於期刊同行評審程序,將最新的研究成果以預印本的形式上傳、存儲和傳播。用戶無需支付費用即可訪問和下載平台上的文獻。

歷史

Thumb
在康奈爾大學的保羅·金斯巴格

緊湊的TeX文件格式使arXiv成為可能,該格式使科學論文可以輕鬆地通過互聯網傳輸並呈現給客戶端。在1990年左右,喬安妮·科恩英語Joanne Cohn開始以TeX文件的形式通過電子郵件將物理預印本發送給同事,但很快發送的論文數量太多,以至於裝滿郵箱。保羅·金斯巴格發現了中央存儲的必要性,於1991年8月創建了一個中央倉庫郵箱。該郵箱存儲在洛斯阿拉莫斯國家實驗室中,可以通過任何計算機訪問。網站很快支持了其他訪問方式:1991年起支持FTP,1992年起支持Gopher,1993年起支持全球資訊網[4]。1999年,網站改名為arXiv.org

arXiv最早是由物理學家保羅·金斯巴格在1991年建立的網站,本意在收集物理學的論文預印本,隨後括及天文、數學等其它領域。金斯巴格因這個網站獲得了2002年的麥克阿瑟獎

arXiv原先掛在洛斯阿拉莫斯國家實驗室(LANL),故早期被稱為「LANL預印本資料庫」。2001年arXiv的運營、編輯、經濟和管理工作移交給康奈爾大學圖書館[5][2]:前言,並在全球各地設有鏡像站點[2]:56

2022年1月,arXiv與DataCite英語DataCite合作,為文章自動分配DOI[6]

數據格式

每篇arXiv論文都有一個唯一標識符

  • YYMM.NNNNN ,例如1507.00123,
  • YYMM.NNNN,例如 0704.0001,
  • arch-ive/YYMMNNN,用於早期論文,例如hep-th/9901001.

同一篇論文的不同版本通過結尾的版本號確定,例如1709.08980v1。若不提供版本號,則默認為最新版本。

arXiv採用分類系統。每篇論文都有一個或多個分類標記。部分分類具有兩層,例如q-fin.TR表示「計量金融學」(quantitative finance)分類中的「交易與市場微觀結構」(Trading and Market Microstructure)。其它單層分類例如hep-ex, 表示「高能物理實驗」(high energy physics experiments)。

arXiv接受以多種格式投稿論文,包括LaTeX和通過TeX或LaTeX以外的文字處理器打印的PDF。 如果最終PDF文件生成失敗、圖像文件太大或提交的總大小太大,投稿會被拒絕。 現在,arXiv允許存儲和修改不完整的投稿,並且僅在準備好後才能最終確定投稿。 完成投稿後,文章上會記有時間戳。

同行評審

儘管arXiv上的文章未經同行評審,但arXiv在2004年起採行了一套「認可」系統。在這套系統下,作者首先要得到認可,這種認可可能來自另一位具認可資格者的背書,或者依照某些內部規定而自動授予。來自著名學術機關的作者通常會自動得到認可。包括諾貝爾物理獎得主布賴恩·約瑟夫森在內的十九位科學家曾抗議他們的部分文章被arXiv管理者退回,而其它文章則被強迫更改分類,依其見解,原因出在研究主題的爭議性,或者是文章牴觸了弦理論的正統觀點[7]

由於arXiv上的文章多半都會投稿到學術期刊,作者對文章多半保持嚴謹態度。少部份文章則一直保持預印本的形式,其中包括一些極具影響力的作品,例如格里戈里·佩雷爾曼龐加萊猜想的證明。佩雷爾曼似乎放棄了傳統的同行評審期刊程序,並指出:「如果有人對我解決問題的方式感興趣,它就在[arXiv]上–讓他們繼續閱讀。」[8]儘管採用了這種非傳統的出版方法,其他數學家還是認可了這項工作,向佩雷爾曼提供了菲爾茲獎克雷數學千年獎,但他都拒絕[9]

arXiv上的民間科學家作品為數不多,通常被歸入諸如「一般數學」(General Mathematics)的項下。

運營與管理

自2001年轉移至康奈爾大學圖書館後,arXiv的日常運營與發展均由該圖書館負責。圖書館承擔了平台的技術維護、用戶支持、內容存儲和長期獲取等職責,同時管理全球鏡像網站以確保數據冗餘和訪問穩定性。[2]:66

arXiv的直接運營團隊由約6名全職員工組成,其中大部分員工負責用戶支持和系統管理[2]:71。同時arXiv通過與全球各地圖書館、研究實驗室及基金會的合作,建立了會員制度和資助機制[2]:60-68

為保障平台的可持續運營,arXiv建立了多元化的收入模式,包括[2]:60-62

  • 康奈爾大學圖書館資助:每年提供固定現金補貼,用於支持平台的日常運營及部分間接成本;
  • 西蒙斯基金會:除每年提供直接資助外,還通過會員費匹配機制支持平台資金;
  • 會員機構費用:全球會員機構根據分級制度,每年支付一定費用(通常為1500至3000美元),承諾為期5年的初始資金支持,以實現年度目標收入。
  • 應急基金:用於應對突發支出和保障系統穩定性。

arXiv的治理體系包括[2]:66-67

  • 科學諮詢委員會:由涵蓋各學科的科學家和研究人員組成,為平台政策、存儲標準及系統發展提供指導和監督。
  • 會員諮詢委員會:由會員機構選舉代表組成,負責向康奈爾大學圖書館提供關於平台管理、運營、標準實施及財務規劃的建議。

數據保存

康奈爾大學圖書館採用標準備份程序,確保arXiv所有數據均能安全存儲,同時紐約市的異地備份設施和全球鏡像站點提供了地理冗餘保護。arXiv優先接納具備長期存檔價值的文檔格式,如TeX/LaTeX、PDF、HTML,並保留所有源文件,以便後續的靈活監控和處理。康奈爾大學圖書館還建立了檔案知識庫,以支持平台關鍵資源的長期保存和管理,並承擔相關數據保存費用。[2]:72

影響

arXiv的存在是造就科學出版業中所謂開放獲取運動的因素之一。現今一些數學家和科學家習慣在將論文提交給專業學術期刊前先上傳至arXiv。這一趨勢對傳統學術期刊的經營模式造成了可觀的衝擊。

參閱

參考文獻

外部連結

Wikiwand - on

Seamless Wikipedia browsing. On steroids.