在線數字檔案,用於科學論文的電子預印本 来自维基百科,自由的百科全书
arXiv(读音同archive,其中X依希腊文的χ发音)是一个面向全球科学家和研究人员的开放获取预印本网站,主要收录物理学、数学、计算机科学、生物学、定量金融学、统计学等多个学科领域的论文预印本。该平台自1991年8月创立以来,逐步发展成为公认最成功的开放获取数字系统之一[2]:56。截至2025年2月[update],arXiv.org已收集超过260万篇预印本[3]。
arXiv提供了一个免费、开放的知识库,使研究人员能够在正式投稿至期刊前或并行于期刊同行评审程序,将最新的研究成果以预印本的形式上传、存储和传播。用户无需支付费用即可访问和下载平台上的文献。
紧凑的TeX文件格式使arXiv成为可能,该格式使科学论文可以轻松地通过互联网传输并呈现给客户端。在1990年左右,乔安妮·科恩开始以TeX文件的形式通过电子邮件将物理预印本发送给同事,但很快发送的论文数量太多,以至于装满邮箱。保罗·金斯巴格发现了中央存储的必要性,于1991年8月创建了一个中央仓库邮箱。该邮箱存储在洛斯阿拉莫斯国家实验室中,可以通过任何计算机访问。网站很快支持了其他访问方式:1991年起支持FTP,1992年起支持Gopher,1993年起支持万维网[4]。1999年,网站改名为arXiv.org。
arXiv最早是由物理学家保罗·金斯巴格在1991年建立的网站,本意在收集物理学的论文预印本,随后括及天文、数学等其它领域。金斯巴格因这个网站获得了2002年的麦克阿瑟奖。
arXiv原先挂在洛斯阿拉莫斯国家实验室(LANL),故早期被称为“LANL预印本数据库”。2001年arXiv的运营、编辑、经济和管理工作移交给康奈尔大学图书馆[5][2]:前言,并在全球各地设有镜像站点[2]:56。
每篇arXiv论文都有一个唯一标识符:
YYMM.NNNNN
,例如1507.00123
,YYMM.NNNN
,例如 0704.0001
,arch-ive/YYMMNNN
,用于早期论文,例如hep-th/9901001
.同一篇论文的不同版本通过结尾的版本号确定,例如1709.08980v1
。若不提供版本号,则默认为最新版本。
arXiv采用分类系统。每篇论文都有一个或多个分类标记。部分分类具有两层,例如q-fin.TR
表示“计量金融学”(quantitative finance)分类中的“交易与市场微观结构”(Trading and Market Microstructure)。其它单层分类例如hep-ex
, 表示“高能物理实验”(high energy physics experiments)。
arXiv接受以多种格式投稿论文,包括LaTeX和通过TeX或LaTeX以外的文字处理器打印的PDF。 如果最终PDF文件生成失败、图像文件太大或提交的总大小太大,投稿会被拒绝。 现在,arXiv允许存储和修改不完整的投稿,并且仅在准备好后才能最终确定投稿。 完成投稿后,文章上会记有时间戳。
尽管arXiv上的文章未经同行评审,但arXiv在2004年起采行了一套“认可”系统。在这套系统下,作者首先要得到认可,这种认可可能来自另一位具认可资格者的背书,或者依照某些内部规定而自动授予。来自著名学术机关的作者通常会自动得到认可。包括诺贝尔物理奖得主布赖恩·约瑟夫森在内的十九位科学家曾抗议他们的部分文章被arXiv管理者退回,而其它文章则被强迫更改分类,依其见解,原因出在研究主题的争议性,或者是文章抵触了弦理论的正统观点[7]。
由于arXiv上的文章多半都会投稿到学术期刊,作者对文章多半保持严谨态度。少部分文章则一直保持预印本的形式,其中包括一些极具影响力的作品,例如格里戈里·佩雷尔曼对庞加莱猜想的证明。佩雷尔曼似乎放弃了传统的同行评审期刊程序,并指出:“如果有人对我解决问题的方式感兴趣,它就在[arXiv]上–让他们继续阅读。”[8]尽管采用了这种非传统的出版方法,其他数学家还是认可了这项工作,向佩雷尔曼提供了菲尔兹奖和克雷数学千年奖,但他都拒绝[9]。
arXiv上的民间科学家作品为数不多,通常被归入诸如“一般数学”(General Mathematics)的项下。
自2001年转移至康奈尔大学图书馆后,arXiv的日常运营与发展均由该图书馆负责。图书馆承担了平台的技术维护、用户支持、内容存储和长期获取等职责,同时管理全球镜像网站以确保数据冗余和访问稳定性。[2]:66
arXiv的直接运营团队由约6名全职员工组成,其中大部分员工负责用户支持和系统管理[2]:71。同时arXiv通过与全球各地图书馆、研究实验室及基金会的合作,建立了会员制度和资助机制[2]:60-68。
为保障平台的可持续运营,arXiv建立了多元化的收入模式,包括[2]:60-62:
arXiv的治理体系包括[2]:66-67:
康奈尔大学图书馆采用标准备份程序,确保arXiv所有数据均能安全存储,同时纽约市的异地备份设施和全球镜像站点提供了地理冗余保护。arXiv优先接纳具备长期存档价值的文档格式,如TeX/LaTeX、PDF、HTML,并保留所有源文件,以便后续的灵活监控和处理。康奈尔大学图书馆还建立了档案知识库,以支持平台关键资源的长期保存和管理,并承担相关数据保存费用。[2]:72
arXiv的存在是造就科学出版业中所谓开放获取运动的因素之一。现今一些数学家和科学家习惯在将论文提交给专业学术期刊前先上传至arXiv。这一趋势对传统学术期刊的经营模式造成了可观的冲击。
Seamless Wikipedia browsing. On steroids.