Remove ads
編程語言 来自维基百科,自由的百科全书
Lisp(過去拼寫為LISP)是具有悠久歷史的計算機編程語言家族,有獨特的完全用圓括號的前綴符號表示法[3]。它起源於1958年[4],是現今第二悠久而仍廣泛使用的高階程式語言,只有FORTRAN編程語言比它更早一年[5]。Lisp編程語族已經演變出許多種方言,現代最著名的通用編程方言是Scheme、Common Lisp和新近的Clojure。
编程范型 | 多范型:函数式,过程式,同像性,反射式,元编程 |
---|---|
設計者 | 约翰·麦卡锡 |
實作者 | 史帝芬·羅素, Timothy P. Hart和Michael I. Levin |
发行时间 | 1958年 |
型態系統 | 动态类型,强类型 |
衍生副語言 | |
Arc, AutoLISP, Clojure, Common Lisp, Emacs Lisp, ISLISP, newLISP, PicoLisp, Racket, Scheme, SKILL, T | |
啟發語言 | |
IPL | |
影響語言 | |
CLU, Dylan, Falcon, Forth, Haskell, Io, JavaScript, Julia[1], Logo, Lua, LPC, MDL, ML, Nu, OPS5, Perl, POP-2/11, Python, REBOL, Ruby, Smalltalk, Wolfram语言[2] |
Lisp最初是為計算機程序創建的實用數學表示法[6],當時借鑒過阿隆佐·邱奇的lambda表示法[7]。它很快成為人工智能研究中最受歡迎的編程語言[8]。作為早期的高階編程語言之一,Lisp開創了計算機科學領域的許多概念,包括树结构、自動記憶體管理、动态类型、条件表达式[9]、高階函數[10]、遞迴[11]、自主編譯器[12]、讀取﹣求值﹣輸出循環(REPL)[13]。
Lisp的名稱源自「列表處理器」(英語:list processor)的縮寫[14]。列表是Lisp的主要數據結構之一,Lisp編程代碼也同樣由列表組成。因此,Lisp程序可以把源代碼當作數據結構進行操作,而使用其中的宏系統,開發人員可將自己定義的新語法或領域專用的語言,嵌入在Lisp編程中。
代碼和數據的可互換性為Lisp提供了立即可辨識的語法。所有的Lisp程序代碼都寫為S-表達式或以括號表示的列表。函數調用或語義形式也同樣寫成列表,首先是函數或操作符的名稱,然後接著是一或多個參數:例如,取三個參數的函數f
即為(f arg1 arg2 arg3)
。
在1958年,約翰·麥卡錫在麻省理工學院發明了Lisp程式語言[4]。在1960年,他在《ACM通讯》發表了論文《符號表達式的遞迴函數及其機器計算,第一部份》[15]。在這篇論文中闡述了只要透過一些簡單的運算子,以及借鑒自阿隆佐·邱奇的用於匿名函數的表示法[7],就可以建立一個可用於演算法中的具圖靈完備性的語言。Lisp还采纳了在1955年至1956年間創建的資訊處理語言所提出的列表處理與遞歸概念。
約翰·麥卡錫在最初定义的Lisp之中,先将程序表达为M-表达式(元表达式)[16],再将它转换成S-表達式(符号表达式),舉例來說M-表达式的car[cons[A;B]]
,等同於S-表達式的(car (cons A B))
。S-表達式可以将复杂结构表示为列表,在Lisp被实现了之后,编程者一般只使用S-表達式,而棄用M-表達式,这使得程式具備了同像性,即程式與資料由同樣的結構儲存。M-表達式曾短暫存續於Horace Enea的MLisp和沃恩·普拉特的CGOL之中[17]。
第一個Lisp實作是在IBM 704機器上使用打孔卡寫出的[18]。史帝芬·羅素在閱讀完約翰·麥卡錫的論文後,認為其中的eval
函数可以用機器碼來實作[19],从而创造了一個能工作的Lisp解释器[20]。解释器可以用来运行Lisp程序,或者更恰当的说为:“求值Lisp表达式”[21]。
在1960年发表的LISP I中[22],研究生Daniel Edwards開發了垃圾回收程序,使得在通用計算機上運行Lisp變得可行。在1962年,Timothy Hart與Michael Levin在麻省理工學院以Lisp自身,實做出第一個完整的Lisp編譯器[23]。在1963年,Timothy Hart提议向LISP 1.5增加宏[24]。
在1975年,傑拉德·薩斯曼和蓋伊·史提爾二世开发了Scheme,它是使用词法作用域和尾调用优化的第一个Lisp方言[25]。在1980年代至1990年代期间,蓋伊·史提爾二世、Scott Fahlman、Richard P. Gabriel、David A. Moon和Daniel Weinreb等人,在将当时新近的Lisp方言,其多数是Maclisp的后继者比如ZetaLisp和NIL,统一成单一语言上进行了巨大的努力。新语言Common Lisp,在某种程度上兼容于它所替代的方言。在1994年,ANSI出版了Common Lisp标准《ANSI X3.226-1994信息技术编程语言Common Lisp》。此外还有嵌入到編輯器Emacs中的Emacs Lisp,它非常流行并建立了自己的标准。
自从创始以来,Lisp就密切联系于人工智能研究社群,特别是在PDP-10系统之上[26]。在1970年傑拉德·薩斯曼和特里·威诺格拉德使用Lisp实现了编程语言Micro-Planner[27],它被用在著名的AI系统SHRDLU之中。
在它六十余年的历史中,Lisp产生了在S-表达式语言的核心主旨上的很多变体[28]。此外,每个给定方言又可能有多种实现,例如Common Lisp就有十余种以上的实现。在一种标准化了的方言之内,符合标准的实现支持相同的核心语言,但是有着不同的扩展和函数库。
在方言间的差异可能是非常显眼的,例如定义一个函数[29],Common Lisp使用Maclisp在1969年介入的关键字defun
[30],而Scheme使用它在1975年介入的define
[31]。Richard P. Gabriel和Kent Pitman在1998年的一篇论文中,按采用统一的还是分立的函数与值命名空间,将Lisp家族语言划分为Lisp1和Lisp2(或写为Lisp-1和Lisp-2)[32]。
在1990年代衰退之後,Lisp在2000年之後因一些關注而逐漸復甦。當其他人認為Lisp已經過時陳舊,受到保羅·格雷厄姆和埃里克·雷蒙等人關於Lisp的著作的啟發,很多新的Lisp编程者經常將其描述為令人大開眼界的經驗,並聲稱在本質上比較其它編程語言更有生產效率[50]。這種意識的提高可對比於“人工智能冬季”和Lisp在1990年代中期的短暫增長[51]。
Common Lisp開源社群建立了至今仍活躍的支援基礎有:CLiki,它是收集Common Lisp相關資訊的維基;Planet Lisp,它是收集了各種Lisp相關博客的內容;Common-lisp.net,它是開源專案的託管站點;Quicklisp,它是含括了許多函式庫的裝載管理器。在Common-lisp.net上,推荐了6种开源和2种商业Common Lisp实现[52]。
Scheme社群基于廣泛接納的R5RS語言標準[53],開發了一些活跃至今的實作如Chicken、Gambit、Gauche和STklos等。Scheme实现要求建立了很多準標準函式庫和Scheme擴展功能。随着Scheme實作用戶社群增長,始自2003年的語言標準化過程在2007年產生了R6RS標準[54],在2013年又通过了R7RS-small最终草案[55],它已经有了一些实现支持[56]。使用Scheme介紹計算機科學課程的學校似乎有所減少,麻省理工學院的計算機科學入門課程,已經不再使用Scheme[57][58]。
Clojure是在2007年出現的新近Lisp方言,它编译至Java虚拟机并特别关注并发性。現今與Lisp有關的大多數新活動,包括開發新的跨平台函式庫和應用,都集中在Scheme、Common Lisp、Emacs Lisp、Racket和Clojure的實作上。
近年来又有了幾種新的Lisp方言:Arc、Hy、LFE等等。此外,在2012年出现的Julia语言所采用的语法解析器,是用Scheme方言Femtolisp实现的。
1958 | 1960 | 1965 | 1970 | 1975 | 1980 | 1985 | 1990 | 1995 | 2000 | 2005 | 2010 | 2015 | 2020 | 2025 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
LISP I | LISP 1.5 | |||||||||||||
Maclisp | ||||||||||||||
BBN Lisp | Interlisp | |||||||||||||
Scheme | IEEE 1178 | R5RS | R6RS | R7RS-small | ||||||||||
Lisp Machine Lisp | ||||||||||||||
Franz Lisp | ||||||||||||||
Common Lisp | ANSI Common Lisp | |||||||||||||
Emacs Lisp | ||||||||||||||
AutoLISP | Visual LISP | |||||||||||||
PicoLisp | ||||||||||||||
newLISP | ||||||||||||||
PLT Scheme | Racket | |||||||||||||
ISLISP | ||||||||||||||
Clojure | ||||||||||||||
Arc | ||||||||||||||
LFE | ||||||||||||||
Hy |
Common Lisp和Scheme是Lisp发展的两大主流的代表。这些语言体现了显著不同的设计选择。
Common Lisp是Maclisp的后继者。对它有重要影响的是Lisp Machine Lisp、Maclisp、NIL、S-1 Lisp、Spice Lisp和Scheme[59]。它拥有用于编程Lisp机器的大型Lisp方言Lisp Machine Lisp的很多特征,但设计上能高效的实现在任何个人计算机或工作站上。Common Lisp是通用编程语言,因而拥有一个大型语言标准,包括很多内建数据类型、函数、宏和其他语言元素,以及一个对象系统,即Common Lisp对象系统。Common Lisp还从Scheme借鉴了特定特征,比如词法作用域和词法闭包。Common Lisp实现目标定为不同的平台,比如:LLVM[60]、Java虚拟机[61]、x86-64、PowerPC、Alpha、ARM、Motorola 68000和MIPS[62],和不同的操作系统,比如:Windows、macOS、Linux、Solaris、FreeBSD、NetBSD、OpenBSD、Dragonfly BSD和Heroku[63]。
Scheme是一个静态作用域和适当尾递归的Lisp编程语言方言[64]。它的设计有着非常清晰和简单的语义,和很少的形成表达式的不同方式。它的设计大约比Common Lisp早上一个年代,Scheme是一个相当极简主义的设计。它拥有非常小的标准特征集合,但具有在Common Lisp中未规定的特定实现特征,比如尾递归优化和完全续体。在Scheme中能方便的表达广阔的编程范型,包括指令式、函数式和消息传递风格。Scheme通过一系列的标准,即第n次修订的算法语言Scheme报告,和一系列Scheme实现要求而持续的演化。
Clojure是Lisp的一个新近方言,其目标主要是Java虚拟机、通用语言运行库(CLR)和编译成JavaScript,它被设计为一个务实的通用编程语言。Clojure受到了Haskell的相当大的影响,因而非常强烈的强调了不可变性[65]。Clojure提供了对Java框架和库的访问,具有可选的类型提示和类型推论,这样到Java的调用就可以避免反射并确使了快速的原始操作。Clojure设计上不后向兼容于其他Lisp方言[66]。
进一步的,Lisp方言在很多应用中被用作脚本语言,其中最周知的是在Emacs编辑器中的Emacs Lisp,在AutoCAD中的AutoLISP和后来的Visual Lisp,Audacity中的Nyquist,和LilyPond中GNU Guile。有用的Scheme解释器潜在有很小的大小,使得它特别流行于嵌入式脚本。例子包括SIOD和TinyScheme,二者都曾经以共用名字“Script-fu”成功的嵌入到了GIMP图像处理软件中[67]。LIBREP是John Harper最初基于Emacs Lisp语言开发的Lisp解释器,它已经嵌入到了Sawfish窗口管理器[68]。
Lisp有官方标准化和业界标准的方言:IEEE Scheme[48]、ANSI Common Lisp、ISO ISLISP、R5RS Scheme和R7RS-small Scheme。
Lisp是一个面向表达式编程语言。不同于多数其他语言,在表达式和语句之间不做区分。所有代码和数据都写为表达式。当求值一个表达式的时候,它产生一个值(在Common Lisp中可能有多个值),它可以接着被嵌入到其他表达式中。每个值都可以是任何数据类型的。
McCarthy的1958年论文介入两种类型的语法:符号表达式即S-表达式或sexps,它镜像了代码和数据的内部表示;和元表达式即M-表达式,它是与S-表达式对应的用类似数学符号表达的函数。M-表达式从未得到青睐,几乎所有今天的Lisp都使用S-表达式来操纵代码和数据二者。
大量而单一的使用圆括号,是Lisp与其他编程语言家族最直接明显的差别。为此学生们一直将Lisp戏称为:“迷失在愚蠢的括号中”(Lost In Stupid Parentheses),或“大量烦人的多余括号”(Lots of Irritating Superfluous Parentheses)[69]。但是S-表达式语法也承担了Lisp多数能力:语法极其正规,利于计算机操纵。然而Lisp的语法不局限于传统的括号表示法,它可以扩展为包括可替代表示法。例如,XMLisp是Common Lisp扩展,它采用元对象协议,集成了S-表达式和可扩展标记语言(XML)。
有赖于表达式给予了语言巨大的灵活性。由于Lisp函数都写为列表,它们可以完全就像数据那样处理。这允许了轻易的书写能操纵其他程序的程序,即进行元编程。很多Lisp方言使用宏系统来利用这个特征,它确使了语言扩展而几乎没有限制。
书写Lisp列表,是以空白来分隔其元素,并包围以圆括号。例如,(1 2 foo)
是其元素为三个原子1
、2
和foo
的一个列表。这些值是隐含的有类型的:它们分别是两个整数和叫做“符号”的Lisp专有数据类型,但不需要显式的声明。
空列表()
也表示为特殊原子nil
。这是Lisp中既是原子又是列表的唯一实体。
表示式被写为使用前缀表示法的列表。在列表中第一个元素是一个函数的名字、一个宏的名字、一个lambda表达式或特殊算符的名字(见后)。列表的余下部份是实际参数。例如,函数list
将它的实际参数作为一个列表返回,所以表达式:
* (list 1 2 (quote foo))
(1 2 FOO)
在前面例子中的foo
之前的quote
是特殊算符,它不求值就返回它的实际参数。任何未引述的表达式,在外围表达式被求值之前,都递归的被求值。例如:
* (list 1 2 (list 3 4))
(1 2 (3 4))
注意第三个实际参数是一个列表;列表是可以嵌套的。
对算术算符的对待都是类似的。表达式:
* (+ 1 2 3 4)
10
其在中缀表示法下的等价形式为:1 + 2 + 3 + 4
。
Lisp没有在Algol派生语言中实现的那样的算符概念。在Lisp中算术算符是可变参数函数(或多元函数),能够接受任何数目的实际参数。C-风格的++
增加算符,有时在名字incf
之下实现,给出的语法是:
* (setq x 0)
0
* (incf x)
1
等价于(setq x (+ x 1))
,它返回x
的新值。
特殊算符(有时叫做特殊形式[70])提供了Lisp的控制结构。例如,特殊算符if
接受三个实际参数。如果第一个实际参数为非nil
,它求值为第二实际参数;否则它求值为第三个实际参数。因此表达式:
* (if nil
(list 1 2 "foo")
(list 3 4 "bar"))
(3 4 "bar")
当然,如果在nil
的位置替换上非平凡的表达式会更有用处。
Lisp还提供逻辑算符and
、or
和not
。and
和or
算符进行短路求值,并分别返回它们的第一个nil
或非nil
实际参数:
* (or (and "zero" nil "never") "James" 'task 'time)
"James"
另一个特殊算符lambda
,被用来绑定变量到值,接着对表达式求进行求值。这个算符还被用于建立函数:给lambda
的实际参数是一个形式参数列表,和这个函数要求值的一个或多个表达式,它的返回值是其求值的最后一个表达式的值[71]。表达式:
* (lambda (arg) (+ arg 1))
#<FUNCTION (LAMBDA (ARG)) {5344B3FB}>
求值为一个函数,它接受一个实际参数,绑定它到arg
并返回比这个实际参数大1
的数。对待Lambda表达式于命名函数没有区别;它们以相同方式调用。如下表达式:
* ((lambda (arg) (+ arg 1)) 5)
6
这里我们做了一次函数应用:我们通过传递给它值5
而执行了这个匿名函数。
命名函数是通过使用defun
宏[30],将一个lambda表达式存储在一个符号之中而建立的:
* (defun foo (a b c d) (+ a b c d))
FOO
(defun f (a) b...)
在全局环境中定义一个名为f
的新函数。它在概念上类似于表达式:
* (setf (fdefinition 'f) #'(lambda (a) (block f b...)))
#<FUNCTION (LAMBDA (A)) {5344BA1B}>
这里的setf
是一个宏[72],用来设置第一个实际参数fdefinition 'f
为一个新的函数对象。fdefinition
是对命名为f
的函数的全局函数定义。#'
是特殊算符function
的简写,它返回指定函数在当前词法环境下的一个函数对象[10]。
按照变量的作用域[73],可将Lisp家族划分为两大支系,分别使用动态作用域[74],或使用静态(也叫做词法)作用域[75]。Scheme、Common Lisp[76]和Clojure缺省使用静态作用域,而AutoLISP、PicoLisp[77]和newLISP[78]使用动态作用域。Emacs Lisp自从Emacs版本24.1起使用动态和词法作用域二者[79]。
在最初的LISP中,有两种基础数据类型:原子和列表。列表是元素的一个有限有序序列,这里的每个元素要么是一个原子要么是一个列表,而原子要么是一个数要么是一个符号。符号实质上是唯一性命名的项目,在源代码中写为字母数字串,并被要么用作一个变量名字要么符号处理中的一个数据项目。例如,列表(FOO (BAR 1) 2)
包含三个元素:符号FOO
、列表(BAR 1)
和数2
。
在原子和列表之间的本质区别是原子是不可变的和唯一性的。出现在源代码中不同位置的两个原子,如果以完全相同方式写成则表示相同的对象,而每个列表都是一个分立的对象,它们可以独立于其他列表而改变 ,并可以通过比较算符而区分于其他列表。
随着后来的Lisp介入了更多的数据类型,和编程风格的演化,原子的概念失去了重要性。很多方言出于遗产兼容性而保留了谓词atom
,定义它为对不是cons
的任何对象都为真。
Lisp列表被实现为单向链表[80]。这个链表的每个单元都叫做cons
(在Scheme中叫做pair
),它构成自两个指针,分别叫做car
和cdr
。
在众多可以用cons
单元构建的数据结构中,最基本一个叫做“适当列表”(proper list)。适当列表要么是特殊的nil
(空列表)符号,要么是一个cons
,它的car
指向一个数据项(它可以是另一个cons
结构比如一个列表),而cdr
指向另一个适当列表。
如果一个给定cons
被接受为一个链表的头部,那么它的car
指向这个列表的第一个元素,而它的cdr
指向这个列表的余下部份。为此,在提及作为链表(而非树等)一部份的cons
的时候,car
和cdr
函数也分别叫做first
和rest
。
因此,Lisp列表不是原子对象,它们类似C++或Java中的容器类的实例。一个列表就是链接的cons
的一个聚集。引用一个给定列表的变量,简单的就是到列表中第一个cons
的指针。遍历一个列表可以通过逐一cdr
这个列表来进行,就是说连续的选取cdr
来访问这个列表的每个cons
;或者通过使用任何一个将一个函数映射在一个列表之上的高阶函数。
由于cons
和列表在Lisp系统中是普遍性的,经常有人误解它们是Lisp的唯一数据结构。事实上,除了最简单者之外的所有Lisp都有其他数据结构,比如向量(数组)、散列表、结构等等。
圆括号的S-表达式表示了链表结构。有多种方式将相同的列表表示为一个S-表达式。cons
可以用“点对表示法”写为(a . b)
,这里的a
是car
而b
是cdr
。更长的适当列表可以用点对表示法写为(a . (b . (c . (d . nil))))
。这通常简写为列表表示法的(a b c d)
。“不适当列表”(improper list)[81],可以用这二种表示法的组合来书写,比如列表(a b c . d)
有三个cons
,最后的cdr
是d
,它就是完全特殊形式下的(a . (b . (c . d)))
。
Lisp提供很多内建的过程,用来访问和控制列表。列表可以直接用list
过程创建,它接受任何数目的实际参数,并返回这些实际参数的列表:
* (list 1 2 'a 3)
(1 2 A 3)
* (list 1 '(2 3) 4)
(1 (2 3) 4)
由于列表是从cons对构造而来,可以使用cons
过程来在一个列表的前端增加一个元素。注意由于列表构造方法,cons
在处理列表实际参数上是不对称的:
* (cons 1 '(2 3))
(1 2 3)
* (cons '(1 2) '(3 4))
((1 2) 3 4)
append
过程将两个(或更多)列表相互附加。由于Lisp列表是链表,附加两个列表有渐进时间复杂度 :
* (append '(1 2) '(3 4))
(1 2 3 4)
* (append '(1 2 3) '() '(a) '(5 6))
(1 2 3 A 5 6)
Lisp列表,作为单向链表,可以相互共享结构。就是说,两个列表可以有相同的尾部,或者最终的cons
序列。例如,在执行下列Common Lisp代码之后:
* (setf foo (list 'a 'b 'c))
(A B C)
* (setf bar (cons 'x (cdr foo)))
(X B C)
尾部(b c)
在两个列表中都是相同的结构。它不是复件;对于两个列表指向b
和c
的cons
单元都在相同的内存位置。
共享结构而非复制可以得到相当客观的性能提升。但是这种技术可能以未预期的方式,交互于改变作为实际参数传递给它的列表的那些函数。改变一个列表,比如替代c
为goose
,将会影响另一个列表:
* (setf (third foo) 'goose)
GOOSE
* bar
(X B GOOSE)
不仅变更foo
,还变更了bar
,这可能是未预期的结果。这是缺陷的来源,为此改变它们的实际参数的那些函数被文档标示为破坏性的(destructive)。
函数式编程爱好者避免破坏性函数。在青睐函数式风格的Scheme方言中,破坏性函数的名字都标记了警告性感叹号,或者叫做“bang”,比如set-car!
(读作set car bang),它替换一个cons
的car
。在Common Lisp方言中,破坏性函数是司空见惯的,与set-car!
等价的是rplaca
,它的名字表示“replace car”。这个函数是不常见的,因为Common Lisp包括了一个特殊设施setf
[72],用来轻易的定义和使用破坏性函数。在Common Lisp中常见的风格是在构建原型的时候写函数式代码(没有破坏性调用),接着将破坏性调用作为优化增加于可以安全的进行它们的地方。
Lisp求值用户录入的表达式。符号和列表求值为某个其他(通常更简单的)表达式,例如:一个符号求值为它指名的变量的值;(+ 2 3)
求值为5
。但是,多数其他形式求值为其自身:如果录入5
到Lisp中,它返回5
。
任何表达式都可以加上防止被求值的标记,这对于符号和列表是需要的。特殊算符quote
承担了这个角色,它也简写为'
(一个单引号)。例如,通常如果录入了符号foo
,它返回对应变量的值(没有这个变量则为一个错误)。要引用这个文字符号,录入要么(quote foo)
,要么更常见的'foo
[38]。
Common Lisp和Scheme二者还支持“反引述”(backquote)算符(在Scheme中叫做准引述(quasiquote),这时录入`
字符(重音符)。它几乎同于普通引述,除了它允许表达式被求值,并将它们的值插入到引述列表之中,这些表达式标记了,
(逗号)表示去引述(unquote),或,@
(逗号-at)表示拼接算符(unquote-splicing)。如果变量snue
有值(bar baz)
,则`(foo ,snue)
求值为(foo (bar baz))
,而`(foo ,@snue)
求值为(foo bar baz)
。反引述经常用于定义宏展开[82][83]。
自求值形式和引述形式是Lisp中文字的等价者。在程序代码中可以修改(可变)文字的值。例如,如果一个函数返回一个引述形式,而调用这个函数的代码修改这个形式,这可以改变这个函数在后续调用时的行为:
* (defun should-be-constant ()
'(one two three))
SHOULD-BE-CONSTANT
* (let ((stuff (should-be-constant)))
(setf (third stuff) 'bizarre))
BIZARRE
* (should-be-constant)
(ONE TWO BIZARRE)
像这样修改一个引述形式通常被认为是不良风格,并且被ANSI Common Lisp定义为是危险的。它会导致在编译文件中的未定义的行为,因为文件编译器可以合并类似的常量并将它们放置到写保护内存中,等等。
Lisp的引述形式化已经被Douglas Hofstadter(在《Gödel, Escher, Bach》中)和其他人注解为自引用的哲学想法的例子。
Lisp最初有很少的控制结构,但是在语言演化期间却增加了很多。Lisp最初的条件算符是cond
[9],它或被视为后来的if-then-else
结构的先驱。
Scheme方言的编程者经常使用尾递归表达循环。Scheme在学术计算机科学中的通行性,导致了一些学生相信尾递归是在Lisp中书写迭代的唯一的或最常用的方式,但是这是不正确的。所有常见的Lisp方言都有指令式风格的迭代构造,从Scheme的do
循环到Common Lisp的复杂的loop
表达式。此外,使之成为客观而非主观事物的关键要点,是Scheme对尾递归的处理提出了特殊要求,Scheme通常鼓励使用尾递归的原因,是语言定义明确的支持了这种实践。与之相反,ANSI Common Lisp不要求常称为尾递归消除的这种优化[84]。因此,不鼓励将尾递归风格作为使用更传统的迭代构造(比如do
、dolist
或loop
)的替代品[85]。在Common Lisp中不只是风格偏好的问题,而是潜在的效率问题,这是因为在Common Lisp中明显的尾递归可能未被编译为简单的jump
;并且也是程序正确性问题,这是因为在Common Lisp中尾递归可能增加栈的使用而有堆栈溢出风险。
一些Lisp控制构造是特殊算符,等价于其他语言的语法关键字。使用这些算符的表达式与函数调用有着相同的表面外观,但是不同之处在于参数不是必须求值的,或者在迭代表达式的情况下,可以被求值多于一次。
对比于多数其他主要编程语言,Lisp允许使用语言自身实现控制结构。一些控制结构被实现为Lisp宏,想知道它们是如何工作的编程者甚至可以通过宏展开来研究。
Common Lisp和Scheme二者都有非局部控制流程算符。在这些算符中的不同是在这两种方言之间最深的差异。Scheme使用call/cc
过程支持可重入的续体,它允许一个程序保存(并在将来恢复)执行中的特定位置。Common Lisp不支持可重入的续体,但是支持处理逃脱续体的一些方式。
相同的算法在Lisp中经常可以用要么指令式要么函数式风格来表达。如上所述,Scheme趋于青睐函数式风格,使用尾递归和续体来表达控制流程。但是,指令式风格仍是很有可能的。很多Common Lisp编程者偏好的风格,可能让使用结构化编程语言比如C的编程者看着更加熟悉,而Scheme编程者偏好的风格更加密切类似于纯函数式编程语言比如Haskell。
由于Lisp在列表处理上的早期遗产,它拥有与在序列上迭代有关的一组广泛的高阶函数。在其他语言中需要显式循环(比如C中的for
循环)的很多情况下,在Lisp和很多函数式编程语言中,相同的任务可以通过高阶函数来完成。
一个好的例子是在Scheme中叫做map
而在Common Lisp中叫做mapcar
的函数。给定一个函数和一个或多个列表,mapcar
按顺序将这个函数依次应用到这些列表的元素之上,并将结果收集入一个新的列表:
* (mapcar #'+ '(1 2 3 4 5) '(10 20 30 40 50))
(11 22 33 44 55)
这个mapcar
函数将+
函数应用于每个对应的元素对之上。
在Lisp和其他语言之间的基本区别是,在Lisp中一个程序的文本表示,简单的是人类可读的描述,它同于底层Lisp系统使用的内部数据结构(链表、符号、数、字符等)。
Lisp利用这一点来实现了一个非常强力的宏系统。就像其他宏语言比如C,一个宏返回可以接着被编译的代码。但是不同于C的宏,Lisp的宏是函数因而可以利用Lisp的全部能力。
进一步的,因为Lisp代码作为列表有着相同的结构,宏可以使用语言中任何列表处理函数来建造。简要的说,Lisp可以在数据结构上做的任何事情,Lisp宏都可以在代码上做。相反的,在多数其他语言中,解析器的输出是纯粹的内部于语言实现的而不能被编程者操纵。
这个特征可以在语言中开发高效语言。例如,Common Lisp对象系统可以使用宏清晰的实现为一个语言扩展。这意味着如果一个应用需要不同的继承机制,它可以使用不同的对象系统。这直接的对立于多数其他语言;例如,Java不能支持多重继承并且没有增加它的合理方式。
在简单的Lisp实现中,这个列表结构被直接的解释来运行这个程序;一个函数是在文字上的一段列表结构,它被解释器在执行它的时候遍历。但是,多数后来的Lisp系统还包括一个编译器。编译器将列表结构转换成机器代码或字节码用于执行。这个代码可以像用常规语言比如C编译的代码一样快速。
宏在编译步骤之前展开,因而提供一些有价值的选项。如果一个程序需要一个预先计算了的表格,那么一个宏可以在编译时间建立这个表格,所以编译器只需要输出这个表格,而不需要在运行时间调用代码来建立这个表格。一些Lisp实现甚至拥有一种eval-when
机制,允许代码在编译时间期间出现(在一个宏需要它的时候),而不出现在发行的模块中[86]。
Lisp语言经常被以交互式命令行来使用,它还可以结合入集成开发环境(IDE)。用户在命令行录入表达式,或指示IDE将它们传送给Lisp系统。Lisp读取录入的表达式,求值它们,并打印结果。为此,Lisp命令行被叫做读取﹣求值﹣输出循环(REPL)。
REPL的基本操作描述如下。这是一个简化的描述,省略了很多真实Lisp的元素,比如引述和宏。
read
函数接受文本的S-表达式作为输入,并将它们解析为内部数据结构。例如,如果你在提示符下录入文本(+ 1 2)
,read
将它转换成有三个元素的一个链表:符号+
、数1
和数2
。恰巧这个列表也是一段有效的Lisp代码,就是说它是可以被求值的。这是因为car
这个列表指名了一个函数即加法运算。
注意foo
将被读作一个单一符号。123
将被读作数一百二十三。"123"
将被读作字符串"123"
。
eval
函数求值数据,返回零或多个其他Lisp数据作为结果。求值不必然意味着解释;一些Lisp系统编译所有的表达式为机器代码。但将求值描述为解释是很简单的:要求值其car
指名一个函数的一个列表,eval
首先求值在它的cdr
中的每个实际参数,接着应用这个函数于这些实际参数。在这个案例中,这个函数是加法,而应用它于实际参数列表(1 2)
产生答案3
。这是这个求值的结果。
符号foo
求值为符号foo
的值。数据比如字符串"123"
求值为相同的字符串。列表(quote (1 2 3))
求值为列表(1 2 3)
。
print
函数的工作是将输入表示给用户。对于简单结果比如3
这是平凡的。求值为一段列表结构的一个表达式会要求print
遍历这个列表并将结果输出为一个S-表达式。
要实现一个Lisp REPL,必需的只是实现这三个函数和一个无限循环函数。实现eval
函数会很复杂是自然的,因为它必须也要实现所有特殊算符比如if
或lambda
。它们完成后,一个基本的REPL就是一行代码:(loop (print (eval (read))))
。
Lisp REPL典型的也提供输入编辑、输入历史、错误处理和到调试器的接口。
Lisp通常使用及早求值。在Common Lisp中,实际参数以应用式次序(最左最内为先)求值,而在Scheme中实际参数的次序是未定义的,为编译器优化留下了余地[87]。
保罗·格雷厄姆辨识出Lisp区别于其他现存的语言如Fortran的九个重要特征[88]:
Lisp是将程序代码的结构忠实而直接的表示为标准数据结构的第一个语言,这种品质后来被称为“同像性”。故而Lisp函数可以在Lisp程序中被操纵、更改、甚至创建,而不用低层操纵。 这通常被认为是语言表达能力方面的主要优势之一,使得语言适合于语法宏和元循环求值。
条件表达式是麦卡锡用Fortran写一个象棋程序时发明的,他提议将其包含在ALGOL中但未被采纳[89]。Lisp中的条件表达式使用了一般性的cond
结构,ALGOL 60采纳了约翰·巴科斯提议的if–then–else条件语句并使之流行起来[9]。
Lisp深刻影响了艾伦·凯[90],他是在Xerox PARC开发Smalltalk的研究组的领导者;反过来Lisp又受到Smalltalk的影响,其后来的方言在1970年代接纳了面向对象编程特征,包括有继承的类、封装的实例、消息传递等。Flavors对象系统介入了多重继承和混入的概念。Common Lisp对象系统(CLOS)提供了多重继承、具有多分派的多方法、和头等泛化函数,从而产生了一种灵活而强力形式的动态分派。CLOS充当了很多后来的包括Scheme在内的Lisp的对象系统的模板,它经常通过Gregor Kiczales等人发展出的元对象协议来实现,这是一种反射式元循环设计[91],其中的对象系统依据自身来定义。由于这些特征的融合,Lisp成为Smalltalk之后第二个具有元对象系统的语言。多年以后艾伦·凯宣称,只有Smalltalk和Lisp可以视为完全意义上的面向对象编程系统[92]。
Lisp介入了自动垃圾回收的概念,即系统巡视堆来寻找无用的内存。现代复杂的垃圾回收算法比如分代垃圾回收的进步,受到了它在Lisp中使用的激励[93]。
艾兹赫尔·戴克斯特拉在他的1972年图灵奖演讲中说道:
具有一些非常基本的原理作为基础,它[LISP]已经展示出卓越的稳定性。除此之外,LISP已经承载了相当可观的在某种意义上我们最复杂的计算机应用。LISP被玩笑的描述为“滥用计算机的最明智方式”。我认为这个描述是一种巨大的赞美,因为它传达了解放的全部意味:它辅助大量我们最有天赋的人类同胞去思考在以前不可能的想法。[94]
很大程度上由于它对于包括早期微处理器在内的早期计算机硬件的资源需求,Lisp未能像Fortran和ALGOL后裔C语言那样在人工智能社区之外得以流行。由于它适合于复杂和动态的应用,Lisp在2010年代享有了一定程度的大众关注的复兴[95]。
(quote x)
返回x
,通常简记为'x
:
* (quote a)
A
* 'a
A
* (quote (a b c))
(A B C)
(atom x)
当x
是一个atom
或者空的list
时返回原子t
,否则返回NIL
。在Common Lisp中通常习惯用原子t
列表示真,而用空列表()
或NIL
列表示假。例如:
* (atom 'a)
T
* (atom '(a b c))
NIL
* (atom '())
T
atom
是需要求出实际参数值的算符,下面展示quote
算符的作用,即通过引述一个列表,避免它被求值(eval
)。一个未被引述的列表达式作为实际参数,atom
会将其视为代码,例如:
* (atom (atom 'a))
T
这是因为(atom 'a)
已求值出结果t
,把它代入(atom (atom 'a))
,成为(atom t)
,从而这个列表达式的结果是t
。
反之一个被引述的列表,仅仅被视为列表,例如:
* (atom '(atom 'a))
NIL
引用看上去有些奇怪,因为很难在其它语言中找到类似的概念,但正是这一特征构成了Lisp最为与众不同的特点:代码和数据使用相同的结构来列表示,只是用quote
来区分它们。
(eq x y)
当x
和y
指向相同的对象的时候返回t
,否则返回NIL
,例如:
* (eq 'a 'a)
T
* (eq 'a 'b)
NIL
* (eq '() '())
T
* (eq '(a b c) '(a b c))
NIL
值得注意的是在Common Lisp中,原子对象在内存中只会有一份拷贝,所以(eq 'a 'a)
返回t
。
(car x)
要求x
是一个列表,它返回x
中的第一个元素,例如:
* (car '(a b))
A
(cdr x)
同样要求x
是一个列表,它返回x
中除第一个元素之外的所有元素组成的列表,例如:
* (cdr '(a b c))
(B C)
(cons x y)
预期y
的值是一个列表,并且返回包含x
的值和随后y
的值的那些元素的一个列表,例如:
* (cons 'a 'b)
(A . B)
* (cons 'a (cons 'b 'c))
(A B . C)
* (cons 'a (cons 'b ()))
(A B)
* (cons 'a (cons 'b (cons 'c ())))
(A B C)
(cond (p1 e1) ...(pn en))
的求值规则如下:对“条件列表达式p
”依次求值,直到有一个返回t
。如果能找到这样的p
列表达式,相应的“结果列表达式e
”的值,作为整个cond
列表达式的返回值。例如:
* (cond ((eq 'a 'b) 'first) ((atom 'a) 'second))
SECOND
已经有各种对象系统和模型建造在Lisp之上、旁边或其中,包括:
这个Hello World!例子展示Lisp的三种主要方言,在基本输出和函数定义上的用法:
Scheme | Common Lisp | Clojure |
---|---|---|
;; 显示过程在屏幕中打印字符串
;; 并返回未规定值
(display "Hello, world!")
;; 定义过程hello-world
(define (hello-world)
(display "Hello, world!"))
;; 调用过程hello-world
(hello-world)
|
;; 格式化函数在第一个参数是t时,
;; 在屏幕中打印字符串,并返回NIL
(format t "hello, world!")
;; 定义函数hello-world
(defun hello-world ()
(format t "hello, world!"))
;; 调用函数hello-world
(hello-world)
|
;; 打印函数在屏幕中打印字符串
;; 并返回nil
(print "hello, world!")
;; 定义函数hello-world
(defn hello-world []
(print "hello, world!"))
;; 调用函数hello-world
(hello-world)
|
Lisp语法自然的适合于递归。数学问题比如递归定义集合的枚举,在这种表示法中表达是很容易的。例如,要求值一个数的阶乘:
(defun factorial (n)
(if (zerop n) 1
(* n (factorial (1- n)))))
下面的版本在底层Lisp系统进行尾递归优化时比前面版本取用更少的堆栈空间:
(defun factorial (n &optional (acc 1))
(if (zerop n) acc
(factorial (1- n) (* acc n))))
对比上述例子,下面的指令式版本使用了Common Lisp的loop
宏:
(defun factorial (n)
(loop for i from 1 to n
for fac = 1 then (* fac i)
finally (return fac)))
下列函数反转一个列表。它与Lisp内建的reverse
函数做同样的事情:
(defun -reverse (list)
(let ((return-value))
(dolist (e list) (push e return-value))
return-value))
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.