沙普利-福克曼引理

凸幾何的引理 来自维基百科,自由的百科全书

沙普利-福克曼引理

沙普利-福克曼引理凸几何英语Convex geometry的一条引理,其于数理经济学有应用。引理描述向量空间子集闵可夫斯基和有何性质。若干个集合的闵可夫斯基和,即从各集合分别取一个元素相加,组成的集合:例如,将整数组成的集合,与自身相加,得到由组成的集合,以符号可写成:

Thumb
此处以四个集合的闵可夫斯基和为沙普利-福克曼引理的例证。在左边,四个非凸集中的点(+)之和,就是右边,其闵氏和凸包中的点(+)。左边四点之中,有两点位于相应的非凸集中,另有两点位于非凸集的凸包中。各凸包以浅粉红色画出。原来的集合各只有两点(以红点表示)。[1]

“许多个集合的闵氏和,是否必定近似凸集?”沙普利-福克曼引理和相关的结果表明,问题的答案为肯定。[2]集合称为,意思是连接其中任意两点的线段,必为该集合的子集:举例,实心圆盘  为凸集,但  则不然,因为连接相异两点的线段  并不是圆的子集。沙普利-福克曼引理大致断言,若求和项的数目超出向量空间的维数,则其闵氏和将近凸。[1]

沙普利-福克曼引理引入时,是作为证明沙普利-福克曼定理的一步,该定理断言闵氏和与其凸包距离不超过某个上界。所谓集合凸包,是包含的最小凸集。而当且仅当和为凸时,上述距离为零。定理中,距离的上界取决于维数及求和项的形状,但不取决于求和的项数,而只需。只要其中个求和项的形状,就足以确定个集合的闵可夫斯基平均

与其凸包的距离的上界。当趋向无穷时,该上界递减至零(需要各求和项的大小一致有界)。[3]斯塔(Starr)的推论将沙普利-福克曼定理的上界压得更低,故又称为沙普利-福克曼-斯塔定理

劳埃德·沙普利强·福克曼英语Jon Folkman的引理,最先由经济学家罗斯·斯塔英语Ross Starr发表,其时斯塔正在肯尼斯·阿罗门下,研究经济均衡的存在性。[1]斯塔在论文中,研究凸化(convexified)经济体,即将非凸集换成其凸包。斯塔证明,凸化之后,有些均衡由原经济体的“准均衡”(quasi-equilibria)逼近;还证明,每个准均衡都具有真均衡的许多最优性质,而凸经济体中则必定存在真均衡。斯塔1969年的论文发表后,沙普利-福克曼-斯塔的结果得到广泛应用,用作证明(凸)经济理论的若干核心结果,尽管不适用于有非凸部分的大经济体,但在此等经济体中,仍是良好的近似。罗歇·盖内里英语Roger Guesnerie评论:“这些结论的一般形式的推导,是战后经济理论的重大成就。”[4]许多诺贝尔奖得主都曾研究经济学中的非凸集英语Non-convexity (economics),除了前述的劳埃德·沙普利(2012年获奖)外,还有:阿罗(1972)、罗伯特·约翰·奥曼(2005)、杰拉德·德布鲁(1983)、特亚林·科普曼斯(1975)、保罗·克鲁曼(2008)、保罗·萨缪尔森(1970)。至于互补的主题“经济学中的凸集英语Convexity in economics”,除以上得主著重外,还有里奥尼德·赫维克兹列昂尼德·维塔利耶维奇·康托罗维奇(1975)、罗伯特·索洛(1987)都著重。

沙普利-福克曼引理在优化论概率论皆有应用。[3]优化论中,可以引理解释,在求多个函数之和的最小值时,为何一些解法可以成功。[5][6]概率论中,引理适用于证明随机集英语Stochastic geometry的“大数定律”。此定理先前仅在凸集的情况得证。[7]

简单例子

考虑凸的实数区间,其包含整数子集,且是其凸包(添加了两点所连线段上的所有点)。仅得两个元素的集合,复制成三份,并按元素求和,得到

(此处集合的和,是从各集合分别取一个元素相加,得到的可能结果的集合,称为闵氏和。)和集的凸包则为区间

区间中,每个数都可以写成区间中某三个实数(允许重复)之和,例如将等分成三份即可。但使用沙普利-福克曼引理,则有更强的结论:的每个数,都可以写成中某两个整数(允许重复),与中某一个实数之和。[8]

凸包中的点,到的距离,至多为

然而,考虑三个区间的闵氏平均

与其凸包的距离,仅为,即未平均前距离()的三分之一。越多个集合相加,其闵氏平均就将凸包填得越满:由闵氏平均至凸包的最远距离,随被加项数增加,而趋向于零。[8]此为沙普利-福克曼定理的结论。

前置概念

沙普利-福克曼引理需要用到凸几何英语convex geometry的若干定义和定理,本节将作简介。

实向量空间

向量空间上,有笛卡儿坐标系,将每点视为一对实数,称为“坐标”,按惯例记为。笛卡儿平面上的两点,可以逐个坐标相加

此外,点也可以逐个坐标与实数相乘

更一般而言,任何维(有限维)实向量空间,均可视为个实数组成的D元组的集合,并配备两种运算向量加法标量乘法。有限维实空间的此两种运算,皆定义成逐个坐标运算,与笛卡儿平面上的运算类似。[9]

凸集

Thumb
凸集中,连接任意两点的线段仍是的子集。
Thumb
非凸集中,连接某两点的线段上,有一点不再是的元素。
线段可以检验某集合是否凸集

实向量空间中,非空子集称为凸集,意思是,对于的任意两个点,连接两点成一线段,其上的所有点仍在中。例如,实心圆盘  为凸,但  则不然,因为连接相异两点的线段  并不是圆的子集。三个整数的集合非凸,但其为区间的子集,而该区间为凸。又例如,实心立方体为凸,然而任何空心或凹陷的图形,如弯月形英语Crescent,则非凸。空集也是凸集,视乎作者偏好,这可能是专门的定义[10],也可能是因为要满足的条件是空真命题英语Vacuous truth

更严谨而言,集合称为,意思是,对中任意两点,和单位区间中的任意实数,点

仍是元素

数学归纳法,集合为凸,当且仅当其任意多个元素的凸组合仍在中。所谓向量空间子集凸组合,是其元素的任意加权平均,而各可以是总和为的任意非负实数,即只需[11]

凸集的定义推出,两个凸集的交集仍是凸集。更甚者,任意一族凸集的交也是凸集。作为特例,若取两个不交的凸集,则其交集为空集,故应当称空集为凸。[10]

凸包

Thumb
红色集的凸包中,每个蓝点都是若干个红点的凸组合

对于实向量空间的每个子集,其凸包是包含最小凸集。所以,是所有覆盖的凸集的交。等价地,可以将定义成的点的所有凸组合的集合。[12]作为例子,整数集合的凸包,是实数区间,其两端为原有的整数[8]单位圆的凸包则是闭单位圆盘,其包含单位圆。

闵可夫斯基和

Thumb
集合的闵可夫斯基和。两个小正方形的和,是大正方形

在任何向量空间(或有定义加法的代数结构)中,两个非空子集闵可夫斯基和,定义为其元素之和的集合,即 (参见[13])。例如:

此运算定义在非空子集族上,且满足结合律交换律。既然有结合律和交换律,就可以递归定义多个被加项的运算结果。由数学归纳法,可见[14]

闵可夫斯基和的凸包

闵可夫斯基和与凸包运算可以交换。具体而言,对实向量空间的任意子集,其闵氏和的凸包等于其凸包的闵氏和。换言之,

故由数学归纳法得

对任意和非空子集)成立。[15][16]

各命题的叙述

Thumb
闵氏和及凸包。右图的十六个红点,组成左图四个非凸集的闵氏和。左图每个非凸集由两个红点组成,其凸包(浅粉红色)包含标记加号(+)的点,而右图中的加号等于左图各个标加号的点之和。

由前一段的恒等式,对和的凸包中的每点,都存在各凸包的取遍),使得。各点的位置取决于

引理

Thumb
劳埃德·沙普利,2012年诺贝尔经济学奖得主。他与强·福克曼英语Jon Folkman一同证明沙普利-福克曼引理。[1]

有了以上背景,沙普利-福克曼引理断言,的表示法

仅需要不多于个被加项取自凸包,而其他被加项,则只需取自原来的集合。以符号复述,即有以上方法表示,且满足。不妨将下标重新排序,然后就有

其中对,有,而对,则有。注意,倘若重排,则排序的方式也取决于点[17]再精简,沙普利-福克曼引理可以写成

举例,集合中的每个点,根据引理,必定可以写成的某个元素,与的某个元素之和。[8]

实向量空间的维数

反之,沙普利-福克曼引理刻划了有限维实向量空间的维数。具体而言,若某向量空间,对于某个自然数满足引理的结论,但对小于的数不满足,则其维数恰好为[18]引理仅对有限维向量空间成立。[19]

沙普利-福克曼定理及斯塔的推论

Thumb
某点集(深红)的凸包以浅红虚线围起。点集的内半径(绿色)必定小于其外接圆半径(蓝色),除非所有点共圆,此时两个半径相等。

沙普利与福克曼运用其引理,证明沙普利-福克曼定理,给出集合的闵氏和与其凸包(称为凸化(convexified)和)的距离上界。定理的叙述如下:

凸化和的任一点,到(未凸化)和集欧氏距离平方,不超过各集合的外接半径中,最大个的平方和。(所谓外接半径,定义为包围该集合的最小球面的半径。)[20]此上界与求和项数无关(但要求,且集合不能越来越大)。[21]

上述定理给出闵氏和及其凸包之间距离的上界。当且仅当闵氏和为凸集时,此距离为零。该上界取决于维数及各被加项的形状,但只要,就不取决于项数[3]

通常,外接半径会大于内半径,而无论如何,外接半径总不能小于内半径。集合内半径定义为:[22]

最小的正实数,满足:若凸包中,则若干点的凸包中,而该些点皆在同一个半径为内。

斯塔将沙普利-福克曼定理中的外接半径换成内半径,从而压低沙普利-福克曼定理的上界:

沙普利-福克曼定理的斯塔推论

凸化和的任一点,到(未凸化)和集的欧氏距离平方,不超过各集合的内半径中,最大个的平方和。[22][23]

斯塔的推论确定,个集合的闵氏和与其凸包之间,欧氏距离的上界。此距离可以衡量闵氏和非凸的程度,故为简单起见,下文称为非凸度。于是,斯塔对非凸度的上界,仅取决于个最大内半径之值,但不取决于求和的项数(假设)。


例如,非凸集的非凸度为,因为与其凸包(区间)的距离为

所以,既然的非凸度有不取决于项数的上界,就知平均集

非凸度上界,会随增加而递减。例如,平均集

和其凸包的距离仅为,等于被加项与其凸包的距离()之半。仅要最大个求和项的形状,已足以计算和集与凸包的距离的上界,故除以后,平均集与凸包的距离,在趋向无穷时,会递减至零(对均匀有界的求和项成立,即各个求和项的大小需有同一个上界)。[3]若使用斯塔的上界,则前一句结论的条件可以放宽,只需各求和项的内半径有同一个上界。[3]

证明和计算

沙普利-福克曼引理的原证明,仅确定存在该种表示法,而无说明如何构造阿罗哈恩[24]盖士利英语J. W. S. Cassels[25]、斯奈德(Schneider)[26]和其他人都曾给出类似的证明。阿特斯泰因(Artstein)扩展了埃科兰德英语Ivar Ekeland的简洁抽象证明。[27][28]也有未经出版的另证。[2][29]1981年,斯塔发表一种叠代法,可以计算给定点的表示法,然而,此计算方法给出的上界,较非构造性证明的上界差。[30]博赛卡斯的书有讲述有限维空间沙普利-福克曼引理的初等证明,[31]并将引理应用于估计可分优化(separable optimization)问题与零和赛局对偶间隙

应用

有沙普利-福克曼引理,学者就得将有关凸集闵氏和的结果,套用到(无需凸的)一般集合之和。此种和见于经济学最优化理论概率论。此三领域的应用中,非凸性起到重要作用。

经济学

Thumb
消费者偏好位于无差异曲线上的任意篮子,胜过位于上的篮子。篮子,是预算线(蓝色)支撑的位置,所以是最优而又可行。相反,虽然消费者更偏好上的任意篮子,但无足够预算,所以并不可行。

经济学中,消费者对每一“篮子”商品(basket,即商品的组合)有其偏好程度。每篮子可用一个非负向量表示,其坐标为篮中各商品的量。所有篮子组成的集合中,每个消费者有自己的一族无差异曲线,满足:在同一条曲线上的各篮子,对该消费者是等价的,即消费者并不觉该曲线上有篮子胜于另一个篮子。每篮子恰好处于一条无差异曲线上。消费者相对于一条无差异曲线的偏好集,定义为该无差异曲线与其更偏好的区域的并集。称消费者的偏好为,意思是其所有偏好集皆为凸。[32]

如图所示,消费者认为的最优篮子,是在预算线支撑某个偏好集时取到,因为此时,所选的篮子是整条预算线上,达到最高的无差异曲线的一点。所谓预算线,是由商品的价格向量与消费者的收入计算得出的限制,消费者无足够收入购买高于此线的篮子。所以,最优篮子的集合是各价格的函数,称为消费者的需求。若偏好集为凸,则不论价格为何,消费者认为的最优篮子总是组成凸集,例如可能是单元集,或是一条线段。[33]

非凸偏好

Thumb
若消费者的偏好有凹陷,则消费者的决定可以不连续,从一个篮子跳到另一个隔开的篮子。

然而,若有偏好集非凸,则某些价格确定的预算线,可能在两个分开的最优篮子支撑该偏好集。例如,可以设想,动物园购买狮子或鹰的价钱一样,且其预算恰好够买一只狮子或一只鹰。此外,假设园主亦认为两只动物价值相同,则动物园有可能买狮子,也可能买鹰,但当然不可能买半只狮子加半只鹰(狮鹫)。所以,园主的偏好非凸:买两只动物中的任一只,胜于两者的严格凸组合。[34]

若消费者有非凸偏好集,则对于某些价格,需求不连通。不连通的需求,会导致消费者的行为出现不连续的间断。引述哈罗德·霍特林的话(宜配合所附动图理解):

若考虑波浪形的无差异曲线,即在某些区域向原点凸,而在其他区域向原点凹,则我等被迫推论,仅有向原点凸的部分需要理会,因为几乎不可能观测到其他部分。要侦测该些部分,唯一方法是,观察价格之比率变化时,需求的不连续变化。此变化的效果是,当直线旋转时,切点会突然跃过某凹陷。虽然此种不连续的表现,揭示有凹陷,但却不可能量度缺口的深度。倘若无差异曲线,或其高维推广,有凹陷部分,则定必因永远无法测量,而不为人知。[35]

瓦尔特·迪韦尔特英语Walter Erwin Diewert[36]书中,称赫尔曼·沃尔德英语Herman Wold[37]有强调研究非凸偏好的困难,也引述保罗·萨缪尔森称凹陷处“被永恒的黑暗遮蔽”[38]

尽管有上述困难,《政治经济期刊英语Journal of Political Economy》(JPE)在1959年至1961年间,刊登一系列的论文,解明非凸偏好。投稿人包括:法雷尔(Farrell)[39]巴托尔英语Francis M. Bator[40]科普曼斯[41]、罗森博格(Rothenberg)[42]。其中,罗森博格讨论非凸集和的近似凸性。[43]该些JPE论文,促使劳埃德·沙普利马丁·舒比克也合著论文,研究凸化的消费者偏好,并引入“近似均衡”(approximate equilibrium)的概念。[44]JPE论文和沙普利-舒比克论文又启发了罗伯特·奥曼提出另一个概念,称为“准均衡”(quasi-equilibrium)。[45][46]

斯塔1969年的论文与当代经济学

Thumb
肯尼斯·阿罗(1972年诺贝尔奖得主)帮助罗斯·斯塔英语Ross Starr研究非凸经济体英语Convex preferences[47]

肯尼斯·阿罗收集前人研究经济学中的非凸集英语Non-convexity (economics)的文献,列成表,并加入注解,交给罗斯·斯塔英语Ross Starr。斯塔当时仍是本科生,但已在修读阿罗开设的高等数理经济学(研究生)课程。[47]斯塔在学期论文中,考虑将非凸偏好换成其凸包所得的假想经济体,研究其一般均衡。凸化经济体中,在每个价位,总需求皆是各消费者需求的凸包之和。斯塔的想法吸引数学家劳埃德·沙普利强·福克曼英语Jon Folkman参与,两人“在私人通信中”证明现以两人命名的引理和定理,到1969年,斯塔才于论文报告此事。[1]

斯塔1969年的论文中,应用沙普利-福克曼-斯塔定理,证明“凸化”经济体有一些一般均衡,只要参与者足够多,能以原经济体的“准均衡”近似。具体而言,斯塔证明,至少存在一个价格向量为的准均衡,满足下列条件:

  • 对每个准均衡,所有消费者都可以选到其最优的篮子(在预算限制内,且最偏好)。
  • 在该价格,凸化经济体中,每种商品的市场皆均衡,即供给等于需求。
  • 每个准均衡的价格,皆“几乎出清”原经济体的市场:凸化经济体均衡组成的集合,与原经济体的准均衡集合,两者的距离上界。此结论是根据沙普利-福克曼定理的斯塔推论得到。[48]

斯塔确立以下结论:

“总体中,[取各消费及生产集的凸包]所得的假想经济体的分配,与真实经济体的某个分配,两者的差异,有不取决于参与者数目的上界。因此,当参与者数目趋向无穷时,平均参与者感受到,与拟作行动的偏差,近乎可以忽略不计。”[49]

斯塔1969年论文发表后,沙普利-福克曼-斯塔的结论,在经济理论获广泛应用。罗歇·盖内里英语Roger Guesnerie如此总结该结论对经济学的意义:“假设凸性,所得的若干重要结果,在不具凸性的情况下,仍(近似)适用。例如,若经济体具有大消费侧,则偏好的非凸性不影响适用标准结果”[50],还称“这些结论的一般形式的推导,是战后经济理论的重大成就。”[4]许多诺贝尔奖得主都曾研究经济学中的非凸集英语Non-convexity (economics),除了前述的劳埃德·沙普利(2012年获奖)外,还有:阿罗(1972)、罗伯特·约翰·奥曼(2005)、杰拉德·德布鲁(1983)、特亚林·科普曼斯(1975)、保罗·克鲁曼(2008)、保罗·萨缪尔森(1970)。至于互补的主题“经济学中的凸集英语Convexity in economics”,除以上得主著重外,还有里奥尼德·赫维克兹列昂尼德·维塔利耶维奇·康托罗维奇(1975)、罗伯特·索洛(1987)都著重。[51]

沙普利-福克曼-斯塔的结论,在经济学各分支的文献都经常出现,包括微观经济学[52]一般均衡理论[53][54]公共经济学[55](包括市场失灵[56]博弈论[57]数理经济学[58]、经济学中的应用数学[59][60]。沙普利-福克曼-斯塔的结论,也使经济学更多使用测度论和积分理论。[61]

最优化理论

Thumb
函数称为,意思是图像上方的区域为凸集

沙普利-福克曼引理可以解释,为何大规模的最小化问题,即使非凸,仍可用迭代法近似求解(仅对于凸问题,有证明叠代法收敛到最优解)。沙普利-福克曼引理,促使学者将凸优化方法,用于优化多个(无需凸的)函数之和。[62]

最优化理论的前置概念

非线性规划依赖下列有关函数的若干定义:

  • 函数定义在集合上)的图像,是所有参数与相应取值组成的二元组的集合:
Thumb
正弦函数并非凸函数

举例,二次函数为凸,而绝对值函数亦然,但正弦函数(如图)则不然,因为在区间的盖图非凸(而有向上的凹陷)。

加性优化问题

许多优化问题中,目标函数可分离变数(可分),即是多个函数之和,而各个函数的参数不同,如:

又例如,线性规划问题就可分离变数。考虑一个可分问题,及一个最优解

在该点取到最小值。对此可分问题,同时考虑其“凸化问题”的最优解,即将每个求和项的图像换成其凸包。此种最优解,会是凸化问题的某点列极限,其中

[5][64]

当然,因为此点是个图像凸包的点之和,由沙普利-福克曼引理,就可以写成原图像的点与少数图像凸包的点之和。

以上分析,1974年由埃科兰德英语Ivar Ekeland发表,以解释为何可分问题有许多项时,即使各项非凸,总问题仍看似凸。对非线性最小值问题而言,对偶问题的解,不一定就是原问题的解(但若已知原问题为凸,且满足特定条件,则两者的的最优解相等),但是,1973年,青年数学家克劳德·勒马雷沙尔英语Claude Lemaréchal诧异,对已知非凸的问题使用凸问题的方法,竟然也成功。勒马雷沙尔的问题,正是上段加性可分离变数的形式,而每个和项皆非凸函数,但对偶问题的解,仍近似原问题的最优解。[65][5][66]埃科兰德的分析说明,“大而可分”的最小值问题,即使各和项有凹陷,仍可运用凸优化的方法。埃科兰德及其后的作者主张,因为变数可以加性分离,所得的总问题近似凸。该等著作以沙普利-福克曼引理为关键一步。[5][66][67]沙普利-福克曼引理促使学者将凸优化方法,应用到目标函数为多个函数之和的情况。[5][6][59][62]

概率与测度论

凸集常与概率论一同研究。卡拉西奥多里定理英语Carathéodory's theorem (convex hull)说明,维空间的(非空)子集凸包中的点,是取值于的简单随机向量英语Multivariate random variable的期望值,而所谓简单,意思是仅在不多于个点处有非零概率。所以,对非空集,取值自的简单随机向量组成的集合,等于的凸包。由此便可在概率论中,套用沙普利-福克曼-斯塔的结果。[68]反之,藉期望值与凸包之间的联系,概率论亦能用作研究凸集,尤其可用作分析沙普利-福克曼-斯塔的结果。[69]沙普利-福克曼-斯塔的结果,广泛用于随机集的概率论英语Stochastic geometry[70],例如证明随机集的大数定律[7][71]中央极限定理[71][72]大离差原理英语Large deviations theory[73]。要证明前列概率极限定理,可以使用沙普利-福克曼-斯塔的结果,来避免假设随机集为凸。

概率测度是有限的测度,而沙普利-福克曼引理还可以应用到非概率的测度论,如体积向量测度的理论。沙普利-福克曼引理可以加强布伦-闵可夫斯基不等式英语Brunn–Minkowski theorem。该不等式断言,闵氏和的体积,相较于各和项的体积不能太大,即闵氏和的体积有上界,以各和项的体积的表示。[74]欧氏空间子集的体积,此处定义为其勒贝格测度


高等测度论中,沙普利-福克曼引理适用于证明李亚普诺夫定理,即向量测度值域为凸。[75]值域(或像集)是函数所有可能取值的集合,而向量测度则将测度推广到允许取向量值。例如,若某测度空间有两种概率测度,则可定义一个向量测度,是对每个事件,将其两个概率结合为一个二元组,即

李亚普诺夫定理在经济学[45][76]、(砰砰)控制论统计理论英语Statistical theory皆有应用。[77]李亚普诺夫定理是沙普利-福克曼引理的连续版[3],而沙普利-福克曼引理是李亚普诺夫定理的离散类比[78]

参考文献

外部链结

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.