沙普利-福克曼引理
凸幾何的引理 来自维基百科,自由的百科全书
沙普利-福克曼引理是凸几何的一条引理,其于数理经济学有应用。引理描述向量空间子集的闵可夫斯基和有何性质。若干个集合的闵可夫斯基和,即从各集合分别取一个元素相加,组成的集合:例如,将整数和组成的集合,与自身相加,得到由组成的集合,以符号可写成:

“许多个集合的闵氏和,是否必定近似凸集?”沙普利-福克曼引理和相关的结果表明,问题的答案为肯定。[2]集合称为凸,意思是连接其中任意两点的线段,必为该集合的子集:举例,实心圆盘 为凸集,但圆 则不然,因为连接相异两点的线段 并不是圆的子集。沙普利-福克曼引理大致断言,若求和项的数目超出向量空间的维数,则其闵氏和将近凸。[1]
沙普利-福克曼引理引入时,是作为证明沙普利-福克曼定理的一步,该定理断言闵氏和与其凸包的距离不超过某个上界。所谓集合的凸包,是包含的最小凸集。而当且仅当和为凸时,上述距离为零。定理中,距离的上界取决于维数及求和项的形状,但不取决于求和的项数,而只需。只要其中个求和项的形状,就足以确定个集合的闵可夫斯基平均集
与其凸包的距离的上界。当趋向无穷时,该上界递减至零(需要各求和项的大小一致有界)。[3]斯塔(Starr)的推论将沙普利-福克曼定理的上界压得更低,故又称为沙普利-福克曼-斯塔定理。
劳埃德·沙普利和强·福克曼的引理,最先由经济学家罗斯·斯塔发表,其时斯塔正在肯尼斯·阿罗门下,研究经济均衡的存在性。[1]斯塔在论文中,研究凸化(convexified)经济体,即将非凸集换成其凸包。斯塔证明,凸化之后,有些均衡由原经济体的“准均衡”(quasi-equilibria)逼近;还证明,每个准均衡都具有真均衡的许多最优性质,而凸经济体中则必定存在真均衡。斯塔1969年的论文发表后,沙普利-福克曼-斯塔的结果得到广泛应用,用作证明(凸)经济理论的若干核心结果,尽管不适用于有非凸部分的大经济体,但在此等经济体中,仍是良好的近似。罗歇·盖内里评论:“这些结论的一般形式的推导,是战后经济理论的重大成就。”[4]许多诺贝尔奖得主都曾研究经济学中的非凸集,除了前述的劳埃德·沙普利(2012年获奖)外,还有:阿罗(1972)、罗伯特·约翰·奥曼(2005)、杰拉德·德布鲁(1983)、特亚林·科普曼斯(1975)、保罗·克鲁曼(2008)、保罗·萨缪尔森(1970)。至于互补的主题“经济学中的凸集”,除以上得主著重外,还有里奥尼德·赫维克兹、列昂尼德·维塔利耶维奇·康托罗维奇(1975)、罗伯特·索洛(1987)都著重。
沙普利-福克曼引理在优化论和概率论皆有应用。[3]优化论中,可以引理解释,在求多个函数之和的最小值时,为何一些解法可以成功。[5][6]概率论中,引理适用于证明随机集的“大数定律”。此定理先前仅在凸集的情况得证。[7]
简单例子
考虑凸的实数区间,其包含整数子集,且是其凸包(添加了两点所连线段上的所有点)。仅得两个元素的集合,复制成三份,并按元素求和,得到
(此处集合的和,是从各集合分别取一个元素相加,得到的可能结果的集合,称为闵氏和。)和集的凸包则为区间。
区间中,每个数都可以写成区间中某三个实数(允许重复)之和,例如将等分成三份即可。但使用沙普利-福克曼引理,则有更强的结论:的每个数,都可以写成中某两个整数(允许重复),与中某一个实数之和。[8]
凸包中的点,到的距离,至多为:
然而,考虑三个区间的闵氏平均
与其凸包的距离,仅为,即未平均前与距离()的三分之一。越多个集合相加,其闵氏平均就将凸包填得越满:由闵氏平均至凸包的最远距离,随被加项数增加,而趋向于零。[8]此为沙普利-福克曼定理的结论。
前置概念
沙普利-福克曼引理需要用到凸几何的若干定义和定理,本节将作简介。
二维的实向量空间上,有笛卡儿坐标系,将每点视为一对实数,称为“坐标”,按惯例记为。笛卡儿平面上的两点,可以逐个坐标相加:
此外,点也可以逐个坐标与实数相乘:
更一般而言,任何维(有限维)实向量空间,均可视为个实数组成的D元组的集合,并配备两种运算:向量加法和标量乘法。有限维实空间的此两种运算,皆定义成逐个坐标运算,与笛卡儿平面上的运算类似。[9]
实向量空间中,非空子集称为凸集,意思是,对于的任意两个点,连接两点成一线段,其上的所有点仍在中。例如,实心圆盘 为凸,但圆 则不然,因为连接相异两点的线段 并不是圆的子集。三个整数的集合非凸,但其为区间的子集,而该区间为凸。又例如,实心立方体为凸,然而任何空心或凹陷的图形,如弯月形,则非凸。空集也是凸集,视乎作者偏好,这可能是专门的定义[10],也可能是因为要满足的条件是空真命题。
更严谨而言,集合称为凸,意思是,对中任意两点,和单位区间中的任意实数,点
仍是的元素。
由数学归纳法,集合为凸,当且仅当其任意多个元素的凸组合仍在中。所谓向量空间子集的凸组合,是其元素的任意加权平均,而各可以是总和为的任意非负实数,即只需。[11]
凸集的定义推出,两个凸集的交集仍是凸集。更甚者,任意一族凸集的交也是凸集。作为特例,若取两个不交的凸集,则其交集为空集,故应当称空集为凸。[10]

对于实向量空间的每个子集,其凸包是包含的最小凸集。所以,是所有覆盖的凸集的交。等价地,可以将定义成的点的所有凸组合的集合。[12]作为例子,整数集合的凸包,是实数闭区间,其两端为原有的整数。[8]单位圆的凸包则是闭单位圆盘,其包含单位圆。

在任何向量空间(或有定义加法的代数结构)中,两个非空子集的闵可夫斯基和,定义为其元素之和的集合,即 (参见[13])。例如:
此运算定义在非空子集族上,且满足结合律和交换律。既然有结合律和交换律,就可以递归定义多个被加项的运算结果。由数学归纳法,可见[14]
闵可夫斯基和与凸包运算可以交换。具体而言,对实向量空间的任意子集,其闵氏和的凸包等于其凸包的闵氏和。换言之,
故由数学归纳法得
各命题的叙述

由前一段的恒等式,对和的凸包中的每点,都存在各凸包的(取遍至),使得。各点的位置取决于。

有了以上背景,沙普利-福克曼引理断言,的表示法
中,仅需要不多于个被加项取自凸包,而其他被加项,则只需取自原来的集合。以符号复述,即有以上方法表示,且满足。不妨将下标重新排序,然后就有
其中对,有,而对,则有。注意,倘若重排,则排序的方式也取决于点。[17]再精简,沙普利-福克曼引理可以写成
举例,集合中的每个点,根据引理,必定可以写成的某个元素,与的某个元素之和。[8]
反之,沙普利-福克曼引理刻划了有限维实向量空间的维数。具体而言,若某向量空间,对于某个自然数满足引理的结论,但对小于的数不满足,则其维数恰好为。[18]引理仅对有限维向量空间成立。[19]

沙普利与福克曼运用其引理,证明沙普利-福克曼定理,给出集合的闵氏和与其凸包(称为凸化(convexified)和)的距离上界。定理的叙述如下:
凸化和的任一点,到(未凸化)和集的欧氏距离平方,不超过各集合的外接半径中,最大个的平方和。(所谓外接半径,定义为包围该集合的最小球面的半径。)[20]此上界与求和项数无关(但要求,且集合不能越来越大)。[21]
上述定理给出闵氏和及其凸包之间距离的上界。当且仅当闵氏和为凸集时,此距离为零。该上界取决于维数及各被加项的形状,但只要,就不取决于项数。[3]
通常,外接半径会大于内半径,而无论如何,外接半径总不能小于内半径。集合的内半径定义为:[22]
最小的正实数,满足:若在凸包中,则在若干点的凸包中,而该些点皆在同一个半径为的球内。
斯塔将沙普利-福克曼定理中的外接半径换成内半径,从而压低沙普利-福克曼定理的上界:
沙普利-福克曼定理的斯塔推论:
斯塔的推论确定,个集合的闵氏和与其凸包之间,欧氏距离的上界。此距离可以衡量闵氏和非凸的程度,故为简单起见,下文称为非凸度。于是,斯塔对非凸度的上界,仅取决于个最大内半径之值,但不取决于求和的项数(假设)。
例如,非凸集的非凸度为,因为与其凸包(区间)的距离为
所以,既然的非凸度有不取决于项数的上界,就知平均集
非凸度上界,会随增加而递减。例如,平均集
和其凸包的距离仅为,等于被加项与其凸包的距离()之半。仅要最大个求和项的形状,已足以计算和集与凸包的距离的上界,故除以后,平均集与凸包的距离,在趋向无穷时,会递减至零(对均匀有界的求和项成立,即各个求和项的大小需有同一个上界)。[3]若使用斯塔的上界,则前一句结论的条件可以放宽,只需各求和项的内半径有同一个上界。[3]
沙普利-福克曼引理的原证明,仅确定存在该种表示法,而无说明如何构造。阿罗与哈恩[24]、盖士利[25]、斯奈德(Schneider)[26]和其他人都曾给出类似的证明。阿特斯泰因(Artstein)扩展了埃科兰德的简洁抽象证明。[27][28]也有未经出版的另证。[2][29]1981年,斯塔发表一种叠代法,可以计算给定点的表示法,然而,此计算方法给出的上界,较非构造性证明的上界差。[30]博赛卡斯的书有讲述有限维空间沙普利-福克曼引理的初等证明,[31]并将引理应用于估计可分优化(separable optimization)问题与零和赛局的对偶间隙。
应用
有沙普利-福克曼引理,学者就得将有关凸集闵氏和的结果,套用到(无需凸的)一般集合之和。此种和见于经济学、最优化理论、概率论。此三领域的应用中,非凸性起到重要作用。

经济学中,消费者对每一“篮子”商品(basket,即商品的组合)有其偏好程度。每篮子可用一个非负向量表示,其坐标为篮中各商品的量。所有篮子组成的集合中,每个消费者有自己的一族无差异曲线,满足:在同一条曲线上的各篮子,对该消费者是等价的,即消费者并不觉该曲线上有篮子胜于另一个篮子。每篮子恰好处于一条无差异曲线上。消费者相对于一条无差异曲线的偏好集,定义为该无差异曲线与其更偏好的区域的并集。称消费者的偏好为凸,意思是其所有偏好集皆为凸。[32]
如图所示,消费者认为的最优篮子,是在预算线支撑某个偏好集时取到,因为此时,所选的篮子是整条预算线上,达到最高的无差异曲线的一点。所谓预算线,是由商品的价格向量与消费者的收入计算得出的限制,消费者无足够收入购买高于此线的篮子。所以,最优篮子的集合是各价格的函数,称为消费者的需求。若偏好集为凸,则不论价格为何,消费者认为的最优篮子总是组成凸集,例如可能是单元集,或是一条线段。[33]

然而,若有偏好集非凸,则某些价格确定的预算线,可能在两个分开的最优篮子支撑该偏好集。例如,可以设想,动物园购买狮子或鹰的价钱一样,且其预算恰好够买一只狮子或一只鹰。此外,假设园主亦认为两只动物价值相同,则动物园有可能买狮子,也可能买鹰,但当然不可能买半只狮子加半只鹰(狮鹫)。所以,园主的偏好非凸:买两只动物中的任一只,胜于两者的严格凸组合。[34]
若消费者有非凸偏好集,则对于某些价格,需求不连通。不连通的需求,会导致消费者的行为出现不连续的间断。引述哈罗德·霍特林的话(宜配合所附动图理解):
若考虑波浪形的无差异曲线,即在某些区域向原点凸,而在其他区域向原点凹,则我等被迫推论,仅有向原点凸的部分需要理会,因为几乎不可能观测到其他部分。要侦测该些部分,唯一方法是,观察价格之比率变化时,需求的不连续变化。此变化的效果是,当直线旋转时,切点会突然跃过某凹陷。虽然此种不连续的表现,揭示有凹陷,但却不可能量度缺口的深度。倘若无差异曲线,或其高维推广,有凹陷部分,则定必因永远无法测量,而不为人知。[35]
瓦尔特·迪韦尔特[36]书中,称赫尔曼·沃尔德[37]有强调研究非凸偏好的困难,也引述保罗·萨缪尔森称凹陷处“被永恒的黑暗遮蔽”[38]。
尽管有上述困难,《政治经济期刊》(JPE)在1959年至1961年间,刊登一系列的论文,解明非凸偏好。投稿人包括:法雷尔(Farrell)[39]、巴托尔[40]、科普曼斯[41]、罗森博格(Rothenberg)[42]。其中,罗森博格讨论非凸集和的近似凸性。[43]该些JPE论文,促使劳埃德·沙普利和马丁·舒比克也合著论文,研究凸化的消费者偏好,并引入“近似均衡”(approximate equilibrium)的概念。[44]JPE论文和沙普利-舒比克论文又启发了罗伯特·奥曼提出另一个概念,称为“准均衡”(quasi-equilibrium)。[45][46]

肯尼斯·阿罗收集前人研究经济学中的非凸集的文献,列成表,并加入注解,交给罗斯·斯塔。斯塔当时仍是本科生,但已在修读阿罗开设的高等数理经济学(研究生)课程。[47]斯塔在学期论文中,考虑将非凸偏好换成其凸包所得的假想经济体,研究其一般均衡。凸化经济体中,在每个价位,总需求皆是各消费者需求的凸包之和。斯塔的想法吸引数学家劳埃德·沙普利和强·福克曼参与,两人“在私人通信中”证明现以两人命名的引理和定理,到1969年,斯塔才于论文报告此事。[1]
斯塔1969年的论文中,应用沙普利-福克曼-斯塔定理,证明“凸化”经济体有一些一般均衡,只要参与者足够多,能以原经济体的“准均衡”近似。具体而言,斯塔证明,至少存在一个价格向量为的准均衡,满足下列条件:
- 对每个准均衡,所有消费者都可以选到其最优的篮子(在预算限制内,且最偏好)。
- 在该价格,凸化经济体中,每种商品的市场皆均衡,即供给等于需求。
- 每个准均衡的价格,皆“几乎出清”原经济体的市场:凸化经济体均衡组成的集合,与原经济体的准均衡集合,两者的距离有上界。此结论是根据沙普利-福克曼定理的斯塔推论得到。[48]
斯塔确立以下结论:
“总体中,[取各消费及生产集的凸包]所得的假想经济体的分配,与真实经济体的某个分配,两者的差异,有不取决于参与者数目的上界。因此,当参与者数目趋向无穷时,平均参与者感受到,与拟作行动的偏差,近乎可以忽略不计。”[49]
斯塔1969年论文发表后,沙普利-福克曼-斯塔的结论,在经济理论获广泛应用。罗歇·盖内里如此总结该结论对经济学的意义:“假设凸性,所得的若干重要结果,在不具凸性的情况下,仍(近似)适用。例如,若经济体具有大消费侧,则偏好的非凸性不影响适用标准结果”[50],还称“这些结论的一般形式的推导,是战后经济理论的重大成就。”[4]许多诺贝尔奖得主都曾研究经济学中的非凸集,除了前述的劳埃德·沙普利(2012年获奖)外,还有:阿罗(1972)、罗伯特·约翰·奥曼(2005)、杰拉德·德布鲁(1983)、特亚林·科普曼斯(1975)、保罗·克鲁曼(2008)、保罗·萨缪尔森(1970)。至于互补的主题“经济学中的凸集”,除以上得主著重外,还有里奥尼德·赫维克兹、列昂尼德·维塔利耶维奇·康托罗维奇(1975)、罗伯特·索洛(1987)都著重。[51]
沙普利-福克曼-斯塔的结论,在经济学各分支的文献都经常出现,包括微观经济学[52]、一般均衡理论[53][54]、公共经济学[55](包括市场失灵)[56]、博弈论[57]、数理经济学[58]、经济学中的应用数学[59][60]。沙普利-福克曼-斯塔的结论,也使经济学更多使用测度论和积分理论。[61]

沙普利-福克曼引理可以解释,为何大规模的最小化问题,即使非凸,仍可用迭代法近似求解(仅对于凸问题,有证明叠代法收敛到最优解)。沙普利-福克曼引理,促使学者将凸优化方法,用于优化多个(无需凸的)函数之和。[62]
- 实值函数的盖图是图像上方的点的集合:

许多优化问题中,目标函数可分离变数(可分),即是多个函数之和,而各个函数的参数不同,如:
又例如,线性规划问题就可分离变数。考虑一个可分问题,及一个最优解
在该点取到最小值。对此可分问题,同时考虑其“凸化问题”的最优解,即将每个求和项的图像换成其凸包。此种最优解,会是凸化问题的某点列的极限,其中
当然,因为此点是个图像凸包的点之和,由沙普利-福克曼引理,就可以写成原图像的点与少数图像凸包的点之和。
以上分析,1974年由埃科兰德发表,以解释为何可分问题有许多项时,即使各项非凸,总问题仍看似凸。对非线性最小值问题而言,对偶问题的解,不一定就是原问题的解(但若已知原问题为凸,且满足特定条件,则两者的的最优解相等),但是,1973年,青年数学家克劳德·勒马雷沙尔诧异,对已知非凸的问题使用凸问题的方法,竟然也成功。勒马雷沙尔的问题,正是上段加性可分离变数的形式,而每个和项皆非凸函数,但对偶问题的解,仍近似原问题的最优解。[65][5][66]埃科兰德的分析说明,“大而可分”的最小值问题,即使各和项有凹陷,仍可运用凸优化的方法。埃科兰德及其后的作者主张,因为变数可以加性分离,所得的总问题近似凸。该等著作以沙普利-福克曼引理为关键一步。[5][66][67]沙普利-福克曼引理促使学者将凸优化方法,应用到目标函数为多个函数之和的情况。[5][6][59][62]
凸集常与概率论一同研究。卡拉西奥多里定理说明,维空间的(非空)子集凸包中的点,是取值于的简单随机向量的期望值,而所谓简单,意思是仅在不多于个点处有非零概率。所以,对非空集,取值自的简单随机向量组成的集合,等于的凸包。由此便可在概率论中,套用沙普利-福克曼-斯塔的结果。[68]反之,藉期望值与凸包之间的联系,概率论亦能用作研究凸集,尤其可用作分析沙普利-福克曼-斯塔的结果。[69]沙普利-福克曼-斯塔的结果,广泛用于随机集的概率论[70],例如证明随机集的大数定律[7][71]、中央极限定理[71][72]、大离差原理[73]。要证明前列概率极限定理,可以使用沙普利-福克曼-斯塔的结果,来避免假设随机集为凸。
概率测度是有限的测度,而沙普利-福克曼引理还可以应用到非概率的测度论,如体积或向量测度的理论。沙普利-福克曼引理可以加强布伦-闵可夫斯基不等式。该不等式断言,闵氏和的体积,相较于各和项的体积不能太大,即闵氏和的体积有上界,以各和项的体积的表示。[74]欧氏空间子集的体积,此处定义为其勒贝格测度。
高等测度论中,沙普利-福克曼引理适用于证明李亚普诺夫定理,即向量测度的值域为凸。[75]值域(或像集)是函数所有可能取值的集合,而向量测度则将测度推广到允许取向量值。例如,若某测度空间有两种概率测度和,则可定义一个向量测度,是对每个事件,将其两个概率结合为一个二元组,即
李亚普诺夫定理在经济学[45][76]、(砰砰)控制论、统计理论皆有应用。[77]李亚普诺夫定理是沙普利-福克曼引理的连续版[3],而沙普利-福克曼引理是李亚普诺夫定理的离散类比。[78]
注
参考文献
外部链结
Wikiwand - on
Seamless Wikipedia browsing. On steroids.