沙普利-福克曼引理

沙普利-福克曼引理是凸几何（英语：Convex geometry）的一条引理，其于数理经济学有应用。引理描述向量空间子集的闵可夫斯基和有何性质。若干个集合的闵可夫斯基和，即从各集合分别取一个元素相加，组成的集合：例如，将整数 $0$ 和 $1$ 组成的集合，与自身相加，得到由 $0,\ 1,\ 2$ 组成的集合，以符号可写成：

\{0,1\}+\{0,1\}=\{0,1,2\}.

“许多个集合的闵氏和，是否必定近似凸集？”沙普利-福克曼引理和相关的结果表明，问题的答案为肯定。^[2]集合称为凸，意思是连接其中任意两点的线段，必为该集合的子集：举例，实心圆盘 $\bullet$ 为凸集，但圆 $\circ$ 则不然，因为连接相异两点的线段 $\oslash$ 并不是圆的子集。沙普利-福克曼引理大致断言，若求和项的数目超出向量空间的维数，则其闵氏和将近凸。^[1]

沙普利-福克曼引理引入时，是作为证明沙普利-福克曼定理的一步，该定理断言闵氏和与其凸包的距离不超过某个上界。所谓集合 $Q$ 的凸包，是包含 $Q$ 的最小凸集。而当且仅当和为凸时，上述距离为零。定理中，距离的上界取决于维数 $D$ 及求和项的形状，但不取决于求和的项数 $N$ ，而只需 $N>D$ 。只要其中 $D$ 个求和项的形状，就足以确定 $N$ 个集合的闵可夫斯基平均集

{\frac {1}{N}}\left(Q_{1}+Q_{2}+\cdots +Q_{N}\right)

与其凸包的距离的上界。当 $N$ 趋向无穷时，该上界递减至零（需要各求和项的大小一致有界）。^[3]斯塔（Starr）的推论将沙普利-福克曼定理的上界压得更低，故又称为沙普利-福克曼-斯塔定理。

劳埃德·沙普利和强·福克曼（英语：Jon Folkman）的引理，最先由经济学家罗斯·斯塔（英语：Ross Starr）发表，其时斯塔正在肯尼斯·阿罗门下，研究经济均衡的存在性。^[1]斯塔在论文中，研究凸化（convexified）经济体，即将非凸集换成其凸包。斯塔证明，凸化之后，有些均衡由原经济体的“准均衡”（quasi-equilibria）逼近；还证明，每个准均衡都具有真均衡的许多最优性质，而凸经济体中则必定存在真均衡。斯塔1969年的论文发表后，沙普利-福克曼-斯塔的结果得到广泛应用，用作证明（凸）经济理论的若干核心结果，尽管不适用于有非凸部分的大经济体，但在此等经济体中，仍是良好的近似。罗歇·盖内里（英语：Roger Guesnerie）评论：“这些结论的一般形式的推导，是战后经济理论的重大成就。”^[4]许多诺贝尔奖得主都曾研究经济学中的非凸集（英语：Non-convexity (economics)），除了前述的劳埃德·沙普利（2012年获奖）外，还有：阿罗（1972）、罗伯特·约翰·奥曼（2005）、杰拉德·德布鲁（1983）、特亚林·科普曼斯（1975）、保罗·克鲁曼（2008）、保罗·萨缪尔森（1970）。至于互补的主题“经济学中的凸集（英语：Convexity in economics）”，除以上得主著重外，还有里奥尼德·赫维克兹、列昂尼德·维塔利耶维奇·康托罗维奇（1975）、罗伯特·索洛（1987）都著重。

沙普利-福克曼引理在优化论和概率论皆有应用。^[3]优化论中，可以引理解释，在求多个函数之和的最小值时，为何一些解法可以成功。^[5]^[6]概率论中，引理适用于证明随机集（英语：Stochastic geometry）的“大数定律”。此定理先前仅在凸集的情况得证。^[7]

简单例子

考虑凸的实数区间 $[0,1]$ ，其包含整数子集 $\{0,1\}$ ，且是其凸包（添加了两点所连线段上的所有点）。仅得两个元素的集合 $\{0,1\}$ ，复制成三份，并按元素求和，得到

\{0,1\}+\{0,1\}+\{0,1\}=\{0,1,2,3\}.

（此处集合的和，是从各集合分别取一个元素相加，得到的可能结果的集合，称为闵氏和。）和集的凸包则为区间 $[0,3]$ 。

区间 $[0,3]$ 中，每个数 $x$ 都可以写成区间 $[0,1]$ 中某三个实数（允许重复）之和，例如将 $x$ 等分成三份即可。但使用沙普利-福克曼引理，则有更强的结论： $[0,3]$ 的每个数，都可以写成 $\{0,1\}$ 中某两个整数（允许重复），与 $[0,1]$ 中某一个实数之和。^[8]

凸包 $[0,1]$ 中的点，到 $\{0,1\}$ 的距离，至多为 $1/2$ ：

{\frac {1}{2}}=\left|{\frac {1}{2}}-0\right|=\left|{\frac {1}{2}}-1\right|,

然而，考虑三个区间 $[0,1]$ 的闵氏平均

{\frac {1}{3}}\left(\{0,1\}+\{0,1\}+\{0,1\}\right)=\left\{0,{\frac {1}{3}},{\frac {2}{3}},\ 1\right\},

与其凸包 $[0,1]$ 的距离，仅为 $1/6$ ，即未平均前 $\{0,1\}$ 与 $[0,1]$ 距离（ $1/2$ ）的三分之一。越多个集合相加，其闵氏平均就将凸包填得越满：由闵氏平均至凸包的最远距离，随被加项数增加，而趋向于零。^[8]此为沙普利-福克曼定理的结论。

前置概念

沙普利-福克曼引理需要用到凸几何（英语：convex geometry）的若干定义和定理，本节将作简介。

实向量空间

二维的实向量空间上，有笛卡儿坐标系，将每点视为一对实数，称为“坐标”，按惯例记为 $x,\ y$ 。笛卡儿平面上的两点，可以逐个坐标相加：

(x_{1},y_{1})+(x_{2},y_{2})=(x_{1}+x_{2},y_{1}+y_{2}).

此外，点也可以逐个坐标与实数 $\lambda$ 相乘：

\lambda (x,y)=(\lambda x,\lambda y).

更一般而言，任何 $D$ 维（有限维）实向量空间，均可视为 $D$ 个实数组成的D元组的集合 $\{(v_{1},v_{2},\ldots ,v_{D})\}$ ，并配备两种运算：向量加法和标量乘法。有限维实空间的此两种运算，皆定义成逐个坐标运算，与笛卡儿平面上的运算类似。^[9]

凸集

Q

中，连接任意两点的线段仍是

Q

的子集。

非凸集

Q

中，连接某两点的线段上，有一点不再是

Q

的元素。

用线段可以检验某集合是否凸集。

实向量空间中，非空子集 $Q$ 称为凸集，意思是，对于 $Q$ 的任意两个点，连接两点成一线段，其上的所有点仍在 $Q$ 中。例如，实心圆盘 $\bullet$ 为凸，但圆 $\circ$ 则不然，因为连接相异两点的线段 $\oslash$ 并不是圆的子集。三个整数的集合 $\{0,1,2\}$ 非凸，但其为区间 $[0,2]$ 的子集，而该区间为凸。又例如，实心立方体为凸，然而任何空心或凹陷的图形，如弯月形（英语：Crescent），则非凸。空集也是凸集，视乎作者偏好，这可能是专门的定义^[10]，也可能是因为要满足的条件是空真命题（英语：Vacuous truth）。

更严谨而言，集合 $Q$ 称为凸，意思是，对 $Q$ 中任意两点 $v_{0},v_{1}$ ，和单位区间 $[0,1]$ 中的任意实数 $\lambda$ ，点

(1-\lambda )v_{0}+\lambda v_{1}

仍是 $Q$ 的元素。

由数学归纳法，集合 $Q$ 为凸，当且仅当其任意多个元素的凸组合仍在 $Q$ 中。所谓向量空间子集 $\{v_{0},v_{1},\ldots ,v_{D}\}$ 的凸组合，是其元素的任意加权平均 $\lambda _{0}v_{0}+\lambda _{1}v_{1}+\cdots +\lambda _{D}v_{D}$ ，而各 $\lambda _{i}$ 可以是总和为 $1$ 的任意非负实数，即只需 $\lambda _{0}+\lambda _{1}+\cdots +\lambda _{D}=1$ 。^[11]

凸集的定义推出，两个凸集的交集仍是凸集。更甚者，任意一族凸集的交也是凸集。作为特例，若取两个不交的凸集，则其交集为空集，故应当称空集为凸。^[10]

凸包

对于实向量空间的每个子集 $Q$ ，其凸包 $\mathrm {Conv} (Q)$ 是包含 $Q$ 的最小凸集。所以， $\mathrm {Conv} (Q)$ 是所有覆盖 $Q$ 的凸集的交。等价地，可以将 $\mathrm {Conv} (Q)$ 定义成 $Q$ 的点的所有凸组合的集合。^[12]作为例子，整数集合 $\{0,1\}$ 的凸包，是实数闭区间 $[0,1]$ ，其两端为原有的整数 $0,1$ 。^[8]单位圆的凸包则是闭单位圆盘，其包含单位圆。

闵可夫斯基和

在任何向量空间（或有定义加法的代数结构） $X$ 中，两个非空子集 $A,B\subseteq X$ 的闵可夫斯基和，定义为其元素之和的集合，即 $A+B:=\{x+y\mid x\in A,~y\in B\}$ （参见^[13])。例如：

\{0,1\}+\{0,1\}=\{0+0,0+1,1+0,1+1\}=\{0,1,2\}.

此运算定义在非空子集族上，且满足结合律和交换律。既然有结合律和交换律，就可以递归定义多个被加项的运算结果 $\sum _{n=1}^{N}Q_{n}=Q_{1}+Q_{2}+\cdots +Q_{N}$ 。由数学归纳法，可见^[14]

\sum _{n=1}^{N}Q_{n}=\left\{\left.\sum _{n=1}^{N}q_{n}\right|q_{n}\in Q_{n},~1\leq n\leq N\right\}.

闵可夫斯基和的凸包

闵可夫斯基和与凸包运算可以交换。具体而言，对实向量空间 $X$ 的任意子集 $A,B\subseteq X$ ，其闵氏和的凸包等于其凸包的闵氏和。换言之，

\mathrm {Conv} (A+B)=\mathrm {Conv} (A)+\mathrm {Conv} (B).

故由数学归纳法得

\mathrm {Conv} (\sum _{n=1}^{N}Q_{n})=\sum _{n=1}^{N}\mathrm {Conv} (Q_{n})

对任意 $N\in \mathbb {N}$ 和非空子集 $Q_{n}\subseteq X$ （ $1\leq n\leq N$ ）成立。^[15]^[16]

各命题的叙述

由前一段的恒等式，对和的凸包中的每点 $x\in \mathrm {Conv} \left(\sum _{n=1}^{N}Q_{n}\right)$ ，都存在各凸包的 $q_{n}(x)\in \mathrm {Conv} (Q_{n})$ （ $n$ 取遍 $1$ 至 $N$ ），使得 $\sum _{n=1}^{N}q_{n}(x)=x$ 。各点 $q_{n}(x)$ 的位置取决于 $x$ 。

引理

有了以上背景，沙普利-福克曼引理断言， $x$ 的表示法

x=\sum _{n=1}^{N}q_{n}(x)

中，仅需要不多于 $D$ 个被加项 $q_{n}(x)$ 取自凸包，而其他被加项，则只需取自原来的集合 $Q_{n}$ 。以符号复述，即有以上方法表示 $x$ ，且满足 $|\{l\leq n\leq N\mid q_{n}(x)\in \mathrm {Conv} (Q_{n})\setminus Q_{n}\}|\leq D$ 。不妨将下标重新排序，然后就有

x=\sum _{n=1}^{D}q_{n}(x)+\sum _{n=D+1}^{N}q_{n}(x)

其中对 $1\leq n\leq D$ ，有 $q_{n}\in \mathrm {Conv} (Q_{n})$ ，而对 $D+1\leq n\leq N$ ，则有 $q_{n}\in Q_{n}$ 。注意，倘若重排，则排序的方式也取决于点 $x$ 。^[17]再精简，沙普利-福克曼引理可以写成

\mathrm {Conv} (\sum _{n=1}^{N}Q_{n})\subseteq \bigcup _{I\subseteq \{1,2,\ldots N\}:~|I|=D}\sum _{n\in I}\mathrm {Conv} (Q_{n})+\sum _{n\notin I}Q_{n}.

举例，集合 $[0,2]=[0,1]+[0,1]=\mathrm {Conv} (\{0,1\})+\mathrm {Conv} (\{0,1\})$ 中的每个点，根据引理，必定可以写成 $\{0,1\}$ 的某个元素，与 $[0,1]$ 的某个元素之和。^[8]

实向量空间的维数

反之，沙普利-福克曼引理刻划了有限维实向量空间的维数。具体而言，若某向量空间，对于某个自然数 $D$ 满足引理的结论，但对小于 $D$ 的数不满足，则其维数恰好为 $D$ 。^[18]引理仅对有限维向量空间成立。^[19]

沙普利-福克曼定理及斯塔的推论

沙普利与福克曼运用其引理，证明沙普利-福克曼定理，给出集合的闵氏和与其凸包（称为凸化（convexified）和）的距离上界。定理的叙述如下：

凸化和 $\mathrm {Conv} \left(\sum Q_{n}\right)$ 的任一点，到（未凸化）和集 $\sum Q_{n}$ 的欧氏距离平方，不超过各集合 $Q_{n}$ 的外接半径中，最大 $D$ 个的平方和。(所谓外接半径，定义为包围该集合的最小球面的半径。）^[20]此上界与求和项数 $N$ 无关（但要求 $N>D$ ，且集合不能越来越大）。^[21]

上述定理给出闵氏和及其凸包之间距离的上界。当且仅当闵氏和为凸集时，此距离为零。该上界取决于维数 $D$ 及各被加项的形状，但只要 $N>D$ ，就不取决于项数 $N$ 。^[3]

通常，外接半径会大于内半径，而无论如何，外接半径总不能小于内半径。集合 $Q_{n}$ 的内半径定义为：^[22]

最小的正实数 $r$ ，满足：若 $q$ 在 $Q_{n}$ 凸包中，则 $q$ 在 $Q_{n}$ 若干点的凸包中，而该些点皆在同一个半径为 $r$ 的球内。

斯塔将沙普利-福克曼定理中的外接半径换成内半径，从而压低沙普利-福克曼定理的上界：

沙普利-福克曼定理的斯塔推论：
凸化和 $\mathrm {Conv} \left(\sum Q_{n}\right)$ 的任一点，到（未凸化）和集 $\sum Q_{n}$ 的欧氏距离平方，不超过各集合 $Q_{n}$ 的内半径中，最大 $D$ 个的平方和。^[22]^[23]

斯塔的推论确定， $N$ 个集合的闵氏和与其凸包之间，欧氏距离的上界。此距离可以衡量闵氏和非凸的程度，故为简单起见，下文称为非凸度。于是，斯塔对非凸度的上界，仅取决于 $D$ 个最大内半径之值，但不取决于求和的项数 $N$ （假设 $N>D$ ）。

例如，非凸集 $\{0,1,2\}$ 的非凸度为 $1/2$ ，因为与其凸包（区间 $[0,2]$ ）的距离为

${\frac {1}{2}}=\left|1-{\frac {1}{2}}\right|=\left|0-{\frac {1}{2}}\right|=\left|2-{\frac {3}{2}}\right|=\left|1-{\frac {3}{2}}\right|.$

所以，既然 $\sum Q_{n}$ 的非凸度有不取决于项数 $N$ 的上界，就知平均集

{\frac {1}{N}}\left(\sum Q_{n}\right)

非凸度上界，会随 $N$ 增加而递减。例如，平均集

{\frac {1}{2}}\left(\{0,1\}+\{0,1\}\right)=\{0,\ 1/2,\ 1\}

和其凸包 $[0,1]$ 的距离仅为 $1/4$ ，等于被加项 $\{0,1\}$ 与其凸包 $[0,1]$ 的距离（ $1/2$ ）之半。仅要最大 $D$ 个求和项的形状，已足以计算和集与凸包的距离的上界，故除以 $N$ 后，平均集与凸包的距离，在 $N$ 趋向无穷时，会递减至零（对均匀有界的求和项成立，即各个求和项的大小需有同一个上界）。^[3]若使用斯塔的上界，则前一句结论的条件可以放宽，只需各求和项的内半径有同一个上界。^[3]

证明和计算

沙普利-福克曼引理的原证明，仅确定存在该种表示法，而无说明如何构造。阿罗与哈恩^[24]、盖士利（英语：J. W. S. Cassels）^[25]、斯奈德（Schneider）^[26]和其他人都曾给出类似的证明。阿特斯泰因（Artstein）扩展了埃科兰德（英语：Ivar Ekeland）的简洁抽象证明。^[27]^[28]也有未经出版的另证。^[2]^[29]1981年，斯塔发表一种叠代法，可以计算给定点的表示法，然而，此计算方法给出的上界，较非构造性证明的上界差。^[30]博赛卡斯的书有讲述有限维空间沙普利-福克曼引理的初等证明，^[31]并将引理应用于估计可分优化（separable optimization）问题与零和赛局的对偶间隙。

应用

有沙普利-福克曼引理，学者就得将有关凸集闵氏和的结果，套用到（无需凸的）一般集合之和。此种和见于经济学、最优化理论、概率论。此三领域的应用中，非凸性起到重要作用。

经济学

经济学中，消费者对每一“篮子”商品（basket，即商品的组合）有其偏好程度。每篮子可用一个非负向量表示，其坐标为篮中各商品的量。所有篮子组成的集合中，每个消费者有自己的一族无差异曲线，满足：在同一条曲线上的各篮子，对该消费者是等价的，即消费者并不觉该曲线上有篮子胜于另一个篮子。每篮子恰好处于一条无差异曲线上。消费者相对于一条无差异曲线的偏好集，定义为该无差异曲线与其更偏好的区域的并集。称消费者的偏好为凸，意思是其所有偏好集皆为凸。^[32]

如图所示，消费者认为的最优篮子，是在预算线支撑某个偏好集时取到，因为此时，所选的篮子是整条预算线上，达到最高的无差异曲线的一点。所谓预算线，是由商品的价格向量与消费者的收入计算得出的限制，消费者无足够收入购买高于此线的篮子。所以，最优篮子的集合是各价格的函数，称为消费者的需求。若偏好集为凸，则不论价格为何，消费者认为的最优篮子总是组成凸集，例如可能是单元集，或是一条线段。^[33]

非凸偏好

然而，若有偏好集非凸，则某些价格确定的预算线，可能在两个分开的最优篮子支撑该偏好集。例如，可以设想，动物园购买狮子或鹰的价钱一样，且其预算恰好够买一只狮子或一只鹰。此外，假设园主亦认为两只动物价值相同，则动物园有可能买狮子，也可能买鹰，但当然不可能买半只狮子加半只鹰（狮鹫）。所以，园主的偏好非凸：买两只动物中的任一只，胜于两者的严格凸组合。^[34]

若消费者有非凸偏好集，则对于某些价格，需求不连通。不连通的需求，会导致消费者的行为出现不连续的间断。引述哈罗德·霍特林的话（宜配合所附动图理解）：

若考虑波浪形的无差异曲线，即在某些区域向原点凸，而在其他区域向原点凹，则我等被迫推论，仅有向原点凸的部分需要理会，因为几乎不可能观测到其他部分。要侦测该些部分，唯一方法是，观察价格之比率变化时，需求的不连续变化。此变化的效果是，当直线旋转时，切点会突然跃过某凹陷。虽然此种不连续的表现，揭示有凹陷，但却不可能量度缺口的深度。倘若无差异曲线，或其高维推广，有凹陷部分，则定必因永远无法测量，而不为人知。^[35]

瓦尔特·迪韦尔特（英语：Walter Erwin Diewert）^[36]书中，称赫尔曼·沃尔德（英语：Herman Wold）^[37]有强调研究非凸偏好的困难，也引述保罗·萨缪尔森称凹陷处“被永恒的黑暗遮蔽”^[38]。

尽管有上述困难，《政治经济期刊（英语：Journal of Political Economy）》（JPE）在1959年至1961年间，刊登一系列的论文，解明非凸偏好。投稿人包括：法雷尔（Farrell）^[39]、巴托尔（英语：Francis M. Bator）^[40]、科普曼斯^[41]、罗森博格（Rothenberg）^[42]。其中，罗森博格讨论非凸集和的近似凸性。^[43]该些JPE论文，促使劳埃德·沙普利和马丁·舒比克也合著论文，研究凸化的消费者偏好，并引入“近似均衡”（approximate equilibrium）的概念。^[44]JPE论文和沙普利-舒比克论文又启发了罗伯特·奥曼提出另一个概念，称为“准均衡”（quasi-equilibrium）。^[45]^[46]

斯塔1969年的论文与当代经济学

肯尼斯·阿罗收集前人研究经济学中的非凸集（英语：Non-convexity (economics)）的文献，列成表，并加入注解，交给罗斯·斯塔（英语：Ross Starr）。斯塔当时仍是本科生，但已在修读阿罗开设的高等数理经济学（研究生）课程。^[47]斯塔在学期论文中，考虑将非凸偏好换成其凸包所得的假想经济体，研究其一般均衡。凸化经济体中，在每个价位，总需求皆是各消费者需求的凸包之和。斯塔的想法吸引数学家劳埃德·沙普利和强·福克曼（英语：Jon Folkman）参与，两人“在私人通信中”证明现以两人命名的引理和定理，到1969年，斯塔才于论文报告此事。^[1]

斯塔1969年的论文中，应用沙普利-福克曼-斯塔定理，证明“凸化”经济体有一些一般均衡，只要参与者足够多，能以原经济体的“准均衡”近似。具体而言，斯塔证明，至少存在一个价格向量为 $p_{\mathrm {opt} }$ 的准均衡，满足下列条件：

对每个准均衡 $p_{\mathrm {opt} }$ ，所有消费者都可以选到其最优的篮子（在预算限制内，且最偏好）。
在该价格 $p_{\mathrm {opt} }$ ，凸化经济体中，每种商品的市场皆均衡，即供给等于需求。
每个准均衡的价格，皆“几乎出清”原经济体的市场：凸化经济体均衡组成的集合，与原经济体的准均衡集合，两者的距离有上界。此结论是根据沙普利-福克曼定理的斯塔推论得到。^[48]

斯塔确立以下结论：

“总体中，［取各消费及生产集的凸包］所得的假想经济体的分配，与真实经济体的某个分配，两者的差异，有不取决于参与者数目的上界。因此，当参与者数目趋向无穷时，平均参与者感受到，与拟作行动的偏差，近乎可以忽略不计。”^[49]

斯塔1969年论文发表后，沙普利-福克曼-斯塔的结论，在经济理论获广泛应用。罗歇·盖内里（英语：Roger Guesnerie）如此总结该结论对经济学的意义：“假设凸性，所得的若干重要结果，在不具凸性的情况下，仍（近似）适用。例如，若经济体具有大消费侧，则偏好的非凸性不影响适用标准结果”^[50]，还称“这些结论的一般形式的推导，是战后经济理论的重大成就。”^[4]许多诺贝尔奖得主都曾研究经济学中的非凸集（英语：Non-convexity (economics)），除了前述的劳埃德·沙普利（2012年获奖）外，还有：阿罗（1972）、罗伯特·约翰·奥曼（2005）、杰拉德·德布鲁（1983）、特亚林·科普曼斯（1975）、保罗·克鲁曼（2008）、保罗·萨缪尔森（1970）。至于互补的主题“经济学中的凸集（英语：Convexity in economics）”，除以上得主著重外，还有里奥尼德·赫维克兹、列昂尼德·维塔利耶维奇·康托罗维奇（1975）、罗伯特·索洛（1987）都著重。^[51]

沙普利-福克曼-斯塔的结论，在经济学各分支的文献都经常出现，包括微观经济学^[52]、一般均衡理论^[53]^[54]、公共经济学^[55]（包括市场失灵）^[56]、博弈论^[57]、数理经济学^[58]、经济学中的应用数学^[59]^[60]。沙普利-福克曼-斯塔的结论，也使经济学更多使用测度论和积分理论。^[61]

最优化理论

沙普利-福克曼引理可以解释，为何大规模的最小化问题，即使非凸，仍可用迭代法近似求解（仅对于凸问题，有证明叠代法收敛到最优解）。沙普利-福克曼引理，促使学者将凸优化方法，用于优化多个（无需凸的）函数之和。^[62]

最优化理论的前置概念

非线性规划依赖下列有关函数的若干定义：

函数 $f$ （定义在集合 $D$ 上）的图像，是所有参数 $x$ 与相应取值 $f(x)$ 组成的二元组的集合：

\mathrm {Graph} (f)=\{(x,f(x)):x\in D\}.

实值函数（英语：Real-valued function） $f$ 的盖图（英语：Epigraph (mathematics)）是图像上方的点的集合：

\mathrm {Epi} (f)=\{(x,u):f(x)\leq u\}.

实值函数称为凸函数，意思是其盖图为凸集。^[63]

举例，二次函数 $f:x\mapsto x^{2}$ 为凸，而绝对值函数 $g:x\mapsto |x|$ 亦然，但正弦函数 $\sin$ （如图）则不然，因为在区间 $(0,\pi )$ 的盖图非凸（而有向上的凹陷）。

加性优化问题

许多优化问题中，目标函数 $f$ 可分离变数（可分），即 $f$ 是多个函数之和，而各个函数的参数不同，如：

f({\boldsymbol {x}})=f(x_{1},x_{2},\ldots ,x_{n})=\sum _{n}f_{n}(x_{n}).

又例如，线性规划问题就可分离变数。考虑一个可分问题，及一个最优解

{\boldsymbol {x}}_{\mathrm {min} }=(x_{1},x_{2},\ldots ,x_{n})_{\mathrm {min} },

在该点取到最小值 $f({\boldsymbol {x}}_{\mathrm {min} })$ 。对此可分问题，同时考虑其“凸化问题”的最优解，即将每个求和项 $f_{n}$ 的图像换成其凸包。此种最优解，会是凸化问题的某点列 $({\boldsymbol {x}}_{j},f({\boldsymbol {x}}_{j}))_{j=1}^{\infty }$ 的极限，其中

({\boldsymbol {x}}_{j},f({\boldsymbol {x}}_{j}))\in \sum _{n=1}^{N}\mathrm {Conv} (\mathrm {Graph} (f_{n})).

^[5]^[64]

当然，因为此点是 $N$ 个图像凸包的点之和，由沙普利-福克曼引理，就可以写成原图像的点与少数图像凸包的点之和。

以上分析，1974年由埃科兰德（英语：Ivar Ekeland）发表，以解释为何可分问题有许多项时，即使各项非凸，总问题仍看似凸。对非线性最小值问题而言，对偶问题的解，不一定就是原问题的解（但若已知原问题为凸，且满足特定条件，则两者的的最优解相等），但是，1973年，青年数学家克劳德·勒马雷沙尔（英语：Claude Lemaréchal）诧异，对已知非凸的问题使用凸问题的方法，竟然也成功。勒马雷沙尔的问题，正是上段加性可分离变数的形式，而每个和项皆非凸函数，但对偶问题的解，仍近似原问题的最优解。^[65]^[5]^[66]埃科兰德的分析说明，“大而可分”的最小值问题，即使各和项有凹陷，仍可运用凸优化的方法。埃科兰德及其后的作者主张，因为变数可以加性分离，所得的总问题近似凸。该等著作以沙普利-福克曼引理为关键一步。^[5]^[66]^[67]沙普利-福克曼引理促使学者将凸优化方法，应用到目标函数为多个函数之和的情况。^[5]^[6]^[59]^[62]

概率与测度论

凸集常与概率论一同研究。卡拉西奥多里定理（英语：Carathéodory's theorem (convex hull)）说明， $d$ 维空间的（非空）子集 $Q$ 凸包中的点，是取值于 $Q$ 的简单随机向量（英语：Multivariate random variable）的期望值，而所谓简单，意思是仅在不多于 $d+1$ 个点处有非零概率。所以，对非空集 $Q$ ，取值自 $Q$ 的简单随机向量组成的集合，等于 $Q$ 的凸包。由此便可在概率论中，套用沙普利-福克曼-斯塔的结果。^[68]反之，藉期望值与凸包之间的联系，概率论亦能用作研究凸集，尤其可用作分析沙普利-福克曼-斯塔的结果。^[69]沙普利-福克曼-斯塔的结果，广泛用于随机集的概率论（英语：Stochastic geometry）^[70]，例如证明随机集的大数定律^[7]^[71]、中央极限定理^[71]^[72]、大离差原理（英语：Large deviations theory）^[73]。要证明前列概率极限定理，可以使用沙普利-福克曼-斯塔的结果，来避免假设随机集为凸。

概率测度是有限的测度，而沙普利-福克曼引理还可以应用到非概率的测度论，如体积或向量测度的理论。沙普利-福克曼引理可以加强布伦-闵可夫斯基不等式（英语：Brunn–Minkowski theorem）。该不等式断言，闵氏和的体积，相较于各和项的体积不能太大，即闵氏和的体积有上界，以各和项的体积的表示。^[74]欧氏空间子集的体积，此处定义为其勒贝格测度。

高等测度论中，沙普利-福克曼引理适用于证明李亚普诺夫定理，即向量测度的值域为凸。^[75]值域（或像集）是函数所有可能取值的集合，而向量测度则将测度推广到允许取向量值。例如，若某测度空间有两种概率测度 $p_{1}$ 和 $p_{2}$ ，则可定义一个向量测度 $(p_{1},p_{2})$ ，是对每个事件 $\omega$ ，将其两个概率结合为一个二元组，即

(p_{1},p_{2})(\omega )=(p_{1}(\omega ),p_{2}(\omega )).

李亚普诺夫定理在经济学^[45]^[76]、(砰砰)控制论、统计理论（英语：Statistical theory）皆有应用。^[77]李亚普诺夫定理是沙普利-福克曼引理的连续版^[3]，而沙普利-福克曼引理是李亚普诺夫定理的离散类比。^[78]

注

Loading content...

参考文献

Loading content...

外部链结

Loading content...

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.