概率论中有若干关于随机变量收敛(Convergence of random variables)的定义。研究一列随机变量是否会收敛到某个极限随机变量是概率论中的重要内容,在统计概率和随机过程中都有应用。在更广泛的数学领域中,随机变量的收敛被称为随机收敛,表示一系列本质上随机不可预测的事件所发生的模式可以在样本数量足够大的时候得到合理可靠的预测。各种不同的收敛定义实际上是表示预测时不同的刻画方式。
依概率1收敛又称为几乎处处收敛,其定义接近于函数逐点收敛的定义。事实上,由于随机变量的本质是由样本空间到取值空间上的函数。因此,给定一个概率空间 中的一列 随机变量,考虑事件。如果存在一个随机变量,使得事件的概率为1,那么就称随机变量序列 依概率1收敛到 (或称 几乎处处收敛到 ),记作:
- 或
当取值空间是一般的实数空间时,依概率1收敛的意义是:
- 对任意的正实数,
当空间是度量空间 (S, d) 的时候,依概率1收敛的意义是:
设 是一个随机变量序列,是一个随机变量。如果对于任意的正实数,都有:
那么称序列 依概率收敛到,记作:
如果的取值空间是一个可分度量空间(S, d),那么依概率收敛的定义为[1]:
依概率收敛和依概率1收敛的定义有相似之处,但本质上,依概率1收敛是比依概率收敛更“强”的收敛性质。如果一列随机变量依概率1收敛到某个极限,那么它必然也依概率收敛到这个极限,但反之则不然。一个实数上的例子是:设概率空间 是区间上的一个连续型均匀分布 。一个随机变量序列定义为:
由于
所以
- ,
另一方面,考虑到这一组随机变量,它们取值为1的集合的并集恰好是总区间,因此对每一个,总会有到之间的某个变量,使得
所以,对任意一个,
- ,
即是说, 并不依概率1收敛到0。从例子中可以看到,依概率收敛比依概率1收敛更为宽松的地方是:当n趋于无穷大的时候,只要偏离极限函数的(即是集合中的)“足够少”,就能使得依概率收敛成立了,这些的集合可以随着n不同而不同;而依概率1收敛则要求的集合固定地缩减至一个概率为0的集合。因此,依概率1收敛要比依概率收敛更为严格。
- 依概率收敛蕴含依分布收敛:一个依概率收敛的随机变量序列必然也依分布收敛到同一个极限。
- 在离散概率空间中,依概率收敛和依概率1收敛是等价的。
- 依分布收敛蕴含依概率收敛当且仅当依分布收敛的极限是一个常数。
- 连续映射定理说明:对任意连续函数,如果随机变量序列依概率收敛到,那么序列依概率收敛到
- 依概率收敛定义了确定概率空间上的随机变量空间上的一个拓扑。这个拓扑可以用樊𰋀度量进行度量化[2]。
依分布收敛是最宽松的收敛方式之一。这种收敛不要求查看每个,只要求序列的分布趋向于某个极限。直觉上,一个随机变量序列依分布收敛到某个随机变量,如果:
- 对所有的,都有。
更严格的定义是探讨随机变量的累积分布函数。设有实值的随机变量序列 和某个随机变量(其累积分布函数为 ),如果对的每个连续点,都有,那么就说 依分布收敛到某个随机变量。记作:
, 或
由于依分布收敛只和随机变量的分布相关,所以也可以称一系列随机变量(依分布)收敛于某个分布。设是极限的分布,那么依分布收敛也可以记作:
或
例如一个随机变量序列依分布收敛到标准正态分布,就可以记作:
- 作为最弱的收敛方式之一,依分布收敛无法推出其它的收敛方式。对于存在概率密度函数的连续型随机变量序列,依分布收敛并不能推出其概率密度函数也同样收敛。例如对于概率密度函数为的随机变量序列,其依分布收敛到均匀分布的随机变量,但其概率密度函数不收敛[3]。
- 依分布收敛的等价定义:一个随机变量序列依分布收敛到某个随机变量和以下命题中的任意一个等价:
- 对所有的有界连续函数,都有: ;
- 对所有具有利普希茨连续性质的函数,都有: ;
- 对所有上有界的上半连续函数,都有: ;
- 对所有下有界的下半连续函数,都有: ;
- 对所有闭集,都有: ;
- 对所有开集,都有: ;
- 对关于的所有连续集,都有: 。
- 连续映射定理说明,对于连续函数g(·),如果随机变量序列 依分布收敛到随机变量,那么
也依分布收敛到随机变量。
- 列维连续性定理: 随机变量序列依分布收敛到某个随机变量 当且仅当对应的特征函数序列逐点收敛到某个在0处连续的函数(此时随机变量的分布为)。
- 列维-普罗科洛夫度量是依分布收敛的度量化结果。
各个收敛的定义有强弱之分。一个收敛性强于另一个是指从前者可以推出后者。例如依概率收敛强于依分布收敛,即是说如果一列随机变量依概率收敛到某个极限,那么必定也依分布收敛到这个极限。具体来说,收敛性的强弱关系可以用下图来表示:
-
依概率1收敛可以推出依概率收敛[4]:
-
依概率收敛可以推出存在依概率1收敛的子列[5]:
-
依概率收敛可以推出依分布收敛[4]:
-
对任意的,-收敛可以推出依概率收敛:
-
如果,那么-收敛可以推出-收敛:
-
如果序列依分布收敛到常数c,那么它也依概率收敛到常数c[4]:
-
如果序列依分布收敛到随机变量,并且和的差依概率收敛到0,那么 也依分布收敛到随机变量[4]:
-
如果序列依分布收敛到随机变量,并且 序列依分布收敛到常数c,那么向量列依分布收敛到随机变量[4]:
参见
参考资料
Gut, Allan. Probability: A graduate course. Theorem 3.4: Springer. 2005. ISBN 0387228330.
参考书籍
- Bickel, Peter J.; Klaassen, Chris A.J.; Ritov, Ya’acov; Wellner, Jon A. Efficient and adaptive estimation for semiparametric models. New York: Springer-Verlag. 1998. ISBN 0387984739.
- Billingsley, Patrick. Probability and Measure. Wiley Series in Probability and Mathematical Statistics 2nd. Wiley. 1986.
- Billingsley, Patrick. Convergence of probability measures 2nd. John Wiley & Sons. 1999: 1–28. ISBN 0471197459.
- Dudley, R.M. Real analysis and probability. Cambridge, UK: Cambridge University Press. 2002. ISBN 052180972X.
- Grimmett, G.R.; Stirzaker, D.R. Probability and random processes 2nd. Clarendon Press, Oxford. 1992: 271–285. ISBN 0-19-853665-8.
- Jacobsen, M. Videregående Sandsynlighedsregning (Advanced Probability Theory) 3rd. HCØ-tryk, Copenhagen. 1992: 18–20. ISBN 87-91180-71-6.
- Ledoux, Michel; Talagrand, Michel. Probability in Banach spaces. Berlin: Springer-Verlag. 1991: xii+480. ISBN 3-540-52013-9. MR 1102015.
- Romano, Joseph P.; Siegel, Andrew F. Counterexamples in probability and statistics. Great Britain: Chapman & Hall. 1985. ISBN 0412989018.
- van der Vaart, Aad W.; Wellner, Jon A. Weak convergence and empirical processes. New York: Springer-Verlag. 1996. ISBN 0387946403.
- van der Vaart, Aad W. Asymptotic statistics. New York: Cambridge University Press. 1998. ISBN 9780521496032.
- Williams, D. Probability with Martingales. Cambridge University Press. 1991. ISBN 0521406056.
- Wong, E.; Hájek, B. Stochastic Processes in Engineering Systems. New York: Springer–Verlag. 1985.