Математи́чне сподіва́ння,[1]сере́днє зна́чення— одна з основних числових характеристик кожної випадкової величини. Воно є узагальненим поняттям середнього значеннясукупності чисел на той випадок, коли елементи множини значень цієї сукупності мають різну «вагу», ціну, важливість, пріоритет, що є характерним для значень випадкової змінної[2]. В теорії ймовірностей, математичне сподівання випадкової величини, інтуїтивно, є середнім значенням при довгостроковому повторенні одного і того ж експеримента, який воно представляє. Наприклад, математичне сподівання при підкиданні шестигранної гральної кісточки становить 3,5, оскільки середнє значення з усіх чисел, які можуть випасти становить 3,5 із тим як кількість підкидань прямує до нескінченності. Іншими словами, закон великих чисел стверджує, що середнє арифметичне всіх значень майже певно збігається до математичного сподівання, із тим як кількість повторів даного експерименту прямує до нескінченності. Математичне сподівання також іноді називають сподіванням, середнім, середнім значенням, або першим моментом.
Оскільки, випадкова величина може бути дискретною або задана густиною розподілу ймовірностей, тому теорія ймовірностей наводить два означення математичного сподівання.
У більш практичному розумінні, математичне сподівання дискретної випадкової величини є середнім зваженим по імовірності для всіх можливих значень. Іншими словами, кожне можливе значення випадкової величини фактично є помножене на його імовірність виникнення, і отриманий добуток складається у загальну суму, яка утворює математичне сподівання. Той самий принцип застосовується і для абсолютно неперервних випадкових величин, за винятком того, що сума замінюється на інтеграл для даної випадкової величини, по відношенню до її функції густини імовірностей. Формальне визначення охоплює обидва ці випадки, а також передбачає розподіли, які не є ні дискретними ні абсолютно неперервними; математичне сподівання випадкової величини є інтегралом, аргументом якого є ця випадкова величина відповідно до її міри імовірності[3][4].
Математичне сподівання не існує для випадкових величин, що мають певні розподіли імовірностей із великими "хвостами"[en], як наприклад, Розподіл Коші.[5] Для таких випадкових величин, довгий хвіст розподілу не передбачає, що сума або інтеграл будуть збіжними.
Математичне сподівання є ключовим аспектом, який характеризує розподіл ймовірностей; воно є одним із різновидів коефіцієнта зсуву. На противагу йому, дисперсія є мірою розсіяння можливих значень випадкової величини довкола математичного сподівання. Дисперсія сама по собі визначається в термінах двох математичних сподівань: це математичне сподівання квадратичного відхилення значень випадкової величини від математичного сподівання.
Нехай дискретна випадкова змінна може набувати значення відповідно з ймовірностями причому
.
Означення Чебишова: Математичним сподіванням будь-якої величини називається сума всіх можливих для неї значень, помножених на їхні ймовірності:[6]
,
де
— це середнє значення випадкової величини , областю можливих значень якої є множина ;
Нехай задає множину подій при підкиданні гральної кістки із шістьма сторонами. Результатом буде кількість точок на верхній грані після підкидання гральної кістки. Можливими значеннями, які прийматиме є 1, 2, 3, 4, 5, і 6, всі є рівноймовірними (кожне значення має ймовірність 1⁄6). Математичним сподіванням для буде
Якщо підкинути гральну кістку разів і розрахувати середнє (середнє арифметичне) всіх результатів, із збільшенням , середнє буде майже певнезбігатися до значення сподівання. Цей факт відомий як закон великих чисел. Одним із прикладів послідовності десяти випадань гральної кістки є 2, 3, 1, 2, 5, 6, 2, 2, 2, 6, для якого середнє буде дорівнювати 3.1, що відрізняється від математичного сподівання 3.5 на число 0.4. Зближення є відносно повільним: ймовірність що середнє знаходитиметься в межах 3.5 ± 0.1 дорівнює 21.6% для десяти спроб, 46.1% для сотні спроб і 93.7% для тисячі спроб. Див. графік на якому показані середні для довших послідовностей кидання гральної кістки на якому видно як вони збігаються до математичного сподівання із значенням в 3.5. У загальному випадку, швидкість зближення можна приблизно розрахувати за допомогою, наприклад, нерівності Чебишова і теореми Беррі-Ессіна[en].
При грі в рулетку невелика кулька може потрапити в одну із 38 пронумерованих секцій колеса, що розміщені по колу. Коли колесо розкручують кулька ударяється і рухається випадковим чином доки не зупиниться в одному з секторів. Нехай випадкова величина задає (грошовий) виграш при ставці в $1 на одне число («пряма» ставка). Якщо ставка виграє (що трапиться із ймовірністю 1⁄38), виграш становитиме $35; в іншому випадку гравець втрачає ставку. Очікуваним прибутком від такої ставки буде
Тобто, ставка в $1 коштуватиме втраті $0.0526, точніше її сподіванням є -$0.0526.
Математичним сподіванням такої числової змінної , якщо воно існує, називають інтеграл, узятий по області існування її густини розподілу, від добутку цієї випадкової змінної на її густину розподілу, тобто:
.
Математичне подівання існує, якщо цей інтеграл абсолютно збіжний.
Абстрактний інтеграл, що фігурує в означенні математичного сподівання, можна замінити відповідним інтегралом Лебега-Стілтьєса. Розглянемо випадок композиції борелівської функції та випадкової величини :
Доведення. За визначенням інтеграла Лебега для простої функції ,
Якщо X = Y тоді E[X] = E[Y]
Це твердження випливає із визначення інтеграла Лебега, якщо взяти до уваги, що , , і що заміна простої випадкової величини на множину із нульовою імовірністю не змінює математичного сподівання.
Математичне сподівання для сталої
Якщо це випадкова величина, і , де , тоді . Зокрема, для довільної випадкової величини , .
Доведення.
Нехай — це стала випадкова величина, тобто . З визначення інтеграла Лебега випливає, що . Також випливає, що . Із попередньої властивості,
Лінійність
Оператор математичного сподівання є лінійним в тому сенсі, що
де і є (довільними) випадковими величинами, і є скаляром.
Більш суворо, нехай і — випадкові величини, які мають визначені математичні сподівання (що відмінні від ).
Якщо також визначене (тобто відмінне від ), тоді
нехай є скінченним, а є скінченним скаляром. Тоді
Доведення.
1. Доведемо адитивність за допомогою декількох кроків.
1a. Якщо і є простими і невід'ємними, знаходячи перетини де це необхідно, перепишемо і у наступному вигляді
і
для деяких вимірних попарно-непересічних множин розбиття , і буде індикаторною функцією для множини . Адитивність випливає із перевірки прямим методом.
1b. Припустимо, що і є довільними не від'ємними величинами. Зауважимо, що кожна не-від'ємна вимірна функція є поточковою границею для поточкової не спадної послідовності із простих не від'ємних функцій. Нехай і є такими послідовностями, які збігаються до і відповідно. Ми бачимо, що поточково не спадає, і поточково. Відповідно до Теореми Леві про монотонну збіжність і випадку 1a,
(За допомогою теореми про монотонну збіжність можна перевірити, що це не веде до кругової логіки).
1c. В загальному випадку, якщо , тоді
and
Розділивши це,
що еквівалентно,
і зрештою,
2. Для доведення однорідності, припустимо спершу, що скаляр описаний перед цим не від'ємний. Скінченність передбачає, що також є скінченним. Тому, також скінченне, що зрештою гарантує, що є скінченним. Рівняння, таким чином, є простою перевіркою, що основана на визначенні інтеграла Лебега.
Якщо , тоді спершу доведемо, що спостерігаючи, що і навпаки.
E[X] існує і є скінченним тоді і тільки тоді, коли E[|X|] є скінченним
Такі твердження відносно випадкової величини — еквівалентні:
існує і є скінченним.
Обидва і є скінченними.
скінченне.
Насправді, . Відповідно до властивості лінійності, . Вищенаведена рівність спирається на визначення інтегралу Лебега і вимірність .
Завдяки цьому, вирази про те що « є інтегрованою» і «математичне сподівання є скінченним» є зрештою взаємозамінними, якщо говорять про випадкову величину.
Якщо X ≥ 0 тоді E[X] ≥ 0
Доведення.
Позначимо
Якщо , тоді ,
і звідси, за визначенням інтеграла Лебега,
З іншого боку, (майже скрізь), тож, якщо задати через подібний аргумент, , і таким чином
.
Монотонність
Якщо (a.s.), і обидва та існують, тоді .
Зауваження. and існую в тому розумінні, що and
Доведення випливає із властивості лінійності і попередньої властивості, якщо задати і звернути увагу на те, що (майже скрізь).
Якщо (майже скрізь) і є скінченною, тоді так само і для
Нехай і є випадковими величинами, такими що (майже скрізь) і . Тоді .
Доведення. Завдяки не від'ємності , існує, скінченне або нескінченне. Відповідно до властивості монотонності, , тож є скінченним, що в свою чергу як ми бачили буде еквівалентне тому, що є скінченним.
Якщо та тоді
Нижченаведене твердження буде використане для доведення властивості екстремальності для
.
Твердження. Якщо є випадковою величиною, тоді так само буде і , для будь-якого . Якщо в додаток до того, і
, тоді .
Доведення.
Аби зрозуміти чому перше твердження є справедливим, зауважимо, що є композицією із та . Оскільки це буде композицією двох вимірних функцій, то також є вимірною.
Аби довести друге твердження, визначимо
Можна перевірити, що є випадковою величиною і . Відповідно до властивості невід'ємності,
Відповідно до властивості монотонності,
Протилежний приклад для нескінченної міри
Вимога, що є суттєвою. Як протилежний приклад розглянемо вимірний простір
де це Борелівська -алгебра над інтервалом і є лінійною мірою Лебега. Можна довести, що навіть якщо ( і визначають міру над Зважаючи на неперервність для і спростивши інтеграл Рімана для кожного скінченного інтервала ), отримаємо необхідне доведення.
Властивість екстремальності
Відповідно до того, що було доведено вище, якщо це випадкова змінна, тоді так само і .
Твердження (властивість екстремальності для ). Нехай є випадковою величиною, і . Тоді і є скінченними, а найкраща апроксимаціяметодом найменших квадратів для серед сталих. Зокрема,
Пояснення (інтуїтивно зрозуміла інтерпретація властивості екстремальності). У простому розумінні, властивість екстремальності стверджує, що якщо існує задача передбачення результату[en]випробування для випадкової величини , тоді , в деякому практичному сенсі, є найкращим закладом (передбачення) якщо немає попередньої інформації про результат. З іншого боку, якщо в результаті отриманого результату існує деяке уточнене знання , тоді— знов, в деякому практичному сенсі— передбачення можна покращити використовуючи умовні математичні сподівання (серед яких є особливим випадком) замість .
Доведення твердження. Відповідно до попередніх властивостей, і
обидва є скінченними, і
звідки випливає властивість екстремальності.
Невиродженість
Якщо , тоді (майже певно).
Доведення.
Для будь-якої додатної сталої , . Насправді,
де це індикаторна функція для множини . Відповідно до вищенаведеної властивості, скінченність гарантує, що математичні сподівання і також є скінченними. Відповідно до властивості монотонності,
Для деякого цілого числа , задамо . Визначимо
,
і
Послідовність множин
монотонно не спадає, і . Відповідно до «неперервності знизу»,
. Застосувавши цю формулу, отримаємо
що і треба було довести.
Якщо тоді (майже певно)
Доведення.
Оскільки є визначеним (тобто ), і нам відомо, що є скінченним, і ми хочемо показати, що (майже певно). Покажемо, що де
Якщо тоді і доказ завершений. Припустивши, що визначимо
Дано, що , оберемо Для кожного визначимо
Очевидно, і
для деякої сталої незалежної від (Можна легко помітити, що, насправді, , але в даному випадку це нас не цікавить).
Припустимо, що Послідовність строго зростає, тому, за визначенням інтеграла Лебега,
що суперечить попередньому висновку, про те що є скінченним.
Наслідок: якщо тоді (майже певно)
Наслідок: якщо тоді (майже певно)
Для довільної випадкової величини буде вірною властивість , .
Доведення. Відповідно до визначення інтеграла Лебега,
Відмітимо, що цей самий результат можна довести за допомогою нерівності Єнсена.
Немультиплікативність
У загальному випадку, оператор математичного сподівання не є мультиплікативним, тобто не обов'язково дорівнюватиме . Насправді, нехай приймає значення 1 та -1 із імовірністю 0.5 кожне. Тоді
і
Величина, на яку відрізняється мультиплікативність називається коваріацією:
Однак, якщо випадкові величини і є незалежними, тоді , та .
Нехай задає ймовірнісний простір, де є Борелівською -алгеброю над і є лінійною мірою Лебега. Для визначимо послідовність випадкових величин
і випадкову величину
в інтервалі , і де є індикаторною функцією над множиною .
Для кожного при тому як і
тож З іншого боку, і таким чином
Зліченна неадитивність
У загальному випадку, оператор математичного сподівання не -адитивний, тобто
Розглянемо обернений приклад, нехай є ймовірнісним простором, де це Борелівська -алгебра у інтервалі і це лінійна міра Лебега. Визначимо послідовність випадкових величин у , де задає індикаторну функцію над множиною . Для поточкових сум, матимемо що
Відповідно до скінченності адитивності,
З іншого боку, і тому
Зліченна адитивність для не від'ємних випадкових величин
Нехай є довільною випадковою величиною із скінченним математичним сподіванням і скінченною дисперсією . Нерівність Чебишова стверджує що, для будь-якого дійсного числа ,
Примітка 1. Математичне сподівання є добре визначеним навіть якщо може приймати нескінченні значення. Насправді, передбачає, що (майже певно), тому випадкова величина майже певно є визначеною, і таким чином є достатньо інформації для розрахунку .
Примітка 2. Нерівність Єнсена передбачає, що оскільки, функція абсолютного значення є опуклою.
Нерівність Ляпунова
Нехай . Нерівність Ляпунова стверджує, що
Доведення. Застосувавши Нерівність Єнсена до і , отримаємо
. Знайшовши -ий корінь для кожної сторони отримаємо те, що необхідно було довести.
Нехай послідовність випадкових величин і випадкових величин та визначені у одному і тому ж ймовірносному просторі Припустимо, що
всі математичні сподівання та є визначеними (відрізняються від );
;}
для кожного
це поточкова границя для (майже певно), тобто (майже певно).
Теорема про монотонну збіжність стверджує, що
Доведення.
Відповідно до монотонності, помітимо що послідовність монотонно не спадає, і
Якщо тоді що і треба було знайти.
Якщо тоді, із наступного припущення про те, що ми робимо висновок, що є скінченним, що в свою чергу, передбачає, як ми перед цим бачили, що є скінченною (майже певно).
Позначимо і . Скінченність (майже певно) передбачає, що різниці та є визначеними (не мають форму ) усуди за межами нульової множини. В нульовій множині, та можна визначити довільним чином (тобто як нуль, або в будь-який інший спосіб допоки це зберігатиме вимірність), так що це не впливатиме на доведення. Оскільки вони є різницями випадкових величин, то і також є випадковими величинами.
Із визначення випливає, що (майже певно), (майже певно), послідовність поточково не спадає (м.п.), і поточково (м.п.).
Із (узагальненої версії) теореми про монотонну збіжність,
Нехай послідовність випадкових величин і окрема випадкова величина будуть визначені в єдиному ймовірнісному просторі Припустимо, що
всі математичні сподівання і визначені (відрізняються від );
;}
(м.п.), для кожного
Лема Фату стверджує, що
(Зауважимо, що є випадковою величиною, для кожного відповідно до властивостей нижньої границі).
Доведення.
Якщо тоді відповідно до властивості монотонності, тож із наступним твердженням, що випливає із цього.
Якщо , тоді, відповідно до припущення про те, що ми робимо висновок, що є скінченною, що в свою чергу зумовлює, як ми бачили перед тим, що є скінченним (м.п.).
Позначимо . Тоді (м.п.). Скінченність величини (м.п.) зумовлює, що є визначеним (не приймає форму ) усюди за межами нульової множини. В цій нульовій множині може визначатися довільним чином (наприклад, нулем або у будь-який інший спосіб, до тих пір доки зберігається вимірність) без впливу на доведення. Як різниця двох випадкових величин, є також випадковою величиною.
Відповідно до узагальненої версії леми Фату,
звідки випливає твердження.
Наслідок. Нехай
поточково (м.п.);
для деякої сталої (незалежної від );
;}
(м.п.), для кожного
Тоді
Доведення виконують спостерігаючи за тим, що (м.п.) і застосовуючи лему Фату.
Наявність логарифма в останньому виразі робить неможливим обчислення цього інтегралу (внаслідок необмеженості логарифма при необмеженому аргументі), що і доводить відсутність математичного сподівання випадкової величини .
Існує можливість побудувати таке математичне сподівання, яке буде дорівнювати імовірності події, якщо розраховувати його як математичне сподівання від індикаторної функції, яка приймає за одиницю факт виникнення події, і нуль у іншому випадку. Цей взаємозв'язок може використовуватися для застосування властивостей математичного сподівання і поширення їх до властивостей імовірностей, тобто, використовувати закон великих чисел, щоб обґрунтувати спосіб оцінки імовірностей за допомогою визначення частоти їх виникнення.
Математичні сподівання для різних степенів величини X називаються моментами величини X; центральний момент довкола середнього значення величини X це математичні сподівання степенів X − E[X]. Моменти деяких випадкових величин можуть використовуватися для визначення їх розподілів, через їх твірні функції моментів.
Для того, щоб імпіричним шляхом знайти оцінку математичного сподівання деякої випадкової величини, на основі неодноразово отриманих вимірах спостережень необхідно розрахувати середнє арифметичне значення для цих результатів. Якщо математичне сподівання існує, ця процедура дозволяє оцінити істинне математичне сподівання незміщеного виду і дозволяє мінімізувати суму квадратів залишків (суму квадратичних відстаней між спостереженнями і статистичними оцінками). Закон великих чисел демонструє (при досить м'яких умовах) що, із збільшенням розмірувибірки, дисперсія цієї статистичної оцінки зменшується.
Цю властивість використовують у дуже широкому колі різноманітних застосувань, включаючи загальні задачі теорії статистичного оцінювання та машинного навчання, що дозволяє оцінити (ймовірнісні) величини, що представляють інтерес, за допомогою методів Монте-Карло, оскільки більшість з цих величин можна представити у вигляді математичних сподівань, тобто , де є характеристичною функцією для множини .
В класичній механіці, the центр мас є поняттям, яке аналогічне математичному сподіванню. Наприклад, припустимо, що X це дискретна випадкова величина, що приймає значення xi і має відповідні імовірності pi. Розглянемо невагомий стрижень, на якому здовж цього стрижня розміщені елементи ваги, в місцях розташування xi, які мають маси pi (сума яких дорівнює одиниці). Точка, в якій цей стрижень буде збалансований буде відповідати E[X].
Математичні сподівання також можна використовувати для розрахунку дисперсії, за допомогою формули розрахунку дисперсії:
Дуже важливою областю застосування математичного сподівання є квантова механіка. Математичне сподівання для оператора квантової механіки , що виконує операцію над вектором квантового стану записується як . Невизначеність для можна розрахувати за допомогою формули .
Richard W Hamming (1991). Example 8.7–1 The Cauchy distribution. The art of probability for scientists and engineers. Addison-Wesley. с.290 ff. ISBN0-201-40686-1. Архів оригіналу за 22 березня 2015. Процитовано 17 березня 2019. Sampling from the Cauchy distribution and averaging gets you nowhere — one sample has the same distribution as the average of 1000 samples!