Матриця Гессе — квадратна матриця елементами якої є часткові похідні деякої функції. Це поняття запровадив Людвіг Отто Гессе (1844), використовуючи іншу назву. Термін «матриця Гессе» належить Джеймсу Джозефу Сильвестрові.
Визначення
Формально, нехай дано дійсну функцію від n змінних:
якщо у функції f існують всі похідні другого порядку, то можна визначити матрицю Гессе для цієї функції:
де тобто
Визначник цієї матриці називається визначником Гессе, або гесіаном.
Значення матриці Гессе пояснюється її появою у формулі Тейлора:
Матриці Гессе використовуються в задачах оптимізації методом Ньютона. Повне обчислення матриці Гессе може бути досить складним, тому були розроблені квазіньютонові алгоритми, засновані на наближених виразах для матриці Гессе. Найвідоміший з них — алгоритм Бройдена — Флетчера — Гольдфарба — Шанно.
Симетрія матриці Гессе
Мішані похідні функції f — це елементи матриці Гессе, що стоять не на головній діагоналі. Якщо вони неперервні, то порядок диференціювання не важливий:
Це можна також записати як
В цьому випадку матриця Гессе є симетричною.
Критичні точки функції
Якщо градієнт (її векторна похідна) рівний нулю в деякій точці , то ця точка називається критичною.
- Якщо матриця Гессе є додатно визначеною в точці , то — точка локального мінімуму функції .
- Якщо матриця Гессе є від'ємно визначеною в точці , то — точка локального максимуму функції .
- Якщо матриця Гессе не є ні додатно визначеною, ні від'ємно визначеною, причому є невиродженою (тобто ), то — сідлова точка функції .
Обрамлена матриця Гессе
У випадку оптимізації з додатковими умовами виникає також поняття обрамленої матриці Гессе. Нехай знову маємо функцію:
але тепер також розглянемо умови:
При оптимізації функції f з додатковими умовами обрамлена матриця Гессе має вигляд:
Для даної матриці можна сформувати різні головні мінори. Позначимо — головний мінор матриці, для якого останнім елементом на головній діагоналі є Тоді можна сформувати достатні умови екстремуму для функції при виконанні обмежень.
Функція буде мати максимум при виконанні умов, якщо знаки послідовних n - m мінорів будуть чергуватися, при чому знак буде рівний
Функція буде мати мінімум при виконанні умов, всі послідовні n - m мінорів мають один знак, а саме
Варіації і узагальнення
Якщо f — векторзначна функція, тобто
то її другі часткові похідні утворюють не матрицю, а тензор рангу n+1.
Література
- Григорій Михайлович Фіхтенгольц. Курс диференціального та інтегрального числення. — 2024. — 2403 с.(укр.)
- Кудрявцев Л. Д. Математический анализ. — М. : Высшая школа, 2004. — Т. 2. — 720 с.(рос.)
- Chiang, Alpha C., Fundamental Methods of Mathematical Economics, third edition, McGraw-Hill, 1984.
- Nocedal, Jorge; Wright, Stephen J. (2006), Numerical Optimization (2nd ed.), Berlin, New York: Springer-Verlag, ISBN 978-0-387-30303-1
Wikiwand in your browser!
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.