Loading AI tools
mathematische Funktionen Aus Wikipedia, der freien Enzyklopädie
In der Analysis heißt eine reellwertige Funktion konvex (lateinisch convexus ‚nach oben oder unten gewölbt‘), wenn ihr Graph unterhalb jeder Verbindungsstrecke zweier seiner Punkte liegt. Dies ist gleichbedeutend dazu, dass der Epigraph der Funktion, also die Menge der Punkte oberhalb des Graphen, eine konvexe Menge ist.
Eine reellwertige Funktion heißt konkav (lateinisch: concavus = gewölbt), wenn ihr Graph oberhalb jeder Verbindungsstrecke zweier seiner Punkte liegt. Dies ist gleichbedeutend dazu, dass der Hypograph der Funktion, also die Menge der Punkte unterhalb des Graphen, eine konvexe Menge ist.
Einer der ersten, der sich mit den Eigenschaften konvexer und konkaver Funktionen beschäftigte, war der dänische Mathematiker Johan Ludwig Jensen. Die nach ihm benannte Jensensche Ungleichung ist Grundlage wichtiger Resultate in der Wahrscheinlichkeitsrechnung, Maßtheorie und Analysis.
Die besondere Bedeutung konvexer bzw. konkaver Funktionen liegt darin, dass sie eine weitaus größere Gruppe als die linearen Funktionen bilden, aber ebenfalls viele einfach zu untersuchende Eigenschaften haben, welche Aussagen über nichtlineare Systeme ermöglichen. Da beispielsweise jedes lokale Minimum einer konvexen Funktionen auch ein globales Minimum ist, sind sie bei vielen Optimierungsproblemen von Bedeutung (siehe auch: Konvexe Optimierung). Selbst für konvexe Funktionale, die auf unendlichdimensionalen Räumen definiert sind, lassen sich unter bestimmten Voraussetzungen ähnliche Aussagen treffen. Daher spielt Konvexität auch eine wichtige Rolle in der Variationsrechnung.
Es gibt zwei äquivalente Definitionen, einerseits kann man Konvexität anhand einer Ungleichung über die Funktionswerte definieren (analytische Definition), andererseits über die Konvexität von Mengen (geometrische Definition).
Eine Funktion , wobei eine konvexe Teilmenge des ist, heißt konvex, wenn für alle aus und für alle gilt, dass
Hieraus lässt sich die Bedingung im Kopftext herleiten, dass der Graph der Funktion unterhalb der Verbindungsstrecke zweier seiner Punkte liegt.
Rechnerische Veranschaulichung der Herleitung |
Die nachfolgend beschriebenen geometrischen Objekte bebildern die analytische Aussage und ermöglichen in den Fällen oder eine anschauliche Vorstellung derselben.
Der Punkt sei die Koordinatendarstellung einer Abszisse . Dazu sei die Koordinatendarstellung eines Punktes des Graphen von mit Ordinate . lässt sich auch als ordinatenparallele Projektion von in den Abszissenraum auffassen. In der Schreibweise werden die Koordinaten der Abszisse durch den Punkt , den sie definieren, dargestellt.
Die Gerade durch die Punkte und des Graphen von hat eine Parameterform
hierbei ist der allgemeine Punkt und ein Richtungsvektor von . durchläuft für wachsende alle Punkte der Gerade von bis , wie die Betrachtung der -fachen von zeigt. Die ordinatenparallele Projektion des Punktes in den Abszissenraum ist ein nachfolgend als bezeichneter Punkt. hat die Ordinate .
hierbei ist der allgemeine Punkt und ein Richtungsvektor von . durchläuft für wachsende alle Punkte der Gerade von bis , wie die Betrachtung der -fachen von zeigt. Da der Definitionsbereich von als konvex vorausgesetzt ist, enthält er alle mit .
durchläuft für wachsende alle sich ordinatenparallel auf projizierenden Punkte des Graphen von von bis , wie die Betrachtung der -fachen von zeigt.
Die analytische Definition der Konvexität von : verlangt, dass für die betrachteten die Ordinate von höchstens so groß ist wie die Ordinate von . Insofern verläuft der Graph von unterhalb der Verbindungsstrecke . Dies war zu veranschaulichen. |
Eine Funktion () heißt konvex, wenn ihr Epigraph eine konvexe Menge ist. Diese Definition hat gewisse Vorteile für erweiterte reelle Funktionen, welche auch die Werte annehmen können und bei denen mit der analytischen Definition der undefinierte Term auftreten kann.[1] Aus der Konvexität des Epigraphen ergibt sich außerdem, dass die Definitionsmenge eine konvexe Menge ist. Eine konvexe Funktion hat also immer eine konvexe Definitionsmenge, umgekehrt ist eine Funktion nicht konvex, wenn ihre Definitionsmenge nicht konvex ist.
Ist eine konvexe Funktion, so heißt konkav. Für konkave Funktionen drehen sich die Definitionen jeweils um, die analytische Definition einer konkaven Funktion lautet also
die geometrische Definition einer konkaven Funktion fordert, dass der Hypograph eine konvexe Menge ist.
Eine Funktion heißt streng konvex oder strikt konvex, wenn die Ungleichung der analytischen Definition im strengen Sinn gilt; das heißt, für alle Elemente aus und alle gilt, dass
Eine Funktion heißt stark konvex mit Parameter bzw. -konvex, wenn für alle und gilt, dass
Stark konvexe Funktionen sind auch strikt konvex, die Umkehrung gilt jedoch nicht.
Des Weiteren gibt es den Begriff der gleichmäßig konvexen Funktion, welcher das Konzept der starken Konvexität verallgemeinert. Eine Funktion heißt gleichmäßig konvex mit Módul , wobei wachsend ist und nur bei 0 verschwindet, wenn für alle und gilt[2]
Wählt man mit , so erhält man die Ungleichung für starke Konvexität.
Für die Begriffe strikt konvex, stark konvex und gleichmäßig konvex lassen sich die entsprechenden Gegenstücke strikt konkav, stark konkav und gleichmäßig konkav definieren, indem die jeweiligen Ungleichungen umgedreht werden.
Wesentliche Aussagen zu konvexen und konkaven Funktionen finden sich bereits 1889 bei Otto Hölder, wobei er aber noch nicht die heute üblichen Bezeichnungen verwendete.[3] Die Begriffe konvexe und konkave Funktion wurden 1905 von Johan Ludwig Jensen eingeführt.[4] Jensen verwendete allerdings eine schwächere Definition, die noch gelegentlich, vor allem in älteren Werken,[5] zu finden ist. In dieser Definition wird nur die Ungleichung
vorausgesetzt. Wie Jensen aber zeigte, folgt daraus für stetige Funktionen die in der heute üblichen Definition verwendete Ungleichung
für alle zwischen 0 und 1.[6] (siehe auch: Abschnitt Konvexität und Stetigkeit)
Reellwertige Funktion, welche der oben genannten schwächeren Ungleichung () genügen, nennt man zu Ehren von Johan Ludwig Jensen Jensen-konvex oder kurz J-konvex.[7]
Die Funktion ist genau dann (streng) konvex, wenn die Funktion (streng) konkav ist. Eine nicht-konvexe Funktion muss jedoch nicht notwendigerweise konkav sein. Konvexität und Konkavität sind somit keine komplementären Eigenschaften.
Lineare Funktionen sind die einzigen Funktionen, die sowohl konkav als auch konvex sind.
Die kubische Funktion ist auf ganz betrachtet weder konvex noch konkav. Im Intervall aller positiven reellen Zahlen ist streng konvex. Die zu ihr additiv inverse Funktion ist dort somit streng konkav.
Da eine ungerade Funktion ist, also gilt, folgt daraus, dass sie im Bereich aller negativen Zahlen streng konkav ist.
Bei einer konvexen Funktion sind alle Subniveaumengen, also Mengen der Form
konvex. Bei einer konkaven Funktion sind alle Superniveaumengen konvex.
Die Jensensche Ungleichung ist eine Verallgemeinerung der analytischen Definition auf eine endliche Anzahl von Stützstellen. Sie besagt, dass der Funktionswert einer konvexen Funktion an einer endlichen Konvexkombination von Stützstellen kleiner oder gleich der Konvexkombination von den Funktionswerten an den Stützstellen ist. Für eine konvexe Funktion und für nichtnegative mit gilt also:
Für konkave Funktionen gilt die Ungleichung in umgekehrter Richtung.
Der Urbildraum einer konvexen Funktion kann ein beliebiger reeller Vektorraum sein, wie zum Beispiel der Vektorraum der reellen Matrizen oder der stetigen Funktionen. Die Konvexität einer Funktion ist aber äquivalent zur Konvexität der Funktion definiert durch für alle , wobei ist und eine beliebige Richtung aus ist. Es ist dann . Dies macht es möglich, die Dimension des Vektorraumes zu verringern, was die Überprüfung der Konvexität erleichtert.
Für oder drehen sich die Ungleichungen aus den Definitionen von (strikter) Konvexität bzw. Konkavität um. Sei beispielsweise eine auf konvexe Funktion. Für Punkte und aus gilt dann
sofern auch der Punkt im Definitionsbereich liegt. Wenn eine reelle konvexe Funktion ist, bedeutet die Ungleichung anschaulich, dass die Funktionswerte von außerhalb des Intervalls stets oberhalb der Verbindungsgeraden durch die Funktionswerte liegen.
Die Summe zweier (gegebenenfalls erweiterter) konvexer Funktionen ist wieder eine konvexe Funktion. Außerdem bleibt Konvexität beim Multiplizieren mit einer positiven reellen Zahl erhalten. Zusammenfassend gilt also, dass jede Positivkombination von konvexen Funktionen wiederum konvex ist. Sie ist sogar streng konvex, falls einer der auftretenden Summanden streng konvex ist. Analog dazu ist auch jede Positivkombination von konkaven Funktionen konkav. Somit bilden die konvexen Funktionen einen konvexen Kegel. Das Produkt konvexer Funktionen ist jedoch nicht notwendigerweise konvex.
Die Funktionen
sind konvex auf ganz , die Normparabel ist sogar strikt konvex. Daraus folgt, dass auch alle Funktionen der Form
mit strikt konvex auf ganz sind. Dies ist auch anschaulich klar, es handelt sich um nach oben gekrümmte Parabeln. Das Produkt der Funktionen und ist die kubische Funktion , welche (über ganz betrachtet) nicht konvex ist.
Die Grenzfunktion einer punktweise konvergenten Folge konvexer Funktionen ist eine konvexe Funktion. Ebenso ist die Grenzfunktion einer punktweise konvergenten Reihe konvexer Funktionen wieder eine konvexe Funktion. Analoges gilt klarerweise für konkave Funktionen. Strikte Konvexität bleibt unter der Grenzwertbildung jedoch nicht notwendigerweise erhalten, wie man anhand des ersten der beiden folgenden Beispiele erkennt.
Ist eine Menge konvexer Funktionen und existiert punktweise das Supremum
für alle , so ist auch eine konvexe Funktion. Der Übergang zur Funktion zeigt, dass das Infimum einer Menge konkaver Funktionen (falls es existiert) ebenfalls wieder eine konkave Funktion ist. Das Bilden des Infimums erhält jedoch nicht notwendigerweise Konvexität (und umgekehrt erhält das Bilden des Supremums nicht notwendigerweise Konkavität), wie das folgende Beispiel zeigt.
Die reellen Funktionen
sind linear und deshalb sowohl konvex als auch konkav. Das Supremum von und ist die Betragsfunktion . Diese ist zwar konvex, jedoch nicht konkav. Das Infimum von und ist die negative Betragsfunktion . Diese ist konkav, aber nicht konvex.
Über die Komposition zweier konvexer Funktionen und lässt sich im Allgemeinen keine Aussage treffen. Gilt jedoch zusätzlich, dass monoton steigend ist, so ist die Komposition ebenfalls konvex.
Des Weiteren ist die Komposition einer konkaven Funktion mit einer konvexen, monoton fallenden reellen Funktion wiederum eine konvexe Funktion.
Jede Komposition einer konvexen Funktion mit der Exponentialfunktion liefert wieder eine konvexe Funktion. Dies funktioniert auch im allgemeinen Fall, in dem auf einem reellen Vektorraum definiert ist. So ist beispielsweise für
wiederum eine konvexe Funktion. Insbesondere ist also jede logarithmisch konvexe Funktion eine konvexe Funktion.
Ist eine auf einem Intervall definierte, invertierbare und konvexe Funktion, so folgt aus der Konvexitätsungleichung
Sei eine monoton steigende Funktion. Dann dreht sich obige Ungleichung beim Anwenden von um. Es gilt somit:
Also ist die Umkehrfunktion eine konkave (und monoton wachsende) Funktion. Für eine invertierbare, monoton steigende und konvexe bzw. konkave Funktion hat daher die Umkehrfunktion die umgekehrte Art der Konvexität.
Für eine monoton fallende und konvexe Funktion gilt hingegen
Für eine invertierbare monoton fallende und konvexe bzw. konkave Funktion hat daher die Umkehrfunktion die gleiche Art der Konvexität.
Wenn der Ausgangsraum einer konvexen/konkaven Funktion ein topologischer Vektorraum ist (was insbesondere auf alle endlichdimensionalen reellen Vektorräume und somit auch auf zutrifft), können Aussagen über das Verhältnis von lokalen und globalen Extremalstellen getroffen werden. Es gilt dann, dass jede lokale Extremalstelle auch eine globale Extremalstelle ist. Strikte Konvexität bzw. Konkavität erlaubt außerdem Aussagen über die Eindeutigkeit von Extremwerten.
Eine stetige konvexe oder konkave Funktion nimmt auf der kompakten Menge ein Minimum und ein Maximum an. Die Kompaktheit von ist auf äquivalent dazu, dass beschränkt und abgeschlossen ist. Dies ist der Satz vom Minimum und Maximum angewendet auf konvexe und konkave Funktionen. Ist die Funktion strikt konvex, so ist das Minimum eindeutig bestimmt, ist sie strikt konkav, so ist das Maximum eindeutig bestimmt. Der Umkehrschluss gilt jedoch nicht: die Funktion hat kein globales Minimum in , ist aber strikt konvex.
Für eine stetige Funktion auf einem reflexiven Banachraum gibt es analoge Aussagen: Ein stetiges konvexes Funktional auf der kompakten Menge nimmt dort ein Minimum an. Ist das Funktional strikt konvex, so ist das Minimum eindeutig.
In topologischen Vektorräumen (welche fast immer gegeben sind) kann man auch lokale Minima untersuchen. Es gilt:
Dies lässt sich direkt mit den definierenden Ungleichungen von konvexen und konkaven Funktionen zeigen.
Außerdem ist die Menge der Minimalstellen einer konvexen Funktion konvex und die Menge der Maximalstellen einer konkaven Funktion konvex. Dies folgt aus der Konvexität der Subniveaumengen bzw. Superniveaumengen.
Für differenzierbare konvexe Funktionen nutzt man zur Bestimmung der Extremalwerte aus, dass konvexe Funktionen in jedem Punkt von der Tangente an diesem Punkt global unterschätzt werden. Es gilt , wobei das Standardskalarprodukt bezeichnet. Ist nun der Gradient in einem Punkt gleich null, so ist für alle und damit ist ein lokales (und damit globales) Minimum. Analog liegt bei konkaven Funktionen in einem Punkt immer ein lokales (und damit globales) Maximum vor, wenn der Gradient bzw. die Ableitung an diesem Punkt verschwindet.
Setzt man die Stetigkeit einer reellen Funktion voraus, so reicht, um ihre Konvexität zu zeigen, bereits die Bedingung, dass für alle aus dem Definitionsintervall folgende Ungleichung gilt:
Dies entspricht der Konvexitätsdefinition nach Jensen. Umgekehrt gilt, dass jede auf einem Intervall definierte Funktion, die die obige Ungleichung erfüllt, in den inneren Punkten stetig ist. Unstetigkeitsstellen können höchstens in Randpunkten auftreten, wie das Beispiel der Funktion mit
zeigt, die zwar konvex ist, aber am Randpunkt eine Unstetigkeit aufweist.
Somit sind die beiden Möglichkeiten, Konvexität zu definieren, zumindest für offene Intervalle äquivalent. Inwiefern dieses Resultat auf allgemeine topologische Räume übertragen werden kann, wird in den beiden folgenden Abschnitten behandelt.
In diesem Zusammenhang ist der Satz von Bernstein-Doetsch zu erwähnen, aus dem allgemein das folgende Resultat zu gewinnen ist:[8]
Eine stetige Funktion auf einer konvexen Teilmenge eines reellen topologischen Vektorraums ist konvex, wenn ein festes mit existiert, sodass für alle , aus gilt:
Dies kann man mittels geeigneter Intervallschachtelung zeigen. Ein vollständig ausgeführter Beweis befindet sich im Beweisarchiv.
Dass in dieser schwächeren Definition von Konvexität Stetigkeit benötigt wird, lässt sich anhand des folgenden Gegenbeispiels erkennen.
Sei eine Hamelbasis des Vektorraums über dem Körper , also eine über linear unabhängige Menge reeller Zahlen, so dass jede Zahl eine eindeutige Darstellung der Art mit endlich vielen hat. Dann ist bei beliebiger Wahl von gemäß Fortsetzungseigenschaft (jeder Vektorraum ist frei über seiner Basis) die Funktion linear über , erfüllt daher per Konstruktion für beliebige , ist aber nicht notwendigerweise konvex. Es genügt beispielsweise, die Konvexität durch Wahl der Funktionswerte an vier passend gewählten Basisvektoren zu verletzen.
Setzt man für eine Funktion zusätzlich zur Bedingung, dass für ein fixes die Beziehung
für alle , aus einer konvexen Teilmenge eines normierten Vektorraums gilt, noch voraus, dass nach oben beschränkt ist, so folgt daraus bereits die Stetigkeit von in den inneren Punkten von . Anschaulich wird dies daraus klar, dass man an einer Unstetigkeitsstelle eine beliebig steile Verbindungsgerade zwischen zwei Funktionswerten ziehen kann, wobei die Funktion zwischen den beiden Werten unterhalb der Verbindungsgeraden und außerhalb der beiden Werte oberhalb der Verbindungsgerade liegen muss. Kann die Verbindungsgerade nun beliebig steil werden, so stößt man irgendwann über die obere Schranke der Funktion.
Formal ist der Beweis allerdings etwas komplizierter. Eine vollständige Ausführung befindet sich im Beweisarchiv.
Die Aussage, dass eine konvexe beschränkte Funktion stetig in den inneren Punkten ist, ist auch bedeutsam für das Lösen der cauchyschen Funktionalgleichung
Aus dieser Aussage folgt nämlich, dass diese Funktionalgleichung eine eindeutige Lösung hat, wenn zusätzlich gefordert wird, dass beschränkt ist.
Konvexe Funktionen , die auf einer Teilmenge eines endlichdimensionalen reellen Vektorraums definiert sind, sind stetig in den inneren Punkten. Um das zu sehen, betrachte man einen inneren Punkt . Für diesen existiert ein Simplex mit den Eckpunkten , der wieder als inneren Punkt enthält. Jeder Punkt ist aber in der Form
und für alle darstellbar. Nach der jensenschen Ungleichung gilt nun
ist daher nach oben beschränkt auf und somit, wie oben gezeigt wurde, stetig im inneren Punkt .
Im unendlichdimensionalen Fall sind konvexe Funktionen nicht notwendigerweise stetig, da es insbesondere lineare (und somit auch konvexe) Funktionale gibt, die nicht stetig sind.
Eine auf einem offenen Intervall definierte, konvexe bzw. konkave Funktion ist lokal Lipschitz-stetig und somit nach dem Satz von Rademacher fast überall differenzierbar. Sie ist in jedem Punkt links- und rechtsseitig differenzierbar.
Die erste Ableitung lässt sich auf zweierlei Arten als Konvexitätskriterium verwenden. Eine stetig differenzierbare reelle Funktion ist
Dieses Resultat findet sich im Wesentlichen schon 1889 bei Otto Hölder.[3] Mit dem erweiterten Monotoniebegriff für vektorwertige Funktionen lässt sich dies auch für Funktionen erweitern. Dann ist genau dann (strikt/gleichmäßig) konvex, wenn (strikt/gleichmäßig) monoton ist.
Alternativ ist eine differenzierbare Funktion genau dann
Im Falle einer Funktion vereinfacht sich zu .
Betrachtet man als Beispiel den Logarithmus . Er ist auf dem Intervall stetig differenzierbar mit Ableitung .
Nach dem ersten Konvexitätskriterium muss jetzt die Ableitung auf Monotonie untersucht werden. Ist und , so ist , da Zähler und Nenner echt positiv sind. Somit ist streng monoton fallend und folglich ist streng konkav auf .
Nach dem zweiten Monotoniekriterium überprüft man für
Da aber für ist, gilt die Ungleichung, wenn ist und sind. Also ist der Logarithmus streng konkav auf .
Betrachtet man die Funktion
so sind alle partiellen Ableitungen stetig und für den Gradient gilt
Zur Überprüfung des ersten Konvexitätskriteriums bildet man für
da die quadratischen Terme immer echt positiv sind, die Positivität der Terme mit folgt aus der Monotonie der e-Funktion. Somit ist die Funktion strikt monoton, also auch strikt konvex.
Die Graphen differenzierbarer konvexer Funktionen liegen oberhalb jeder ihrer Tangenten. Analog dazu liegen konkave Funktionen stets unterhalb ihrer Tangenten. Dies folgt direkt aus dem zweiten Konvexitätskriterium. Dieses lässt sich auch so interpretieren, dass die Taylor-Entwicklung ersten Grades eine konvexe Funktion stets global unterschätzt. Aus diesen Eigenschaften folgt beispielsweise die Verallgemeinerung der bernoullischen Ungleichung:
Für eine zweimal differenzierbare Funktion lassen sich weitere Aussagen treffen. ist genau dann konvex, wenn ihre zweite Ableitung nicht negativ ist. Ist durchweg positiv, also stets linksgekrümmt, dann folgt daraus, dass streng konvex ist. Analog dazu ist genau dann konkav, wenn gilt. Ist durchweg negativ, also stets rechtsgekrümmt, so ist streng konkav.
Ist die mehrdimensionale Funktion zweimal stetig differenzierbar, dann gilt, dass genau dann konvex ist, wenn die Hesse-Matrix von positiv semidefinit ist. Ist die Hesse-Matrix von positiv definit, so ist strikt konvex. Umgekehrt ist genau dann konkav, wenn die Hesse-Matrix von negativ semidefinit ist. Ist die Hesse-Matrix von negativ definit, so ist strikt konkav.
Im Kern basieren die Konvexitätskriterien zweiter Ordnung auf der Überprüfung der Monotonie der Ableitung durch Monotoniekriterien, die wiederum auf Differenzierbarkeit basieren.
Die Funktion mit ist konvex, da für alle . Sie ist sogar streng konvex, was beweist, dass strenge Konvexität nicht impliziert, dass die zweite Ableitung positiv ist ( hat bei 0 eine Nullstelle).
Die oben betrachtete Funktion ist zweimal stetig differenzierbar auf mit zweiter Ableitung für alle . Also ist die Funktion streng konkav.
Betrachtet man die Funktion
so ist ihre Hesse-Matrix
Sie ist positiv definit, da alle ihre Eigenwerte echt positiv sind. Also ist strikt konvex.
Eine nicht-leere, abgeschlossene Teilmenge eines reellen normierten Vektorraums ist genau dann konvex, wenn die durch
definierte Abstandsfunktion eine konvexe Funktion ist.
Dieselbe Eigenschaft gilt nicht nur für Teilmengen des , sondern auch allgemein für Teilmengen von CAT(0)-Räumen, insbesondere von Riemannschen Mannigfaltigkeit nichtpositiver Schnittkrümmung. Die Konvexität der Abstandsfunktion ist ein wichtiges Hilfsmittel bei der Untersuchung nichtpositiv gekrümmter Räume.[9]
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.