Loading AI tools
grafische Darstellung von Ungleichheit einer Verteilung Aus Wikipedia, der freien Enzyklopädie
Die Lorenz-Kurve (auch: Lorenzkurve) wurde 1905 vom US-amerikanischen Statistiker und Ökonomen Max Otto Lorenz (1876–1959) entwickelt. Sie stellt statistische Verteilungen grafisch dar und veranschaulicht dabei das Ausmaß an Disparität (Ungleichheit) beziehungsweise relativer Konzentration innerhalb der Verteilung. Deshalb wird sie auch als Disparitätskurve bezeichnet. Amtliche Statistiken nutzen die Lorenz-Kurve, um die Einkommensverteilung in einem Land zu verdeutlichen.[1] Grundlage dieser Berechnungen ist eine Liste der von links nach rechts aufsteigend sortierten Einzeleinkommen oder Einzelvermögen (siehe auch: Pen’s Parade).
Die Lorenz-Kurve ist eine Funktion im Einheitsquadrat des 1. Quadranten. Sie stellt dar, welche Anteile der gesamten Merkmalssumme auf welche Anteile der Grundmenge mit Merkmalsträgern entfallen. So werden auf der -Achse (Abszisse) die Anteile an der Gesamtheit der Merkmalsträger (zum Beispiel Bevölkerung), auf der -Achse (Ordinate) die Anteile an der gesamten Merkmalssumme (beispielsweise Einkommen) abgetragen. Zunächst werden die Daten dafür aufsteigend sortiert – beginnend mit dem geringsten Anteil an der Merkmalssumme – und dann kumuliert (summiert). Dadurch entsteht der charakteristische „Bauch“ der Lorenz-Kurve unterhalb der Diagonalen, welcher das Maß der Ungleichverteilung wiedergibt. Jeder Punkt auf der Lorenz-Kurve steht für eine Aussage wie „die unteren 20 % aller Haushalte beziehen 10 % des Gesamteinkommens“ (siehe: Paretoprinzip). Eine perfekte Einkommensgleichverteilung wäre eine Einkommensverteilung, bei der alle Personen das gleiche Einkommen besitzen. In diesem Falle würden stets die unteren der Gesellschaft des Einkommens haben. Dies lässt sich anschaulich durch eine Gerade darstellen. Man nennt sie perfekte Gleichverteilungsgerade (line of perfect equality). Dagegen wäre die perfekte Ungleichverteilung eine Verteilung, bei der eine Person über das gesamte Einkommen verfügt und alle anderen Personen kein Einkommen beziehen. In diesem Fall wäre die Kurve für alle und bei . Diese Kurve wird als perfekte Ungleichverteilungsgerade (line of perfect inequality) bezeichnet.
Der Gini-Koeffizient ist der Anteil der Fläche zwischen der perfekten Gleichverteilungsgerade und der beobachteten Lorenz-Kurve an der Fläche unter der Gleichverteilungsgerade. Der Gini-Koeffizient ist damit eine Zahl zwischen 0 und 1, je höher er ist, desto ungleicher ist die Verteilung.
Die Lorenz-Kurve ist als abschnittsweise lineare Kurve (d. h. als Polygonzug) durch die Punkte definiert. Sind die Anteile an der Gesamtheit der Merkmalsträger und die Anteile an der gesamten Merkmalssumme, so sind die Koordinaten der Punkte für definiert mit:
und
Die Lorenz-Kurve kann häufig durch eine Funktion dargestellt werden, wobei auf der Abszisse und auf der Ordinate abgetragen wird.
Für eine Population der Größe mit einer Folge von Werten , , die nach aufsteigender Reihenfolge indiziert werden , ist die Lorenz-Kurve die stetige, abschnittsweise lineare Funktion, die die Punkte (, ), verbindet, wobei , ist und für :
Dabei nennt man auch Lorenz-Asymmetrie-Koeffizient.
Für eine diskrete Wahrscheinlichkeitsfunktion seien , , die Punkte mit Non-/Nicht-Null-Wahrscheinlichkeiten nach steigender Reihenfolge indiziert . Die Lorenz-Kurve ist die stetige, abschnittsweise definierte, lineare Funktion, welche die Punkte (, ), , miteinander verbindet, wobei , ist und für gilt:
Für die Laplace-Verteilung, das heißt für alle , erhält man genau die oben genannten Formeln für und .
Für eine Wahrscheinlichkeitsdichtefunktion mit der kumulierten Wahrscheinlichkeitsverteilungsfunktion ist die Lorenz-Kurve definiert durch:
wobei μ der Erwartungswert der Verteilung ist. Für eine kumulierte Verteilungsfunktion mit der Umkehrfunktion ist die Lorenz-Kurve gegeben durch:
Die Umkehrfunktion könnte nicht existieren, da die kumulierte Verteilungsfunktion Sprungstellen (Unstetigkeitsstellen) oder Intervalle konstanter Werte aufweist. Die vorherige Gleichung behält ihre Gültigkeit, wenn man allgemeiner durch folgende Formel definiert:[2]
Betrachtet werde eine nichtnegative Zufallsvariable mit der dazugehörigen normierten Quantilsfunktion . Nach Joseph Lewis Gastwirth wird die Abbildung
als (stetige) Lorenz-Kurve von oder zur Verteilung von bezeichnet.[3][2]
Die Lorenz-Kurve hat folgende Eigenschaften:[4]
Die Lorenz-Kurve ist für einen Mittelwert der Wahrscheinlichkeitsverteilung von null oder unendlich nicht definiert.
Die Lorenz-Kurve für eine Wahrscheinlichkeitsverteilung ist eine stetige Funktion. Aber Lorenz-Kurven unstetiger Funktionen können als Grenzwert (Limes) der Lorenz-Kurven der Wahrscheinlichkeitsverteilungen formuliert werden – wie beispielsweise die perfekte Ungleichheitsgerade (line of perfect inequality).
Die Daten einer Lorenz-Kurve können durch den Gini-Koeffizienten und den Lorenz-Asymmetrie-Koeffizienten zusammengefasst werden.[5]
Die Lorenz-Kurve ist invariant unter positiver Skalierung. Falls eine Zufallsvariable ist, so besitzt die Zufallsvariable für jede positive Zahl die gleiche Lorenz-Kurve wie , wobei man unter der Lorenzkurve einer Zufallsvariablen natürlich diejenige der zugehörigen Verteilung versteht.
Die Lorenz-Kurve ist nicht invariant unter Translationen, das heißt unter einer konstanten Verschiebung der Werte. Ist eine Zufallsvariable mit einer Lorenz-Kurve und dem Mittel ist, dann erhält man für die Lorenz-Kurve der verschobenen Zufallsvariablen , wobei eine feste Konstante sei, folgende Formel:
Für eine kumulierte Verteilungsfunktion mit dem Mittelwert und der (verallgemeinerten) Umkehrfunktion gilt für jedes mit
Die Lorenz-Kurve einer Zufallsvariablen wird am Punkt gespiegelt, wenn man von zu übergeht, das heißt mit oben eingeführten Bezeichnungen:
Je gleichmäßiger die Merkmalssumme unter den Trägern verteilt ist, desto stärker nähert sich die Lorenz-Kurve der Diagonalen an. Im Extremfall der ökonomischen Gleichverteilung (statistische Einpunktverteilung) fällt sie mit ihr zusammen.
Im Falle größerer Disparität bewegt sich die Kurve nach unten in Richtung der Abszisse. Für den Extremfall der maximalen Ungleichverteilung (ein Merkmalsträger vereinigt die gesamte Merkmalssumme auf sich) verläuft die Lorenz-Kurve als Streckenzug auf der Abszisse bis und führt von dort zum Punkt .
Welche Form die Lorenz-Kurve genau annimmt, hängt davon ab, welcher Art die Daten des Merkmals sind. Grundsätzlich sind stetige Daten (siehe Beispielbild oben) von diskreten Daten zu unterscheiden. Im zweiten Fall ist die Lorenzkurve ein Streckenzug durch die Punkte .
Die Lorenz-Kurve bietet eine grafische Möglichkeit, das Ausmaß an Disparität innerhalb einer Verteilung zu betrachten. Je stärker sich die Kurve nach unten wölbt, desto größer die Disparität (siehe Abschnitt Extremfälle). Für den Fall, dass sich zwei Lorenz-Kurven schneiden, lässt sich anhand der Grafik jedoch nicht mehr eindeutig bestimmen, welche die größere Disparität aufweist. Auch ist die Messung mittels Grafik zu ungenau. Präzise Werte liefern dafür die Maßzahlen Gini-Koeffizient und Variationskoeffizient. Der Gini-Koeffizient steht dabei in einem direkten Zusammenhang mit der Lorenz-Kurve: Er ist das Zweifache der Fläche zwischen Lorenz-Kurve und Diagonale im Einheitsquadrat.
Eine Datenerhebung habe für 5 Klassen, die mit einem Index benannt seien, die relativen Häufigkeiten (Anteil der Merkmalsträger der Klasse an der Gesamtheit der Merkmalsträger) und die Anteile der Merkmalssumme, die auf die Klasse entfallen, der unten stehenden Tabelle ergeben. Daraus ermitteln wir
Index | Relative Häufigkeit | Kumulierte relative Häufigkeit | Disparität | Kumulierte Disparität |
---|---|---|---|---|
1 | 0,2 | 0,2 | 0,00 | 0,00 |
2 | 0,4 | 0,6 | 0,05 | 0,05 |
3 | 0,1 | 0,7 | 0,15 | 0,20 |
4 | 0,1 | 0,8 | 0,30 | 0,50 |
5 | 0,2 | 1,0 | 0,50 | 1,00 |
Erläuterung:
Die Lorenz-Kurve entsteht, indem man auf der Abszisse, auf der Ordinate aufträgt und die Punkte durch einen Streckenzug verbindet.
Der Artikel zur Paretoverteilung enthält ein weiteres Beispiel für eine Lorenz-Kurve.
Mittels der Lorenz-Dominanz kann das Verhältnis unterschiedlicher Lorenz-Kurven beschrieben werden. Für alle ordnet der Vektor die zugehörigen Koordinaten in nicht-absteigender Reihenfolge: . Der Vektor Lorenz-dominiert den Vektor mit
sofern gilt: für alle und für mindestens ein .
Diese Form wird auch als starke Lorenz-Dominanz bezeichnet. Dementsprechend Lorenz-dominiert ein Vektor einen anderen Vektor , sobald die zugehörige Lorenz-Kurve nicht unterhalb sowie mindestens einmal oberhalb der Lorenz-Kurve liegt. Eine Kurzschreibweise ist: .[6]
Gegeben seien zwei Verteilungen und mit . Die Lorenz-Kurve von liegt genau dann oberhalb der Lorenz-Kurve von , wenn für jede symmetrische und quasikonvexe Funktion gilt:
Folgerung: Wenn sich zwei Lorenz-Kurven schneiden, hängt es von der Wahl der jeweiligen symmetrischen und quasikonvexen Funktion ab, welche der beiden Kurven als die mit der größeren Ungleichheit zu bezeichnen ist.[7]
Als Disparitätsmaß (Maß der relativen Konzentration) lässt sich auch die Lorenz-Kurven-Länge anführen. Der Wertebereich ist für den Definitionsbereich gilt:
Diese lässt sich – wie der Name bereits vermuten lässt – von der diskreten Lorenz-Kurve ableiten, indem die Längen der Streckenabschnitte kumuliert werden. Für die Länge der diskreten Lorenz-Kurve gilt:
Dabei wird für jeden der Streckenabschnitte der euklidische Abstand für den Funktionsgraphen von verwendet.
Bei Gleichverteilung ist Bei absoluter Konzentration auf lediglich einen einzigen Merkmalswert ist
Die Länge der stetig differenzierbaren Lorenz-Kurve zwischen den Punkten sowie berechnet sich aus der ersten Ableitung der Lorenz-Kurven-Funktion , wie folgt:
mit .
In der Ökonomie wird die Lorenz-Kurve zur grafischen Darstellung der kumulierten Verteilungsfunktion der empirischen Wahrscheinlichkeitsverteilung des Vermögens benutzt; sie ist ein Graph, der das Maß der Verteilung zeigt, die für die unteren der Werte angenommen wird. Häufig wird sie dazu verwendet, um eine Einkommensverteilung darzustellen, wobei für die unteren der Haushalte illustriert wird, wie groß der Anteil des Gesamteinkommens in ist, den sie besitzen.[8] Der Anteil der Haushalte wird auf der Abszisse abgetragen, der Anteil des Einkommens auf der Ordinate. Sie kann ebenfalls zur Darstellung der Einkommensverteilung verwandt werden. In diesem Sinne betrachten viele Ökonomen die Lorenz-Kurve als Maß sozialer Ungleichheit (soziales Ungleichheitsmaß). Sie wurde im Jahre 1905 von Max O. Lorenz zur Darstellung der Ungleichheit der Einkommensverteilung entwickelt.
Neben der Illustration der Einkommensverteilung wird die Lorenz-Kurve auch zur Darstellung von Marktmacht oder räumlichen Verteilungen verwendet (vergleiche: Segregation).
Eine weitere Anwendung findet die Lorenz-Kurve in der logistischen ABC-Analyse, bei der die Lorenz-Kurve die Verteilung der Güter verdeutlicht, geordnet nach Klassifizierungseigenschaft (beispielsweise Wert) und Verbrauchsmenge.
Die Lorenz-Kurve lässt sich auch für Geschäftsmodelle verwenden – beispielsweise in den Konsumentenfinanzen, um die reale Nichtzahlung bei Fälligkeit (Delinquenz) von der Konsumenten mit den schlechtesten vorhergesagten Risiko-/Kreditscores.
Das Konzept der Lorenz-Kurve ist hilfreich für die Beschreibung der Ungleichheit zwischen den Anzahlen an Individuen in der Ökologie[5] und in Forschungsstudien zur Biodiversität nutzt man es, indem man den kumulierten Anteilen an Tierarten die kumulierten Anteile an Individuen gegenüberstellt.[9]
Die Disparität (Lorenz-Kurve) und (absolute) Konzentration (Konzentrationskurve) sind verwandte Maße, beschreiben aber unterschiedliche Dinge. Während die Lorenz-Kurve darstellt, welche Anteile der Merkmalssumme (Ordinate) auf welche Anteile an der Gruppe der Merkmalsträger (Abszisse) entfallen, stellt die Konzentrationskurve dar, welche Anteile der Merkmalssumme (Ordinate) auf welchen Merkmalsträger (Abszisse) entfallen. Das bedeutet, dass die Lorenz-Kurve Anteile mit Anteilen vergleicht, die Konzentrationskurve Anteile mit absoluten Zahlen (Abszisse). So können hohe Disparität und geringe Konzentration oder hohe Konzentration und geringe Disparität gleichzeitig auftreten. Folgendes Beispiel verdeutlicht die Frage:
Angenommen Unternehmen teilen sich einen Markt. In der Tabelle werden die Fälle von hoher und geringer Disparität bzw. Konzentration mit (fiktiven) absoluten Zahlen durchgespielt:
Disparität hoch | Disparität gering | |
---|---|---|
Konzentration hoch | ||
Konzentration gering |
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.