Regressionsparameter

Interpretation des Absolutglieds und der Steigung

Zusammenfassung

Kontext

y_{i}=\beta _{0}+x_{i1}\beta _{1}+\dotsc +x_{ik}\beta _{k}+\varepsilon _{i}=\mathbf {x} _{i}^{\top }{\boldsymbol {\beta }}+\varepsilon _{i}

bzw. in Matrixschreibweise

\mathbf {y} =\mathbf {X} {\boldsymbol {\beta }}+{\boldsymbol {\varepsilon }}

Den Parameter $\beta _{0}$ bezeichnet man als Niveauparameter, Achsenabschnitt, Absolutglied, Regressionskonstante oder kurz Konstante (engl. intercept).

Die Parameter $\beta _{1},\dotsc ,\beta _{k}$ nennt man Steigungsparameter, Steigungskoeffizienten oder Anstieg (engl. slope).

Die $\varepsilon _{i}$ sind Störgrößen.

Man unterscheidet bei der Interpretation der Regressionskoeffizienten die folgenden Fälle:

Level-Level-Transformation

Im Fall, bei der die endogene Variable untransformiert (level) ist und die exogene Variable ebenfalls (level) gilt aufgrund von $\operatorname {E} (\mathbf {y} |\mathbf {X} )=\mathbf {X} {\boldsymbol {\beta }}$

\operatorname {E} (y_{i}|\mathbf {x} _{i})=\beta _{0}+x_{i1}\beta _{1}+\dotsc +x_{ik}\beta _{k}

Damit gilt für den Niveau- und den Steigungsparameter:

\beta _{0}=\operatorname {E} (y_{i}|x_{i1}=x_{i2}=\dotsc =x_{ik}=0)

und

\beta _{j}={\frac {\partial \,(y_{i}|\mathbf {x} _{i})}{\partial \,x_{ij}}}

, ceteris paribus (c.p.),

j=1,\ldots ,k

Der Niveauparameter lässt sich wie folgt interpretieren: Die Zielgröße $y$ beträgt im Mittel $\beta _{0}$ (bzw. ${\hat {\beta }}_{0}$ ) wenn alle Regressoren $0$ sind.

Für den jeweiligen Steigungsparameter $\beta _{j}$ gilt: Steigt $x_{ij}$ c.p. um eine Einheit, dann steigt $y_{i}$ im Mittel um $\beta _{j}$ -Einheiten.

Log-Log-Transformation

Im Fall, bei der die endogene Variable logarithmisch transformiert (log) ist und die exogene Variable ebenfalls (log) gilt

\beta _{j}={\frac {\partial \,(\ln(y_{i}^{\dagger })|\mathbf {x} _{i})}{\partial \,\ln(x_{ij}^{\dagger })}}={\frac {\frac {\partial \,((y_{i}^{\dagger })|\mathbf {x} _{i})}{y_{i}^{\dagger }|\mathbf {x} _{i}}}{\frac {\partial \,(x_{ij}^{\dagger })}{x_{ij}^{\dagger }}}}

, ceteris paribus (c.p.),

j=1,\ldots ,k

Dies kann wie folgt interpretiert werden: Steigt das transformierte $x_{ij}$ c.p. um 1 %, dann steigt das transformierte $y_{i}$ im Mittel um $\beta _{j}$ -Prozent. Ökonomisch würde dies der Interpretation als Elastizität entsprechen.

Remove ads

Standardisierte Regressionskoeffizienten

Zusammenfassung

Kontext

Die standardisierten Regressionskoeffizienten $\beta _{j}$ (gelegentlich auch Beta-Werte oder Beta-Gewicht genannt) ergeben sich aus einer linearen Regression, in der die unabhängigen und abhängigen Variablen standardisiert worden sind, das heißt, der Erwartungswert gleich Null und die Varianz gleich Eins gesetzt wurde. Sie können auch direkt berechnet werden aus den Regressionskoeffizienten der linearen Regression:

\beta _{j}=b_{j}\cdot {\frac {s_{x_{j}}}{s_{y}}}

wobei $b_{j}$ der Regressionskoeffizient für Regressor $x_{j}$ ,
$s_{x_{j}}$ Standardabweichung der unabhängigen Variable $x_{j}$
und $s_{y}$ Standardabweichung der abhängigen Variable $y$

Sind die standardisierten erklärenden Variablen $Z(X_{j})$ untereinander unabhängig und auch unabhängig vom Störterm $\varepsilon$ (Voraussetzung im klassischen Regressionsmodell), dann gilt

{\begin{aligned}1={\rm {Var}}(Z(Y))&={\rm {Var}}(\beta _{0}+\beta _{1}Z(X_{1})+\ldots +\beta _{p}Z(X_{p})+\varepsilon )\\&=\beta _{1}^{2}\underbrace {{\rm {Var}}(Z(X_{1}))} _{=1}+\ldots +\beta _{p}^{2}\underbrace {{\rm {Var}}(Z(X_{p}))} _{=1}+{\rm {Var}}(\varepsilon ),\end{aligned}}

das heißt die Summe der quadrierten standardisierten Regressionskoeffizienten ist kleiner gleich Eins. Sind einer oder mehrere der standardisierten Regressionskoeffizienten größer als Eins bzw. kleiner als minus Eins, weist dies auf Multikollinearität hin.

Remove ads

Beispiel

Zusammenfassung

Kontext

Thumb — Regressionskoeffizienten in der linearen Regression im Boston Housing Datensatz.

Für die abhängige Variable Mittlerer Hauspreis in selbstbewohnten Häusern pro Bezirk (in 1000 US$) aus dem Boston Housing Datensatz ergibt sich das nebenstehende Regressionsmodell:

Jedes Zimmer zusätzlich im Haus verteuert den Kaufpreis um 4873 US$,
jeder Kilometer mehr zu einer Arbeitsstätte reduziert den Kaufpreis um 461 US$ und
jeder Prozentpunkt mehr beim Anteil der Unterschichtbevölkerung reduziert den Kaufpreis um 723 US$.

Standardisiert man alle Variablen, kann man den Einfluss einer erklärenden Variablen auf die abhängige Variable abschätzen:

Den größten Einfluss hat die Variable Anteil der Unterschichtbevölkerung: −0,562,
den zweitgrößten Einfluss hat die Variable Anzahl Zimmer: 0,372 und
die Variable Entfernung zu Arbeitsstätten hat den geringsten Einfluss: −0,106.

Wären die Variablen unabhängig voneinander, könnte man anhand der quadrierten Regressionskoeffizienten den Anteil der erklärten Varianz angeben:

Die Variable Anteil der Unterschichtbevölkerung erklärt knapp 32 % der Varianz des mittleren Hauspreises ( $0{,}316=(-0{,}562)^{2}$ ),
die Variable Anzahl Zimmer erklärt knapp 14 % der Varianz des mittleren Hauspreises ( $0{,}138=0{,}372^{2}$ ) und
die Variable Entfernung zu Arbeitsstätten erklärt etwas mehr als 1 % der Varianz des mittleren Hauspreises ( $0{,}011=(-0{,}106)^{2}$ ).

Regressionsparameter

Interpretation des Absolutglieds und der Steigung

Level-Level-Transformation

Log-Log-Transformation

Standardisierte Regressionskoeffizienten

Beispiel

Literatur

Einzelnachweise

Wikiwand - on