Fachgebiet in der quantitativen Sozialforschung Aus Wikipedia, der freien Enzyklopädie
Die deskriptive (auch: beschreibende) Statistik hat zum Ziel, empirische Daten (z. B. Ergebnisse aus Experimenten) durch Tabellen, Kennzahlen (auch: Maßzahlen oder Parameter) und Grafiken übersichtlich darzustellen und zu ordnen. Dies ist vor allem bei umfangreichem Datenmaterial sinnvoll, da dieses nicht leicht überblickt werden kann.
Neben der deskriptiven Statistik gehören zur Statistik noch
Die explorative Statistik hat zum Ziel, bisher unbekannte Strukturen und Zusammenhänge in den Daten zu finden und hierdurch neue Hypothesen zu generieren. Diese auf Stichprobendaten beruhenden Hypothesen können dann im Rahmen der schließenden Statistik mittels wahrscheinlichkeitstheoretischer Methoden auf ihre Allgemeingültigkeit untersucht werden.
Von der induktiven oder inferentiellen Statistik (Inferenzstatistik) unterscheidet sich die deskriptive Statistik dadurch, dass sie keine Aussagen zu einer über die untersuchten Fälle hinausgehenden Grundgesamtheit macht und keine Überprüfung von Hypothesen ermöglicht.[1] Die deskriptive Statistik verwendet keine stochastischen Modelle (Grundlage der induktiven Statistik), so dass die getroffenen Aussagen nicht durch Fehlerwahrscheinlichkeiten abgesichert sind.
Die Methoden der deskriptiven Statistik können daher bei jeder Art von Stichproben angewandt werden, während für die Methoden der induktiven Statistik eine Reihe von Voraussetzungen, unter anderem an die Stichprobenziehung, gestellt werden müssen. Die Methoden der explorativen Statistik sind meist identisch mit denen der deskriptiven Statistik; es ist eher das Ziel der Analyse, was beide Teilgebiete unterscheidet.
Um die Daten darzustellen, gibt es im Wesentlichen drei Methoden:
Tabelle | Diagramm | Parameter | |
---|---|---|---|
Aggregation der Daten | niedrig | mittel | hoch |
Übersichtlichkeit | niedrig | mittel | hoch |
Informationsgehalt | hoch | mittel | niedrig |
Drei Arten von Kenngrößen sind hauptsächlich von Interesse:
Die Wahl der geeigneten Kenngrößen hängt vom Skalen- oder Messniveau der Daten und von der Robustheit der Kenngröße ab.
Seamless Wikipedia browsing. On steroids.