Datenkram

Statistik macht Spass! Mit ein paar wenigen Grundlagen ist man in der Lage sich selber ein Bild von Zusammenhängen zu machen. Inzwischen gibt es etliche öffentlich zugängliche Datensätze und auch grafische Quellen/Aufarbeitungen die eine Betrachtung von Zusammenhängen ermöglicht. Eine davon ist gapminder, eine schwedische Organisation die politisch, religiös und ökonmisch unabhängig Daten auswertet, kuratiert und einer breiten Öffentlichkeit zugänglich macht.

Ein Beispiel : Gut 50.000€ inflationsbereinigtes Durschnittsbruttoeinkommen klingt für 50% der Deutschen viel. Die andere Hälfte nimmt es als eher durchschnittlich oder gar gering war. Das liegt in der Natur der Sache von Durchschnitts- oder Medianwerten.
Die weltweite Sicht hilft vielleicht diesen Wert zunächst global besser einzuordnen.

Global gesehen liegt Deutschland am oberen Ende der weltweiten Einkommensstatistik.

Das bedeutet aber nicht, dass Alle ein Einkommen haben, von dem sie in Deutschland gleichgut leben können. So vereinigt die Gruppe des 10% einkommensstärksten Quantils gut 20% des Einkommens auf sich.

Mit Daten kann also auch Meinung gemacht werden - im schlimmsten Fall können FakeNews zur Realität werden. Um so wichtiger sich mit Datenquellen und Methoden auseinderzusetzen um nicht alles ungeprüft glauben zu müssen was heute in der weiten Welt der sogenannten "Sozialen Medien" veröffentlicht wird. 

Grundlagen

Um Vergleiche großer Datenmengen möglich zu machen, ist es sinnvoll und erforderlich die Datensätze zunächst zusammenzufassen - zu aggregieren - und Kennzahlen zu bilden. Zwei Begriffe sind schon gefallen, Mittelwert und Median. Der Mittelwert stellt dabei vereinfacht ausgedrückt die Summe aller aufgetretenen Werte geteilt durch die Anzahl der Werte, der Median den mittleren in der nach der Größe sortierten Reihenfolge dar. So betrug das Durchschnittsalter aller Deutschen 2019 44,5 Jahre der Altersmedian hingegen 45,7 Jahre je 50% waren also jünger bzw. älter. Und so sehen diese nackten Kennzahlen grafisch aufbereitet aus:

 

Zusammenhänge zwischen Daten werden mittels Korrelation untersucht. Diese geben einen Hinweis auf Abhängigkeiten, beweisen aber nicht immer die Kausalität dieser Zussammenhänge wie u.a. Tylor Vigen eindrucksvoll auf seiner Website darstellt.



Es ist also Vorsicht geboten, nicht immer ist es einfach Daten richtig zu deuten und noch schwieriger ist es die richtigen Schlüsse zu ziehen.