Statistische Fakten – zwei erkenntnistheoretische Probleme

Es werden zwei erkenntnistheoretische Probleme bei der Erzeugung „statistischer Fakten“ erklärt. Zum einen muss gerechtfertigt werden, weshalb eine Variable überhaupt mit statistischen Methoden beschrieben werden kann und inwiefern die empirischen Daten aussagekräftig genug sind, damit statistische Daten zum statistischen Faktum werden. Zum anderen muss bei der statistischen Faktenbildung die Möglichkeit der inadäquaten Reduktion berücksichtigt werden: Wenn nicht genügend Variablen erhoben werden, können die erfassten Korrelationen irreführend sein.

  18. Jänner 2015

„Jede Entscheidung soll auf Fakten beruhen“. Es wäre töricht, einen derartig tautologischen Satz anfechten zu wollen. Was „Fakten“ sind – oder vielmehr sein sollen – ist hingegen eine äußerst komplexe Frage. Ich möchte in diesem Artikel untersuchen, was statistische Fakten leisten können und sollen.

Die statistische Erhebung von Daten ist eine Möglichkeit zur Herstellung von Objektivität im Bereich der Sozialwissenschaften. Sie stellt die Grundlage für die (zurecht) geforderte objektive Rechtfertigung politischen Handelns1 dar. Bei der Verwendung derartiger statistischer Fakten sollten zwei wichtige erkenntnistheoretische Probleme nicht außer Acht gelassen werden: einerseits die Rechtfertigung und Relevanz der statistischen Faktenbildung und andererseits die inadäquate Reduktion der untersuchten Variablen.

Natürlich bestehen bei der Erhebung von Statistiken im sozialwissenschaftlichen Bereich auch vielfältige Probleme praktischer Natur: Wie wird eine konkrete Variable formuliert? Wie kann sichergestellt werden, dass (z. B. bei Umfragen) diese Variable dann auch tatsächlich erhoben wird und nicht eine andere? Über solche erschwerenden Komplikationen werde ich in diesem Artikel hinwegsehen.

Rechtfertigung und Aussagekraft statistischer Faktenbildung

Ersteres (zumindest Statistikern relativ bekanntes) Problem ist der statistischen Methode eigentümlich. Eine Variable kann nur dann statistisch modelliert werden, wenn davon ausgegangen werden kann, dass sie gewisse Eigenschaften besitzt, wie z. B. einen wohldefinierten Mittelwert und Varianz. Nicht jede Variable ist dieser Natur und die statistische Behandlung muss (obwohl es nur in den seltensten Fällen passiert) aus diesem Grund mithilfe von Zusatzannahmen gerechtfertigt werden.2

Weil statistische Daten auf endlichen Stichproben beruhen, muss darüber hinaus auch die Frage der Aussagekraft geklärt werden. Wie viele Personen müssen zum Beispiel zu ihrer politischen Präferenz befragt werden, um die reale Variable – ein Wahlergebnis – zuverlässig vorherzusagen? Um diese Frage zu beantworten bedarf es zusätzlicher mathematischer Annahmen über die Variable (welche Verteilung liegt ihr zugrunde?), aber auch einer normativen Entscheidung: Wieviel Unsicherheit wird akzeptiert? Ist eine Aussage, die mit 80% Wahrscheinlichkeit richtig ist, schon ein „Faktum“, oder doch erst wenn sie mit 95%, 99% oder gar 99.9% Wahrscheinlichkeit zutrifft? Um diese Frage zu entscheiden, müssen Normen herangezogen werden, die mit dem Zweck der Statistik zusammenhängen.3

Statistische Fakten sind in zweifacher Art mehr als reine empirische Daten. Erstens muss gerechtfertigt werden, weshalb die zu beschreibende Variable überhaupt mithilfe statistischer Methoden untersucht werden kann und zweitens inwiefern die empirischen Daten aussagekräftig genug sind, um zu einem Faktum zu werden.

Inadäquate Reduktion

Das zweite Problem, das meines Wissens nur sehr selten thematisiert wird, betrifft die Schnittstelle zwischen Empirie und Theorie, ist also nicht nur für statistische Fakten relevant. Angenommen, es werden zwei Variablen (z. B. \(K\): bei der Person wurde ein Kaiserschnitt durchgeführt und \(G\): die Größe der Person) erfasst und die Verteilung dieser Variablen wird (nach gewissen normativen Kriterien) sorgfältig genug erhoben um zum statistischen Faktum zu werden. Ein solches Faktum kann sein, dass bei kleinen Personen signifikant öfter ein Kaiserschnitt durchgeführt wurde als bei großen, d.h.

$$P(K|G<170~\text{cm}) \gg P(K|G>170~\text{cm}).$$

Dieses Faktum scheint die Hypothese zu verifizieren, dass eine Korrelation zwischen der Größe von Frauen und der Wahrscheinlichkeit, dass sie ein Kind mit Kaiserschnitt zur Welt zu bringen, besteht.

Doch betrachten wir nun zusätzlich eine dritte Variable \(S\) – das Geschlecht der Person. Nun stellt sich heraus, dass gegeben das Geschlecht, die Wahrscheinlichkeit, dass ein Kaiserschnitt durchgeführt wurde überhaupt nicht mit der Größe der Frauen korreliert, also

$$P(K|S, G) = P(K|S).$$

Es ist ein komplett unterschiedliches – auf den ersten Blick widersprüchlich scheinendes – statistisches Faktum! Es ist nur eines von vielen Beispielen dafür, dass sich die Korrelation zwischen zwei Variablen, gegeben eine dritte, komplett ändern kann.4 Man könnte man das Spiel weiterspielen und eine vierte, fünfte, Variable einführen, welche die Korrelationen zwischen \(K\) und \(G\) wieder komplett verändern könnte.

Die Paradoxie beruht auf einer inadäquaten Reduktion: Werden nicht genügend Variablen zur Datenanalyse herangezogen, um die relevanten Korrelationen adäquat einfangen zu können, sind die Korrelationen nicht aussagekräftig. Deshalb müssen schon bei der Konstruktion eines empirischen Faktums (und insbesondere eines statistischen Faktums) Hilfshypothesen bezüglich der kausalen Struktur der Variablen herangezogen werden.5

Statistische Fakten hängen auch von denjenigen Variablen ab, die nicht erfasst wurden. Um sinnvolle Korrelationen einzufangen, muss schon ein adäquates kausales Modell vorliegen. Es ist ein Spezialfall der „Theoriegeladenheit“ von empirischen Daten.

Der Einkommensbericht 2014 des Rechnungshofs ist ein politisch relevantes Beispiel für die Schaffung statistischer Fakten, die meines Erachtens auf einer inadäquaten Reduktion beruhen. Er wird Gegenstand eines eigenen Artikels sein.


  1. Siehe z. B. den inbesondere von Australien ausgehenden Trend zu evidence-based policy

  2. Diese Annahmen können in vielen Bereichen der Sozialwissenschaften unzulässig sein, vgl. Brian (2014): Ökonomen, eure Wahrscheinlichkeiten sind dem Ende nahe. In: Macho, Thomas (Hg.): Bonds. Schuld, Schulden und andere Verbindlichkeiten. München: Wilhelm Fink. 

  3. Siehe z. B. verschiedene Einschätzungen der statistischen Signifikanz in der klinischen Forschung. 

  4. Viele derartige Beispiele sind als Simpson-Paradoxon bekannt. 

  5. Vgl. Pearl (2000): Causality: Models, Reasoning and Inference. Cambridge University Press, Cambridge.