Daten: Fragen und Antworten

Was sind Prognosen und was können sie leisten?

Abstract

Was bedeuten Ergebnisse im Kontext?

Prognosen vs. Hochrechnungen

Einige Monate später stimmen Markus und Nina bei der Bundestagswahl ab. Als sie das Wahllokal wieder verlassen, wird Nina gebeten, anonym einen kurzen Fragebogen zu ihrer Stimmabgabe auszufüllen.

Von der Mitarbeiterin des Wahlforschungsinstituts erfahren sie, dass an dieser Nachwahlbefragung insgesamt rund 25.000 Personen in ausgewählten Städten und Gemeinden teilnehmen. Die Ergebnisse werden für die ersten Hochrechnungen am Abend verwendet. 

Image
Image
Grafik Personen vor Wahllokal

Die Ausgangssituation bei dieser Nachwahlbefragung ist eine andere als bei der Sonntagsfrage: Die Wähler*innen können nun angeben, wie sie tatsächlich gewählt haben. Sie sagen also nicht, wie sie voraussichtlich in Zukunft wählen werden. 

Dennoch sind auch diese Umfragen mit Vorsicht zu genießen: Die Rohdaten um 18 Uhr geben zunächst nur die Ergebnisse einzelner Befragungen wieder. Sie müssen also erstens gewichtet und zweitens um Prognosen zu den Briefwahlstimmen ergänzt werden.

Genauer wird das Ergebnis mit der ersten Hochrechnung, für die die bereits ausgezählten Stimmen verwendet werden. Im Lauf des Wahlabends werden die Hochrechnungen um immer mehr amtliche Teilergebnisse ergänzt. 

Image
Image
Grafik Prognosen vs. Hochrechnungen

Aufgabe

Interactive tasks

Unsicherheit bei Wahlprognosen

Am Wahlabend verfolgen Nina und Markus gespannt die ersten Hochrechnungen in den Nachrichten. Partei A liegt demnach bei 28 Prozent, Partei B bei 26 Prozent. Markus zweifelt nicht daran, dass Partei A die meisten Stimmen erhalten wird.

Allerdings steht neben einer eingeblendeten Grafik der Hinweis, dass die Ergebnisse eine Unsicherheit von +/- zwei Prozentpunkten haben. „Das Ergebnis könnte also auch genau andersherum ausfallen“, gibt Nina zu bedenken.  

Image
Image
Grafik Personen vor TV mit Diagrammen

Die Nachwahlbefragung hat Ninas Interesse geweckt, sich genauer über das Zustandekommen von Prognosen und Hochrechnungen zu informieren.

Sie hat erfahren, dass Statistiker*innen nie mit absoluter Sicherheit vorhersagen können, wie viel Prozent eine Partei exakt erhalten wird. Statistiker*innen berechnen deshalb sogenannte Prognoseintervalle, in denen sich die Ergebnisse mit hoher Wahrscheinlichkeit bewegen.  

Image
Image
Grafik Personen vor TV mit Diagrammen

Für die Prognoseintervalle gibt es feste Formeln. Häufig werden 95-Prozent-Intervalle angegeben: Die Wahrscheinlichkeit für eine richtige Vorhersage liegt dann bei 95 Prozent. Je mehr Menschen befragt werden, desto näher liegen die Intervallgrenzen beieinander, das Endergebnis lässt sich also genauer vorhersagen. 

Als Faustregel gilt, dass man für ein halb so großes Intervall vier Mal so viele Menschen befragen muss. Will man die Unsicherheit also auf +/- 0,5 Prozentpunkte verringern, benötigt man für die Prognose rund acht Mal so viele Befragte. Dadurch würden Umfragen allerdings wesentlich teurer. 

Fazit: Bei der Wahl, die Nina und Markus verfolgen, sind die Unterschiede zwischen den Parteien noch zu gering, um ein Ergebnis abzulesen. 

Image
Image
Diagramm Briefwahl

Eine Analogie: Nina und Markus naschen Bonbons. Die Tüte enthält insgesamt 50 gemischte Orangen- und Zitronenbonbons. Nach zehn Bonbons, unter denen fünf Zitronenbonbons gewesen sind, überlegen sie sich, was sie nun über den Anteil von Zitronenbonbons sagen können.

Nina vermutet: „Wenn ich absolut sicher schätzen müsste, würde ich sagen, dass mindestens fünf von 50, also 10 %, und höchstens 45 von 50, also 90 %, Zitronenbonbons in dieser Tüte gewesen sind“.

Markus sagt: „Wenn ich mich auf eine genaue Zahl festlegen müsste, würde ich sagen, dass genau 25, also 50 %, Zitronenbonbons in der Tüte gewesen sind. Aber wahrscheinlich waren es ein paar mehr oder weniger.“ … 

Image
Image
Grafik Paar sitzt am Tisch

… Nina hat ein sehr sicheres Intervall geschätzt, das aber auch sehr breit und deswegen nicht gerade präzise ist. Markus hat eine sehr präzise Schätzung abgegeben, die jedoch recht unsicher ist. Bei statistischen Schätzungen und Prognosen sucht man deswegen nach einem Mittelweg: Das Schätz- oder Prognoseintervall soll mit einer hohen Wahrscheinlichkeit den korrekten Wert enthalten und dabei so präzise sein, dass man damit praktisch etwas anfangen kann.

Denn bei einer Wahlprognose wäre es natürlich nicht hilfreich, wenn man am Ende nur aussagen könnte, dass eine Partei zwischen zehn und 90 Prozent der Stimmen erhält. 

Aufgabe

Interactive tasks