Die Darstellung von Daten beeinflusst die Wahrnehmung
Welche Information steckt in Daten?
Alles eine Frage der Definition
Nach dem Besuch schickt Carl Frisch den Geschwistern eine Präsentation, die auch ein Diagramm enthält. Es zeigt die Zahl von Kund*innen bei Kochevents und ihre Ausgaben bei einem Konkurrenz-Unternehmen der beiden. Emilia und Aaron finden die Darstellung sehr interessant. Beide Linien bewegen sich nach oben. Dann stellen sie fest, dass es zwei Y-Achsen gibt, eine für die Teilnahme-Zahlen und eine für die Ausgaben. Das ist verwirrend, denn die meisten Menschen sind eher an Darstellungen mit nur einer Y-Achse gewohnt.
In der Präsentation lesen die beiden außerdem, dass vor allem „reiche” Frauen die Events besuchten, während „arme” Männer kaum kämen. Beim Alter gebe es keine großen Unterschiede nach Geschlecht: Die Gruppe der 18- bis 49-Jährigen gebe mehr Geld aus als die Personen ab 50 Jahren. Emilia fragt nach, was „arm” und „reich” bedeuten.
Sie erfährt, dass Frischs Definitionen etwas seltsam sind: „reich“ setzt er bereits ab einem Haushaltsnettoeinkommen von 1500 Euro an. Zudem hat er nicht angegeben, wie es um „arme“ Frauen sowie „reiche“ Männer steht.
Eine solche Auswahl von Daten nennt man „Rosinenpicken”, weil dabei die Kategorien im Nachhinein so angepasst wurden, dass „gewünschte“ Ergebnisse herauskommen. Aaron wird von Emilias genauem Nachfragen angestachelt: „Aus der Kategorie „18 bis 49 Jahre“ können wir nichts ablesen, die ist viel zu breit zusammengefasst!”
Exercise:
Welche Werte hängen eigentlich zusammen?
Emilia und Aaron denken darüber nach, bei welchen Kund*innen sie ansetzen könnten, um ihren Gewinn zu steigern. In einem aktuellen Online-Video sehen sie, dass Deutschland im Durchschnitt immer älter wird. Die steigende Zahl von Rentner*innen bedeute, dass die Gesamtausgaben von Rentner*innen immer weiter ansteigen würden. „Stimmt das so?”, fragt Aaron. „Je mehr Leute, desto mehr Geld – ja, klingt logisch!”
Aber: Man muss herausfinden, wie hoch die Ausgaben pro Kopf sind. Dabei kann sich herausstellen, dass sie bei Rentner*innen niedriger sind als bei Berufstätigen. Das Video-Team hat also Informationen ignoriert, die für die korrekte Interpretation der Ergebnisse wichtig wären.
Zum Glück haben die Geschwister noch die genauen Auswertungen ihrer Kundenbefragung. Sie lesen, dass ein Teil ihrer Wochenend-Kund*innen tatsächlich mehr Geld ausgeben würde. Diese Personen sind im Schnitt etwas über 50 Jahre alt. „Aber alle unsere Kund*innen sind im Schnitt 50 Jahre alt. Was nützt mir dieser Wert dann?“, möchte Emilia wissen.
In den Unterlagen ist beschrieben, dass die Marktforscher*innen das Durchschnittsalter in zwei Schritten berechnet haben. Zuerst haben sie diejenigen Personen ausgewählt, die mehr Geld ausgeben wollen. Anschließend haben sie deren Durchschnittsalter berechnet und einen Wert von 50 Jahren erhalten.
Die Kund*innen, die ihre Ausgaben beibehalten wollen, waren im Schnitt 30 Jahre alt, diejenigen, die weniger ausgeben wollen, fast 70. Diese Informationen sind daher viel aussagekräftiger als das Durchschnittsalter aller Kund*innen. Sie zeigen, dass das Alter mit der Bereitschaft zusammenhängt, mehr Geld auszugeben.
Exercise:
Sowohl das Durchschnittsalter der Kaufwilligen ist 50 Jahre, als auch das Durchschnittsalter der gesamten Kundschaft.