Handlungsfeld Arbeit

Fehler in den Datenquellen

Abstract

Lektion 4

Frau Harloff, übernehmen Sie!

Lisa und Judith wollen gerade gehen, da blinkt auf dem Bildschirm von Ivo Kovač eine Warnung auf. Die Temperatur liegt im roten Bereich, in den nächsten Stunden könnte ein Ausfall der Maschine drohen. Die Systemprognose zeigt jedoch an, dass die Maschine nicht sofort abgeschaltet werden muss. So kann die Produktion der aktuellen Serie noch abgeschlossen werden. Judith wirft einen Blick auf die Programmdaten.

Image
Image
arb-L4-02-05-a

Judith: Ah, interessant. Schau mal, Ivo. Erst hat der Vibrationssensor einige Auffälligkeiten aufgezeichnet, dann hat sich die Temperatur erhöht.

Ivo: Also hat eine Vibration die Überhitzung ausgelöst?

Judith: Vermutlich, ich habe da schon einen Verdacht. Schauen wir uns noch die Tonaufzeichnungen an … Das dachte ich mir doch!

Ivo: Noch eine Auffälligkeit?

Judith: Ja, der Schall-Sensor schlägt auch aus. Na, was meinst du, Lisa?

Lisa: Vielleicht hat sich ein Teil gelockert?

Judith: Das denke ich auch. Jetzt warten wir noch den Abschluss der gerade produzierten Serie ab und dann schauen wir nach.

Image
Image
arb-L4-02-05-b

Wo liegt das Problem?

Tatsächlich hat Lisa mit ihrer Vermutung recht: Ein lockeres Bauteil ist das eigentliche Problem. Die erhöhte Temperatur hatte Judith und sie auf die richtige Spur gebracht, denn es gibt einen Zusammenhang zwischen den Variablen erhöhte Temperatur und der Ausfallwahrscheinlichkeit. Diese Art des Zusammenhangs nennt man Korrelation.

Es gibt noch eine dritte Variable, nämlich die erhöhte Vibration. Sie hat den Temperaturanstieg verursacht und ist somit die eigentliche Ursache des Problems. In diesem Fall spricht man von Kausalität. Zwischen Temperatur und Ausfallwahrscheinlichkeit besteht also eine Korrelation, aber eben keine Kausalität.

Image
Image
Grafik Störung oder Messfehler

Für die Datenmessung kann es also sinnvoll sein, nicht nur Werte zu überwachen, die in einem konkreten kausalen Zusammenhang stehen, sondern auch andere Werte zu messen, die nicht die Ursache für einen Ausfall sind, aber mit der ursächlichen Variablen in Zusammenhang stehen, also korrelieren. 

Diese Werte lassen sich womöglich einfacher oder genauer messen. Sie können einen Hinweis auf ein auftretendes Problem geben. Entscheidend ist, dass man genau versteht, welche Einflüsse welche Auswirkungen haben können.

Exercise:

Description

Stell dir vor, du siehst eine*n Mitarbeiter*in an den Maschinen vorbeilaufen. Er/Sie ist ganz vertieft in einen Bauplan. Kurz darauf meldet eine Maschine einen Fehler. Was könnte passiert sein? Bring die Begriffe in die richtige Reihenfolge.

Interactive tasks

Trügerische Daten

Daten bilden unsere Wirklichkeit ab, allerdings immer nur bestimmte Aspekte. Jede Datenquelle liefert minimal unterschiedliche Daten, je nachdem, mit welchen Sensoren und an welcher Position sie erfasst wurden. Man muss davon ausgehen, dass jede einzelne Datenquelle relativ unvollständig ist und Fehler beinhalten kann.

Image
Image
arb-L4-02-07-a

Man kann in einer Smart Factory zwar Daten (etwa Geräusche, Temperatur oder Energieverbrauch) dazu nutzen, die Ausfallwahrscheinlichkeiten von Maschinen vorherzusagen. Dennoch lässt sich aus den Daten nicht immer verlässlich auf einen Störfall oder Totalausfall schließen.

Vielleicht wurde die wahre Ursache des Defekts in den Daten gar nicht erfasst, da nur Daten, die möglicherweise damit zu tun haben (ein merkwürdiges Geräusch oder ein hoher Energieverbrauch) erhoben wurden. Diese Daten werden auch Proxy-Variablen genannt, weil sie stellvertretend für das eigentliche Problem stehen.

Exercise:

Description

Stellvertreter-Variablen begegnen dir auch im Alltag. Beispielsweise neigen Menschen dazu anzunehmen, eine Person mit hohem Einkommen sei beruflich erfolgreich, eine Person mit niedrigem Einkommen dagegen nicht. Der berufliche Erfolg, der schwer messbar ist, wird über das Einkommen, das eindeutig messbar ist, hergeleitet. Das Einkommen ist in diesem Fall eine Proxy-Variable für den beruflichen Erfolg.


Von welcher Proxy-Variablen würdest du auf welches Merkmal schließen?

Interactive tasks

Geplanter Ausfall?

Die Möglichkeit, auf Datengrundlage vorhersagen zu können, wann ein Gerät kaputtgeht, bringt Lisa auf einen Gedanken. Ihre Mutter regt sich oft darüber auf, dass Geräte heutzutage viel schneller kaputtgehen als früher. Und das meistens genau dann, wenn die Garantie gerade abgelaufen ist. Lisas Mutter fragt sich, ob die Hersteller das extra so planen.

Lisa weiß inzwischen, dass bei der Produktion der Zufall eine gewisse Rolle spielt: Beispielsweise kann die Qualität von Materialien schwanken, weshalb zwei Waschmaschinen nie identisch sind.

Können Hersteller planen, wann ihre Produkte ausfallen? Das funktioniert tatsächlich, aber anders, als Lisas Mutter vermutet. Der Hersteller plant nur, dass ein Gerät möglichst nicht während der Garantie ausfällt.

Image
Image
Grafik Waschmaschine

Der Ausfall eines Geräts ist vom Zufall abhängig. Das bedeutet in der Statistik aber nicht, dass man gar nichts darüber weiß. Vielmehr bedeutet Zufall, dass sich etwas nur mit einer bestimmten Wahrscheinlichkeit aussagen lässt.

Man kann zum Beispiel sagen, dass die Wahrscheinlichkeit für einen Geräteausfall nach 1.000 Schleudergängen bei 30 Prozent liegt. Das lässt sich durch Produktionseinstellungen oder Gerätetests kontrollieren.

Fällt ein Gerät während der Garantiezeit aus, haftet der Hersteller. Deshalb werden Geräte so produziert, dass die Wahrscheinlichkeit eines Ausfalls während der Garantiezeit möglichst gering ist.

Exercise:

Description

Teste dein Wissen!

Interactive tasks