Modellgüte – Was ist das und wann lohnt es sich, dies genauer anzuschauen?
Nehmen wir einmal an, wir nutzen ein KI-System, um Kündigungen unserer Top-Kunden vorherzusagen. Das System meldet uns stolz eine Genauigkeit von 90 %. Das klingt erst einmal hervorragend, oder? Doch bei genauerem Hinsehen bemerken wir die Falle: Von 100 Kunden kündigen tatsächlich nur 10. Wenn das Modell einfach pauschal sagt „Niemand kündigt“, liegt es statistisch in 90 Fällen richtig – hat aber den strategischen Nutzen von Null, da es jeden einzelnen der 10 Abwanderer übersieht.
Dieser Fall zeigt uns deutlich: Die reine Trefferquote (Accuracy) reicht nicht aus. Um die wahre Modellgüte zu bewerten, müssen wir tief in die Struktur der Vorhersagefehler blicken. Hier kommen die vier Grundzustände der Klassifizierung ins Spiel, die bestimmen, ob unser Modell ein wertvolles Werkzeug oder ein teures Risiko für das Unternehmen darstellt.
Diese Zustände bilden die Basis der sogenannten Confusion Matrix:
- True Positive (TP): Der Volltreffer – Wir sagen „Kündigung“ voraus und der Kunde kündigt wirklich.
- True Negative (TN): Die korrekte Ruhe – Wir sagen „Bleibt“ voraus und der Kunde bleibt treu.
- False Positive (FP): Der Fehlalarm – Wir sagen „Kündigung“, aber der Kunde wollte gar nicht gehen.
- False Negative (FN): Der blinde Fleck – Wir sagen „Bleibt“, aber der Kunde geht heimlich.
Die Kennzahlen der Modellgüte: Wie wir Qualität messbar machen
Um die Performance vergleichbar zu machen, nutzen wir spezielle Raten, die direkt aus diesen Zuständen abgeleitet werden:
Ein Thema, viele Namen: Wer spricht wie darüber?
Es kann verwirrend sein, da verschiedene Disziplinen eigene Begriffe nutzen.
Der Rauchmelder als Klassifikator
Denk an unseren Hausbau: Ein Rauchmelder ist im Grunde ein Klassifizierungs-System.
Das strategische Trade-off: Wo setzen wir den Fokus?
Ein perfektes Modell ohne Fehler gibt es fast nie. Daher müssen wir eine strategische Wahl treffen:
In der Business Intelligence ist diese Güte-Matrix nicht nur eine Hilfe, sondern Pflicht. Sobald wir Prozesse automatisieren, müssen wir die Fehlerraten kennen, um den ROI seriös zu berechnen. Erst die Evaluation dieser Kennzahlen macht aus Daten ein verlässliches Steuerinstrument für das Management.