Rückruf im maschinellen Lernen ist eine kritische Maßnahme, die eine wichtige Rolle bei der Bewertung von Klassifizierungsmodellen spielt. Es ist zu verstehen, wie gut ein Modell echte positive Fälle identifizieren kann, insbesondere in Bereichen wie Gesundheitswesen, Finanzen und Betrugserkennung, in denen fehlende positive Instanzen erhebliche Konsequenzen haben können.
Was ist Erinnerung an maschinelles Lernen?
Rückruf ist eine Leistungsmetrik, mit der die Wirksamkeit eines Modells bei der Identifizierung tatsächlicher positiver Instanzen in einem Datensatz bewertet wird. Es ist besonders wichtig, wenn das Ziel es ist, falsch negative Negative zu minimieren, die auftreten, wenn ein Modell einen positiven Fall nicht erkennt.
Schlüsselleistungsindikatoren
- Verwirrungsmatrix: Ein grundlegendes Werkzeug, das wahre und falsche Vorhersagen in einem Modell veranschaulicht.
Die Verwirrungsmatrix
Die Verwirrungsmatrix bietet eine detaillierte Aufschlüsselung der Vorhersagen eines Modells, die dazu beitragen, seine Leistung zu visualisieren. Es zeigt, wie viele Vorhersagen korrekt oder falsch klassifiziert wurden.
Komponenten der Verwirrungsmatrix
- Wahre Positive (TP): Korrekt vorhergesagte positive Fälle.
- Fehlalarme (FP): Falsch vorhergesagte positive Fälle.
- Falsche Negative (FN): Verpasste positive Fälle.
Rückruf in der binären Klassifizierung
In der binären Klassifizierung wird der Rückruf berechnet, indem die Anzahl der echten positiven Ergebnisse mit allen tatsächlichen positiven Instanzen verglichen wird.
Definition und Berechnung
Die Formel zur Berechnung des Rückrufs lautet wie folgt:
Rückruf = Number of True Positives / (Total True Positives + Total False Negatives)
Beispiel für die Rückrufberechnung
In einem Datensatz mit einem Verhältnis von 1 Minderheitenklasse zu 1000 Mehrheitsklassen können Sie beispielsweise den Rückruf berechnen, indem Sie die Anzahl der wahren positiven und falschen Negative analysieren.
Erinnern in der Klassifizierung mit mehreren Klassen
Der Rückruf erstreckt sich über die binäre Klassifizierung hinaus und unter Berücksichtigung von Szenarien mit mehreren Klassen, in denen mehrere Kategorien vorhanden sind. Jede Klasse kann einzeln oder gemeinsam bewertet werden.
Erweiterung des Konzepts des Rückrufs
Bei der Bekämpfung des Rückrufs mit mehreren Klassen sind Anpassungen der Berechnungen erforderlich, um alle Klassen effektiv zu erfassen.
Multi-Class-Rückrufberechnung
Die Formel für einen Rückruf von mehreren Klassen kann ausgedrückt werden als:
Rückruf = True Positives in all classes / (True Positives + False Negatives in all classes)
Bedeutung und Strategie des Rückrufs
In Situationen mit unausgeglichenen Klassifizierungen ist die Maximierung des Rückrufs unerlässlich. Ein Modell, das die Minimierung falscher Negative priorisiert, kann in bestimmten Anwendungen von entscheidender Bedeutung sein.
Rückruf und Präzision ausbalancieren
Die Optimierung des Rückrufs ist zwar von wesentlicher Bedeutung, kann versehentlich zu einem Genauigkeitsrückgang führen, wodurch die Notwendigkeit betont wird, ein Gleichgewicht zu finden, das die Gesamtmodellleistung verbessert.
Präzision gegen Rückruf
Das Verständnis der Beziehung zwischen Rückruf und Präzision ist der Schlüssel zur effektiven Bewertung der Modellgenauigkeit.
Präzision definieren
Präzision bewertet die Richtigkeit positiver Vorhersagen anhand der folgenden Formel:
Präzision = True Positives / (True Positives + False Positives)
Verwenden der F1 -Punktzahl, um Metriken auszugleichen
Der F1 -Score kombiniert sowohl Rückruf als auch Präzision zu einer einzelnen Metrik und erleichtert eine ganzheitlichere Sichtweise der Modellleistung:
F1 = 2 × (precision × recall) / (precision + recall)