Dataconomy DE
Subscribe
No Result
View All Result
Dataconomy DE
Subscribe
No Result
View All Result
Dataconomy DE
No Result
View All Result

Die Studie stellt fest, dass Chatgpt-5 eine Fehlerrate von 25% hat

byKerem Gülen
September 25, 2025
in Artificial Intelligence
Home Artificial Intelligence
Share on FacebookShare on Twitter

Eine Studie zum ChatGPT-5-Modell von OpenAI ergab, dass es in ungefähr 25% der Fälle falsche Antworten generiert. Die Forschung führt diese Ungenauigkeiten auf inhärente Einschränkungen in den Trainingsdaten des Modells und der probabilistischen Architektur des Modells zu, wie in einem Tom -Leitfadenbericht beschrieben. Das Modell zeigt eine bemerkenswerte Verringerung der Fehler im Vergleich zu seinem Vorgänger GPT-4 und registriert 45% weniger sachliche Fehler und sechsmal weniger Fälle von „halluzinierten“ oder vollständig hergestellten Antworten. Trotz dieser Fortschritte bestätigt die Studie, dass ChatGPT-5 immer noch ein Überbewusstsein aufweisen kann, ein Phänomen, bei dem es sachlich falsche Informationen mit einem hohen Maß an Sicherheit darstellt. Diese Beharrlichkeit der Halluzination bleibt zwar verringert, aber ein zentrales Problem, das sich auf die Zuverlässigkeit auswirkt. Die Leistungsgenauigkeit variiert je nach spezifischer Domäne der Aufgabe erheblich. Zum Beispiel erzielte das Modell einen Genauigkeitswert von 94,6% für den Aime-Mathematik-Test 2025 und eine Erfolgsrate von 74,9% bei einer Reihe von Codierungszuweisungen in der realen Welt. Die Forschung zeigt, dass bei Aufgaben, die allgemeines Wissen beinhalten oder komplexe, mehrstufige Argumentation erfordern, bei denen die Leistung des Modells weniger konsistent ist. Bei der Bewertung des MMLU Pro-Benchmarks, einem strengen akademischen Test, der eine breite Palette von Themen wie Naturwissenschaften, Mathematik und Geschichte abdeckt, erzielte Chatgpt-5 eine Genauigkeit von ungefähr 87%. Die Studie identifiziert mehrere zugrunde liegende Ursachen für die verbleibenden Fehler. Dazu gehören die Unfähigkeit, nuancierte Fragen vollständig zu verstehen, sich auf Schulungsdaten zu verlassen, die möglicherweise veraltet oder unvollständig sind, sowie das grundlegende Design des Modells als probabilistische Mustervorhersagemechanismus, der Antworten erzeugen kann, die plausibel, aber nicht sachlich korrekt sind. Basierend auf diesen Ergebnissen empfiehlt der Bericht den Benutzern, alle von ChatGPT-5 erstellten kritischen Informationen unabhängig zu überprüfen. Diese Empfehlung ist besonders für professionelle, akademische oder gesundheitsbezogene Anfragen relevant, bei denen Präzision unerlässlich ist. Die konsistente Fehlerrate unterstreicht auch bei deutlichen Verbesserungen die Notwendigkeit vorsichtiger Verwendung und externe Validierung der Ausgaben des Modells.


Ausgewähltes Bildnachweis

Tags: CHATGPT-5Vorgestellt

Related Posts

Adobe führt KI-gestützte Objektmaske für Premiere Pro ein

Adobe führt KI-gestützte Objektmaske für Premiere Pro ein

Januar 20, 2026
Mitbegründer von Signal startet den datenschutzorientierten KI-Dienst Confer

Mitbegründer von Signal startet den datenschutzorientierten KI-Dienst Confer

Januar 20, 2026
Anthropic arbeitet mit Teach For All zusammen, um weltweit 100.000 Pädagogen auszubilden

Anthropic arbeitet mit Teach For All zusammen, um weltweit 100.000 Pädagogen auszubilden

Januar 20, 2026
OpenAI-Ziele "praktische Übernahme" für die Strategie 2026

OpenAI-Ziele "praktische Übernahme" für die Strategie 2026

Januar 20, 2026
Behauptung: NVIDIA hat grünes Licht für raubkopierte Buch-Downloads für KI-Schulungen gegeben

Behauptung: NVIDIA hat grünes Licht für raubkopierte Buch-Downloads für KI-Schulungen gegeben

Januar 20, 2026
Mutter eines von Elon Musks Kindern verklagt xAI wegen sexueller Grok-Deepfakes

Mutter eines von Elon Musks Kindern verklagt xAI wegen sexueller Grok-Deepfakes

Januar 16, 2026

Recent Posts

  • Forrester-Analyst: KI hat es nicht geschafft, die globale Produktivität zu steigern
  • Sequoia Capital schließt sich der 350-Milliarden-Dollar-Finanzierungsrunde von Anthropic an
  • TCL wird 51 % der TV-Marke Bravia von Sony besitzen
  • Adobe führt KI-gestützte Objektmaske für Premiere Pro ein
  • Netflix geht zu einem Barangebot für Warner Bros. Discovery über

Recent Comments

Es sind keine Kommentare vorhanden.
Dataconomy DE

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

  • Home
  • Sample Page

Follow Us

  • Home
  • Sample Page
No Result
View All Result
Subscribe

This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy Policy.