Dataconomy DE
Subscribe
No Result
View All Result
Dataconomy DE
Subscribe
No Result
View All Result
Dataconomy DE
No Result
View All Result

Die Studie stellt fest, dass Chatgpt-5 eine Fehlerrate von 25% hat

byKerem Gülen
September 25, 2025
in Artificial Intelligence
Home Artificial Intelligence
Share on FacebookShare on Twitter

Eine Studie zum ChatGPT-5-Modell von OpenAI ergab, dass es in ungefähr 25% der Fälle falsche Antworten generiert. Die Forschung führt diese Ungenauigkeiten auf inhärente Einschränkungen in den Trainingsdaten des Modells und der probabilistischen Architektur des Modells zu, wie in einem Tom -Leitfadenbericht beschrieben. Das Modell zeigt eine bemerkenswerte Verringerung der Fehler im Vergleich zu seinem Vorgänger GPT-4 und registriert 45% weniger sachliche Fehler und sechsmal weniger Fälle von „halluzinierten“ oder vollständig hergestellten Antworten. Trotz dieser Fortschritte bestätigt die Studie, dass ChatGPT-5 immer noch ein Überbewusstsein aufweisen kann, ein Phänomen, bei dem es sachlich falsche Informationen mit einem hohen Maß an Sicherheit darstellt. Diese Beharrlichkeit der Halluzination bleibt zwar verringert, aber ein zentrales Problem, das sich auf die Zuverlässigkeit auswirkt. Die Leistungsgenauigkeit variiert je nach spezifischer Domäne der Aufgabe erheblich. Zum Beispiel erzielte das Modell einen Genauigkeitswert von 94,6% für den Aime-Mathematik-Test 2025 und eine Erfolgsrate von 74,9% bei einer Reihe von Codierungszuweisungen in der realen Welt. Die Forschung zeigt, dass bei Aufgaben, die allgemeines Wissen beinhalten oder komplexe, mehrstufige Argumentation erfordern, bei denen die Leistung des Modells weniger konsistent ist. Bei der Bewertung des MMLU Pro-Benchmarks, einem strengen akademischen Test, der eine breite Palette von Themen wie Naturwissenschaften, Mathematik und Geschichte abdeckt, erzielte Chatgpt-5 eine Genauigkeit von ungefähr 87%. Die Studie identifiziert mehrere zugrunde liegende Ursachen für die verbleibenden Fehler. Dazu gehören die Unfähigkeit, nuancierte Fragen vollständig zu verstehen, sich auf Schulungsdaten zu verlassen, die möglicherweise veraltet oder unvollständig sind, sowie das grundlegende Design des Modells als probabilistische Mustervorhersagemechanismus, der Antworten erzeugen kann, die plausibel, aber nicht sachlich korrekt sind. Basierend auf diesen Ergebnissen empfiehlt der Bericht den Benutzern, alle von ChatGPT-5 erstellten kritischen Informationen unabhängig zu überprüfen. Diese Empfehlung ist besonders für professionelle, akademische oder gesundheitsbezogene Anfragen relevant, bei denen Präzision unerlässlich ist. Die konsistente Fehlerrate unterstreicht auch bei deutlichen Verbesserungen die Notwendigkeit vorsichtiger Verwendung und externe Validierung der Ausgaben des Modells.


Ausgewähltes Bildnachweis

Tags: CHATGPT-5Vorgestellt

Related Posts

JBL bringt KI-betriebene BandBox-Verstärker auf den Markt

JBL bringt KI-betriebene BandBox-Verstärker auf den Markt

Januar 23, 2026
Spotify führt KI-gestützte Prompted Playlists ein

Spotify führt KI-gestützte Prompted Playlists ein

Januar 22, 2026
Anthropic überarbeitet Einstellungstests dank Claude AI

Anthropic überarbeitet Einstellungstests dank Claude AI

Januar 22, 2026
Anthropic überarbeitet Claudes Verfassung mit neuen Grundsätzen der Sicherheitsethik

Anthropic überarbeitet Claudes Verfassung mit neuen Grundsätzen der Sicherheitsethik

Januar 22, 2026
YouTube führt KI-Tools zur Ähnlichkeitsverwaltung für YouTuber ein

YouTube führt KI-Tools zur Ähnlichkeitsverwaltung für YouTuber ein

Januar 22, 2026
Amazon integriert den Health AI-Assistenten in die mobile App One Medical

Amazon integriert den Health AI-Assistenten in die mobile App One Medical

Januar 22, 2026

Recent Posts

  • Barret Zoph wird den aggressiven kommerziellen Pivot von OpenAI leiten
  • Substack geht mit dem Start der Beta-TV-App ins Wohnzimmer
  • LiveKit wird als Motor hinter dem Sprachmodus von ChatGPT mit einer Bewertung von 1 Milliarde US-Dollar bewertet
  • Vimeo beginnt nach der Übernahme von Bending Spoons mit Personalentlassungen
  • AWS und Prime Video schlagen zu, während Amazon eine neue Entlassungswelle vorbereitet

Recent Comments

Es sind keine Kommentare vorhanden.
Dataconomy DE

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

  • Home
  • Sample Page

Follow Us

  • Home
  • Sample Page
No Result
View All Result
Subscribe

This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy Policy.