Dataconomy DE
Subscribe
No Result
View All Result
Dataconomy DE
Subscribe
No Result
View All Result
Dataconomy DE
No Result
View All Result

Die Studie stellt fest, dass Chatgpt-5 eine Fehlerrate von 25% hat

byKerem Gülen
September 25, 2025
in Artificial Intelligence
Home Artificial Intelligence

Eine Studie zum ChatGPT-5-Modell von OpenAI ergab, dass es in ungefähr 25% der Fälle falsche Antworten generiert. Die Forschung führt diese Ungenauigkeiten auf inhärente Einschränkungen in den Trainingsdaten des Modells und der probabilistischen Architektur des Modells zu, wie in einem Tom -Leitfadenbericht beschrieben. Das Modell zeigt eine bemerkenswerte Verringerung der Fehler im Vergleich zu seinem Vorgänger GPT-4 und registriert 45% weniger sachliche Fehler und sechsmal weniger Fälle von „halluzinierten“ oder vollständig hergestellten Antworten. Trotz dieser Fortschritte bestätigt die Studie, dass ChatGPT-5 immer noch ein Überbewusstsein aufweisen kann, ein Phänomen, bei dem es sachlich falsche Informationen mit einem hohen Maß an Sicherheit darstellt. Diese Beharrlichkeit der Halluzination bleibt zwar verringert, aber ein zentrales Problem, das sich auf die Zuverlässigkeit auswirkt. Die Leistungsgenauigkeit variiert je nach spezifischer Domäne der Aufgabe erheblich. Zum Beispiel erzielte das Modell einen Genauigkeitswert von 94,6% für den Aime-Mathematik-Test 2025 und eine Erfolgsrate von 74,9% bei einer Reihe von Codierungszuweisungen in der realen Welt. Die Forschung zeigt, dass bei Aufgaben, die allgemeines Wissen beinhalten oder komplexe, mehrstufige Argumentation erfordern, bei denen die Leistung des Modells weniger konsistent ist. Bei der Bewertung des MMLU Pro-Benchmarks, einem strengen akademischen Test, der eine breite Palette von Themen wie Naturwissenschaften, Mathematik und Geschichte abdeckt, erzielte Chatgpt-5 eine Genauigkeit von ungefähr 87%. Die Studie identifiziert mehrere zugrunde liegende Ursachen für die verbleibenden Fehler. Dazu gehören die Unfähigkeit, nuancierte Fragen vollständig zu verstehen, sich auf Schulungsdaten zu verlassen, die möglicherweise veraltet oder unvollständig sind, sowie das grundlegende Design des Modells als probabilistische Mustervorhersagemechanismus, der Antworten erzeugen kann, die plausibel, aber nicht sachlich korrekt sind. Basierend auf diesen Ergebnissen empfiehlt der Bericht den Benutzern, alle von ChatGPT-5 erstellten kritischen Informationen unabhängig zu überprüfen. Diese Empfehlung ist besonders für professionelle, akademische oder gesundheitsbezogene Anfragen relevant, bei denen Präzision unerlässlich ist. Die konsistente Fehlerrate unterstreicht auch bei deutlichen Verbesserungen die Notwendigkeit vorsichtiger Verwendung und externe Validierung der Ausgaben des Modells.


Ausgewähltes Bildnachweis

Tags: CHATGPT-5Vorgestellt

Related Posts

Umarmender Gesicht: KI-Video-Energie Nutzungsskalen nicht linear

Umarmender Gesicht: KI-Video-Energie Nutzungsskalen nicht linear

September 26, 2025
OpenAI: GDPVAL-Framework-Tests KI auf realen Jobs

OpenAI: GDPVAL-Framework-Tests KI auf realen Jobs

September 26, 2025
Nansen AI startet Agent für On-Ketten-Ethereum-Erkenntnisse

Nansen AI startet Agent für On-Ketten-Ethereum-Erkenntnisse

September 25, 2025
Dagi Summit 2025: Gestalten einer offenen, kollaborativen und zugänglichen KI -Zukunft

Dagi Summit 2025: Gestalten einer offenen, kollaborativen und zugänglichen KI -Zukunft

September 25, 2025
Cloudflare Open-Sources Vibedk AI App-Plattform

Cloudflare Open-Sources Vibedk AI App-Plattform

September 24, 2025
Die erschwingliche Google AI Plus erweitert auf 40 neue Länder

Die erschwingliche Google AI Plus erweitert auf 40 neue Länder

September 24, 2025

Recent Posts

  • Salesforce Agentforce von NOMA getroffen "Erzwungen" ausbeuten
  • Apple Wallet Digital ID wird nach North Dakota ausgedehnt
  • Umarmender Gesicht: KI-Video-Energie Nutzungsskalen nicht linear
  • OpenAI: GDPVAL-Framework-Tests KI auf realen Jobs
  • Asus Rog Ally, Ally X Vorbestellungen; Schiffe 16. Oktober

Recent Comments

Es sind keine Kommentare vorhanden.
Dataconomy DE

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

  • Home
  • Sample Page

Follow Us

  • Home
  • Sample Page
No Result
View All Result
Subscribe

This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy Policy.