xAI, das zu Elon Musk gehört, hat mit der Einführung von Grok 4.1 begonnen, einem Upgrade des Grok 4-Modells. Die Veröffentlichung verbessert Qualität und Geschwindigkeit und bietet freien Zugriff für alle Benutzer, um die Leistung großer Sprachmodelle zu verbessern. xAI hat zwei Versionen des neuen Modells auf den Markt gebracht: Grok 4.1 und Grok 4.1 Thinking. Beide beinhalten inkrementelle Verbesserungen gegenüber früheren Iterationen. Kostenlose Nutzer können sofort auf diese Modelle zugreifen, während zahlende Kunden von reduzierten Nutzungslimits profitieren. xAI gibt an, dass Grok 4.1 die Halluzinationsraten im Vergleich zu früheren Modellen um den Faktor drei reduziert. Diese Weiterentwicklung macht die Veröffentlichung zu einem der bisher stärksten Angebote von xAI. Halluzinationen, bei denen Modelle ungenaue Informationen generieren, stellen eine zentrale Herausforderung bei der Entwicklung großer Sprachmodelle dar, und diese Reduzierung ist auf gezielte Trainingsverbesserungen zurückzuführen. Die Leistung gegenüber Konkurrenten wie GPT 5.1, das kürzlich mit Zuwächsen bei Leistung und emotionaler Intelligenz auf den Markt kam, bleibt durch direkte Vergleiche unbestätigt. Die Aktualisierungen von GPT 5.1 konzentrieren sich auf die Verbesserung der Antwortgenauigkeit und des Kontextverständnisses bei Interaktionen. Die Text Arena von LMArena bietet erste Leistungsdaten zu Grok 4.1. Dieses Open-Source-Tool ermöglicht direkte, blinde und randomisierte Vergleiche großer Sprachmodelle. Benutzer senden Eingabeaufforderungen und die Plattform ordnet die Antworten anonym zu, um Modelle auf der Grundlage menschlicher Präferenzen einzustufen. Frühe Benchmarks von Text Arena platzieren Grok 4.1 (Denken) mit einer Punktzahl von 1510 auf Platz eins der Arena Expert-Bestenliste. Grok 4.1 rangiert mit einer Punktzahl von 1437 auf Platz 19. Diese Ergebnisse zeigen, dass beide Modelle in der wettbewerbsorientierten Text Arena-Umgebung neue Positionen erreichen. Die Benchmark-Plattform stellte fest: „Dies ist eine Verbesserung um mehr als 40 Punkte seit Grok 4 Fast, das erst zwei Monate zuvor in der Arena landete.“ Grok 4 stieg im September 2025 schnell in die Bestenliste ein und legte eine Basislinie fest, die Grok 4.1 nun deutlich übertrifft. https://twitter.com/arena/status/1990530978943787291





