Die AI Company Anthropic hat Claude Sonnet 4.5 veröffentlicht, ein neues Flaggschiff -Modell, das das Unternehmen als die fähigsten für das Codieren, den Aufbau komplexer KI -Agenten und die Verwendung von Computersystemen mit erheblichen Gewinnen in Bezug auf Argumentation und Mathematik positioniert. Das neue Modell ist ab sofort verfügbar und wird von einem neuen Entwickler -Toolkit und großen Updates in der Claude -Produktlinie begleitet.
Sonnet 4.5 -Funktionen, die hervorstechen
Nach Anthropics Blog -BeitragDas Modell erzielt eine modernste Leistung der SWE-Bench-Verifizierung, eine Benchmark, die die Realwelt-Software-Codierungsfähigkeiten misst. Es zeigt auch eine verbesserte Leistung auf dem Osworld-Benchmark, der die Fähigkeit eines KI-Modells testet, reale Aufgaben auf einem Computer auszuführen, z. B. auf Websites und Ausfüllen von Tabellenkalkulationen. Das Unternehmen berichtet außerdem, dass Experten für Finanzen, Recht, Medizin und STEM im Vergleich zu früheren Modellen ein dramatisch besseres domänenspezifisches Wissen und Argumentation haben, um ein dramatisch besseres domänenspezifisches Wissen zu haben.
Neue Tools für Entwickler: Der Claude Agent SDK
Neben dem neuen Modell hat Anthropic die gestartet Claude Agent SDK. Dieses Softwareentwicklungs -Kit bietet Entwicklern die gleiche Infrastruktur, die das Unternehmen verwendet, um sein Claude -Code -Produkt mit Strom zu versorgen, sodass sie ihre eigenen benutzerdefinierten KI -Agenten erstellen können. Das SDK ist so konzipiert, dass sie gemeinsame Herausforderungen bei der Entwicklung der Agenten lösen, z. B. das Verwalten von Speicher für langjährige Aufgaben, die Bearbeitung von Berechtigungssystemen und die Koordinierung von Subagenten, die auf ein gemeinsames Ziel arbeiten. https://www.youtube.com/watch?v=oxfvkbb7mcg
Produktaktualisierungen im gesamten Claude -Ökosystem
Die Einführung von Sonnet 4.5 umfasst mehrere bedeutende Upgrades für bestehende Claude -Produkte.
- Claude Code: Führen Sie Kontrollpunkte ein, mit denen Benutzer Fortschritte sparen und in einen früheren Zustand, eine aktualisierte Terminalschnittstelle und eine native VS -Code -Erweiterung zurückführen können.
- Claude API: Fügt eine neue Kontextbearbeitungsfunktion und ein Speicherwerkzeug hinzu, damit Agenten länger laufen und komplexere Aufgaben erledigen können.
- Claude -Apps: Benutzer in bezahlten Plänen können jetzt Code und Dateien wie Tabellenkalkulationen, Folien und Dokumente direkt in ihren Gesprächen erstellen.
- Claude für die Chromverlängerung: Jetzt verfügbar für Max -Benutzer, die zuvor der Warteliste beigetreten sind.
Konzentration auf Sicherheit und Ausrichtung
Anthropic gibt an, dass Claude Sonnet 4.5 das bisher am stärksten ausgerichtete Modell ist, wobei die Verringerung unerwünschter Verhaltensweisen wie Täuschung und Sykophanz verbessert wird. Das Modell wird im Rahmen des KI-Sicherheitsstufe 3 (ASL-3) des Unternehmens veröffentlicht, das Schutzmaßnahmen wie Klassifikatoren umfasst, um potenziell gefährliche Inputs und Outputs zu erkennen, insbesondere solche, die mit chemischen, biologischen, radiologischen und nuklearen (CBRN) Waffen verbunden sind.
Stellen Sie sich mit Claude vor
Für eine begrenzte Zeit bietet Anthropic eine Forschungsvorschau namens „Imagine With Claude“ für seine Max -Abonnenten an. Bei dieser Demonstration generiert das Modell Software in Echtzeit als Antwort auf Benutzeranfragen ohne vorgeschriebenen Code. Diese Vorschau soll die Funktionen von Son-Net 4.5 in Kombination mit der richtigen Infrastruktur präsentieren.
Verfügbarkeit und Preisgestaltung
Claude Sonnet 4.5 ist ab sofort über die Claude -API erhältlich. Die Preisgestaltung entspricht dem vorherigen Claude -Sonnet 4 -Modell mit 3 pro Million Eingangstoken und 15 USD pro Million Output -Token. Anthropic empfiehlt die Upgrade auf Sonnet 4.5 für alle Verwendungen, da es eine verbesserte Leistung für die gleichen Kosten bietet. https://www.youtube.com/watch?v=oz-alrj0ovg
Claude Sonnet 4.5 gegen Chatgpt-5: Welches sollten Sie für Ihr nächstes Projekt verwenden?
Die Veröffentlichung von Claude Sonnet 4.5 hat den Wettbewerb an der Spitze der künstlichen Intelligenz verstärkt und direkt herausfordernd GPT-5. Während beide Modelle eine erweiterte KI -Entwicklung darstellen, zeigen sie unterschiedliche Stärken, insbesondere in den Bereichen Codierung, Agentenfähigkeiten und Gesamtleistung.
Auf einen Blick: Schlüsselunterschiede
| Besonderheit | Claude Sonett 4.5 | GPT-5 |
|---|---|---|
| Primärstärke | Agentencodierung, Computergebrauch und autonome Aufgaben mit langer Dauer. | Einheitliche Intelligenz, fortschrittliches Denken und multimodale Fähigkeiten. |
| SWE-Bench verifiziert | 77,2% (Standard), 82% (hochkomputes). | 72,8%. |
| Osworld Benchmark | 61,4%. | Nicht angegeben, aber Sonnet 4.5 führt das Diagramm an. |
| Entwicklerwerkzeuge | Claude Agent SDK, native VS -Code -Erweiterung, Claude -Code mit Kontrollpunkten. | Zugriff über API und in Produkte wie Chatgpt und Microsoft Copilot integriert. |
| Einzigartige Funktionen | Kann über 30 Stunden autonom arbeiten. Verbesserte Sicherheits- und Ausrichtungsmerkmale. | Einheitliches System, das mehrere KI -Modelle kombiniert. Passt dynamisch seinen Argumentationsansatz anhand der Aufgabenkomplexität an. |
Codierung und Entwicklerfokus
Claude Sonnet 4.5 wurde als „bestes Codierungsmodell der Welt“ positioniert. Diese Behauptung wird durch seine führende Leistung bei mehreren wichtigen Benchmarks belegt. Auf SWE-Bench verifiziert, das die Fähigkeit eines Modells, Github-Probleme zu lösen, misst, erzielt Sonnet 4,5 beeindruckende 77,2%und übertrifft die 72,8%von GPT-5. Mit zusätzlicher Rechenleistung springt die Punktzahl von Sonnet 4.5 auf 82%. Darüber hinaus erreichte Sonnet 4.5 auf dem Terminal-Bench, einem Test der Fähigkeit einer KI, eine Befehlszeilenschnittstelle zu verwenden, eine Erfolgsquote von 50%, erheblich vor den 43,8% von GPT-5. Dies deutet darauf hin, dass für Entwickler und technische Nutzer, die eine KI benötigen, um komplexe, mehrstufige Aufgaben in einer Terminalumgebung auszuführen, Sonnet 4.5 einen deutlichen Vorteil hat. Im Gegensatz dazu wird GPT-5 als leistungsstarkes, allgemeines Codierungsmodell dargestellt. Während es zum Zeitpunkt seiner Veröffentlichung neue modernste Benchmarks festgelegt hat, scheint der Spezialfokus von Sonnet 4.5 einen Vorteil in Entwickler-zentrierten Aufgaben zu verleihen.
Agentenfunktionen und Computernutzung
Eine herausragende Funktion von Claude Sonnet 4.5 ist seine Fähigkeit, als langjähriger autonomer Agent zu fungieren. Berichten zufolge kann das Modell den Fokus und die Leistung auf komplexen Aufgaben länger als 30 Stunden aufrechterhalten, was einem signifikanten Anstieg der Vorgängermodelle erheblich ist. Diese Ausdauer ist für Aufgaben von entscheidender Bedeutung, bei denen anhaltende Anstrengungen erforderlich sind, z. Auf der Osworld-Benchmark, die die Fähigkeit einer KI bewertet, reale Aufgaben auf einem Computer auszuführen, hat Sonnet 4.5 mit einer Erfolgsrate von 61,4%den ersten Platz belegt. Diese Kenntnisse werden in den Funktionen der Tool-Nutzung weiter nachgewiesen, wo sie in der Telekommunikationsdomäne der τ-Bench-Bewertungen bemerkenswerte 98,0% erzielte, wodurch die Leistung seines Vorgängers nahezu verdoppelt und GPT-5 übertrifft. GPT-5 hingegen ist als einheitliches System konzipiert, das basierend auf der Komplexität der Aufgabe intelligent zwischen verschiedenen Argumentationsansätzen wechseln kann. Dies ermöglicht es ihm, eine Vielzahl von Aufgaben effizient zu erledigen, betont jedoch nicht die gleiche Autonomie mit langer Dauer wie Sonnet 4.5.
Argumentation, Mathematik und allgemeine Leistung
In Bereichen allgemeiner Denken und Mathematik ist der Wettbewerb viel näher. Bei dem Mathematikwettbewerb der AIME 2025 High School erzielte Sonnet 4.5 eine perfekte Punktzahl von 100% bei der Verwendung von Python, wobei die 99,6% der GPT-5 leicht ausgestattet war. Für die Argumentation auf Graduiertenebene, gemessen vom GPQA Diamond Benchmark, sind die Modelle sehr wettbewerbsfähig, wobei GPT-5 einen leichten Vorsprung bietet. Frühe Benutzerberichte und praktische Tests legen nahe, dass Sonnet 4.5 merklich schneller ist …





