Dataconomy DE
Subscribe
No Result
View All Result
Dataconomy DE
Subscribe
No Result
View All Result
Dataconomy DE
No Result
View All Result

Anthropic veröffentlicht Claude Sonnet 4.5 mit fortschrittlichen Coding- und Agentenfunktionen

byEmre Çıtak
September 30, 2025
in Artificial Intelligence
Home Artificial Intelligence
Share on FacebookShare on Twitter

Die AI Company Anthropic hat Claude Sonnet 4.5 veröffentlicht, ein neues Flaggschiff -Modell, das das Unternehmen als die fähigsten für das Codieren, den Aufbau komplexer KI -Agenten und die Verwendung von Computersystemen mit erheblichen Gewinnen in Bezug auf Argumentation und Mathematik positioniert. Das neue Modell ist ab sofort verfügbar und wird von einem neuen Entwickler -Toolkit und großen Updates in der Claude -Produktlinie begleitet.

Sonnet 4.5 -Funktionen, die hervorstechen

Nach Anthropics Blog -BeitragDas Modell erzielt eine modernste Leistung der SWE-Bench-Verifizierung, eine Benchmark, die die Realwelt-Software-Codierungsfähigkeiten misst. Es zeigt auch eine verbesserte Leistung auf dem Osworld-Benchmark, der die Fähigkeit eines KI-Modells testet, reale Aufgaben auf einem Computer auszuführen, z. B. auf Websites und Ausfüllen von Tabellenkalkulationen. Das Unternehmen berichtet außerdem, dass Experten für Finanzen, Recht, Medizin und STEM im Vergleich zu früheren Modellen ein dramatisch besseres domänenspezifisches Wissen und Argumentation haben, um ein dramatisch besseres domänenspezifisches Wissen zu haben.

Neue Tools für Entwickler: Der Claude Agent SDK

Neben dem neuen Modell hat Anthropic die gestartet Claude Agent SDK. Dieses Softwareentwicklungs -Kit bietet Entwicklern die gleiche Infrastruktur, die das Unternehmen verwendet, um sein Claude -Code -Produkt mit Strom zu versorgen, sodass sie ihre eigenen benutzerdefinierten KI -Agenten erstellen können. Das SDK ist so konzipiert, dass sie gemeinsame Herausforderungen bei der Entwicklung der Agenten lösen, z. B. das Verwalten von Speicher für langjährige Aufgaben, die Bearbeitung von Berechtigungssystemen und die Koordinierung von Subagenten, die auf ein gemeinsames Ziel arbeiten. https://www.youtube.com/watch?v=oxfvkbb7mcg

Produktaktualisierungen im gesamten Claude -Ökosystem

Die Einführung von Sonnet 4.5 umfasst mehrere bedeutende Upgrades für bestehende Claude -Produkte.

  • Claude Code: Führen Sie Kontrollpunkte ein, mit denen Benutzer Fortschritte sparen und in einen früheren Zustand, eine aktualisierte Terminalschnittstelle und eine native VS -Code -Erweiterung zurückführen können.
  • Claude API: Fügt eine neue Kontextbearbeitungsfunktion und ein Speicherwerkzeug hinzu, damit Agenten länger laufen und komplexere Aufgaben erledigen können.
  • Claude -Apps: Benutzer in bezahlten Plänen können jetzt Code und Dateien wie Tabellenkalkulationen, Folien und Dokumente direkt in ihren Gesprächen erstellen.
  • Claude für die Chromverlängerung: Jetzt verfügbar für Max -Benutzer, die zuvor der Warteliste beigetreten sind.

Konzentration auf Sicherheit und Ausrichtung

Anthropic gibt an, dass Claude Sonnet 4.5 das bisher am stärksten ausgerichtete Modell ist, wobei die Verringerung unerwünschter Verhaltensweisen wie Täuschung und Sykophanz verbessert wird. Das Modell wird im Rahmen des KI-Sicherheitsstufe 3 (ASL-3) des Unternehmens veröffentlicht, das Schutzmaßnahmen wie Klassifikatoren umfasst, um potenziell gefährliche Inputs und Outputs zu erkennen, insbesondere solche, die mit chemischen, biologischen, radiologischen und nuklearen (CBRN) Waffen verbunden sind.

Stellen Sie sich mit Claude vor

Für eine begrenzte Zeit bietet Anthropic eine Forschungsvorschau namens „Imagine With Claude“ für seine Max -Abonnenten an. Bei dieser Demonstration generiert das Modell Software in Echtzeit als Antwort auf Benutzeranfragen ohne vorgeschriebenen Code. Diese Vorschau soll die Funktionen von Son-Net 4.5 in Kombination mit der richtigen Infrastruktur präsentieren.

Verfügbarkeit und Preisgestaltung

Claude Sonnet 4.5 ist ab sofort über die Claude -API erhältlich. Die Preisgestaltung entspricht dem vorherigen Claude -Sonnet 4 -Modell mit 3 pro Million Eingangstoken und 15 USD pro Million Output -Token. Anthropic empfiehlt die Upgrade auf Sonnet 4.5 für alle Verwendungen, da es eine verbesserte Leistung für die gleichen Kosten bietet. https://www.youtube.com/watch?v=oz-alrj0ovg

Claude Sonnet 4.5 gegen Chatgpt-5: Welches sollten Sie für Ihr nächstes Projekt verwenden?

Die Veröffentlichung von Claude Sonnet 4.5 hat den Wettbewerb an der Spitze der künstlichen Intelligenz verstärkt und direkt herausfordernd GPT-5. Während beide Modelle eine erweiterte KI -Entwicklung darstellen, zeigen sie unterschiedliche Stärken, insbesondere in den Bereichen Codierung, Agentenfähigkeiten und Gesamtleistung.

Auf einen Blick: Schlüsselunterschiede

BesonderheitClaude Sonett 4.5GPT-5
PrimärstärkeAgentencodierung, Computergebrauch und autonome Aufgaben mit langer Dauer.Einheitliche Intelligenz, fortschrittliches Denken und multimodale Fähigkeiten.
SWE-Bench verifiziert77,2% (Standard), 82% (hochkomputes).72,8%.
Osworld Benchmark61,4%.Nicht angegeben, aber Sonnet 4.5 führt das Diagramm an.
EntwicklerwerkzeugeClaude Agent SDK, native VS -Code -Erweiterung, Claude -Code mit Kontrollpunkten.Zugriff über API und in Produkte wie Chatgpt und Microsoft Copilot integriert.
Einzigartige FunktionenKann über 30 Stunden autonom arbeiten. Verbesserte Sicherheits- und Ausrichtungsmerkmale.Einheitliches System, das mehrere KI -Modelle kombiniert. Passt dynamisch seinen Argumentationsansatz anhand der Aufgabenkomplexität an.

Codierung und Entwicklerfokus

Claude Sonnet 4.5 wurde als „bestes Codierungsmodell der Welt“ positioniert. Diese Behauptung wird durch seine führende Leistung bei mehreren wichtigen Benchmarks belegt. Auf SWE-Bench verifiziert, das die Fähigkeit eines Modells, Github-Probleme zu lösen, misst, erzielt Sonnet 4,5 beeindruckende 77,2%und übertrifft die 72,8%von GPT-5. Mit zusätzlicher Rechenleistung springt die Punktzahl von Sonnet 4.5 auf 82%. Darüber hinaus erreichte Sonnet 4.5 auf dem Terminal-Bench, einem Test der Fähigkeit einer KI, eine Befehlszeilenschnittstelle zu verwenden, eine Erfolgsquote von 50%, erheblich vor den 43,8% von GPT-5. Dies deutet darauf hin, dass für Entwickler und technische Nutzer, die eine KI benötigen, um komplexe, mehrstufige Aufgaben in einer Terminalumgebung auszuführen, Sonnet 4.5 einen deutlichen Vorteil hat. Im Gegensatz dazu wird GPT-5 als leistungsstarkes, allgemeines Codierungsmodell dargestellt. Während es zum Zeitpunkt seiner Veröffentlichung neue modernste Benchmarks festgelegt hat, scheint der Spezialfokus von Sonnet 4.5 einen Vorteil in Entwickler-zentrierten Aufgaben zu verleihen.

Agentenfunktionen und Computernutzung

Eine herausragende Funktion von Claude Sonnet 4.5 ist seine Fähigkeit, als langjähriger autonomer Agent zu fungieren. Berichten zufolge kann das Modell den Fokus und die Leistung auf komplexen Aufgaben länger als 30 Stunden aufrechterhalten, was einem signifikanten Anstieg der Vorgängermodelle erheblich ist. Diese Ausdauer ist für Aufgaben von entscheidender Bedeutung, bei denen anhaltende Anstrengungen erforderlich sind, z. Auf der Osworld-Benchmark, die die Fähigkeit einer KI bewertet, reale Aufgaben auf einem Computer auszuführen, hat Sonnet 4.5 mit einer Erfolgsrate von 61,4%den ersten Platz belegt. Diese Kenntnisse werden in den Funktionen der Tool-Nutzung weiter nachgewiesen, wo sie in der Telekommunikationsdomäne der τ-Bench-Bewertungen bemerkenswerte 98,0% erzielte, wodurch die Leistung seines Vorgängers nahezu verdoppelt und GPT-5 übertrifft. GPT-5 hingegen ist als einheitliches System konzipiert, das basierend auf der Komplexität der Aufgabe intelligent zwischen verschiedenen Argumentationsansätzen wechseln kann. Dies ermöglicht es ihm, eine Vielzahl von Aufgaben effizient zu erledigen, betont jedoch nicht die gleiche Autonomie mit langer Dauer wie Sonnet 4.5.

Argumentation, Mathematik und allgemeine Leistung

In Bereichen allgemeiner Denken und Mathematik ist der Wettbewerb viel näher. Bei dem Mathematikwettbewerb der AIME 2025 High School erzielte Sonnet 4.5 eine perfekte Punktzahl von 100% bei der Verwendung von Python, wobei die 99,6% der GPT-5 leicht ausgestattet war. Für die Argumentation auf Graduiertenebene, gemessen vom GPQA Diamond Benchmark, sind die Modelle sehr wettbewerbsfähig, wobei GPT-5 einen leichten Vorsprung bietet. Frühe Benutzerberichte und praktische Tests legen nahe, dass Sonnet 4.5 merklich schneller ist …


Ausgewähltes Bildnachweis

Tags: AnthropischClaude Sonett 4.5Vorgestellt

Related Posts

OpenAI vereint Teams zum Bau von Audiogeräten mit Jony Ive

OpenAI vereint Teams zum Bau von Audiogeräten mit Jony Ive

Januar 2, 2026
OpenAI untersucht die Priorisierung gesponserter Anzeigen in ChatGPT-Antworten

OpenAI untersucht die Priorisierung gesponserter Anzeigen in ChatGPT-Antworten

Januar 2, 2026
Samsung Bixby erhält mit dem neuen Update Perplexity AI-Suchfunktionen

Samsung Bixby erhält mit dem neuen Update Perplexity AI-Suchfunktionen

Dezember 29, 2025
Alibabas Qwen Code v0.5.0 verwandelt das Terminal in ein vollständiges Entwicklungsökosystem

Alibabas Qwen Code v0.5.0 verwandelt das Terminal in ein vollständiges Entwicklungsökosystem

Dezember 26, 2025
ChatGPT entwickelt sich zu einer Office-Suite mit neuen Formatierungsblöcken

ChatGPT entwickelt sich zu einer Office-Suite mit neuen Formatierungsblöcken

Dezember 26, 2025
Google NotebookLM stellt vor "Vorlesungsmodus" für 30-minütiges KI-Lernen

Google NotebookLM stellt vor "Vorlesungsmodus" für 30-minütiges KI-Lernen

Dezember 26, 2025

Recent Posts

  • OpenAI vereint Teams zum Bau von Audiogeräten mit Jony Ive
  • Goldman Sachs und europäische Banken streben Backoffice-Rollen für KI an
  • Nvidia erwirbt für eine strategische Allianz 5-Milliarden-Dollar-Anteile an Intel
  • Amazon blockiert 1800 nordkoreanische Mitarbeiter von Remote-Arbeitsplätzen
  • Nvidia versucht, den Mangel an 2 Millionen Chips für chinesische Technologiegiganten auszugleichen

Recent Comments

Es sind keine Kommentare vorhanden.
Dataconomy DE

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

  • Home
  • Sample Page

Follow Us

  • Home
  • Sample Page
No Result
View All Result
Subscribe

This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy Policy.