Anthropic hat gestartet Claude 3.7, das erste KI -Modell der Welt, das entweder Standardausgabe oder eine kontrollierbare Menge an „Argumentation“ erzeugen kann, um komplexe Probleme anzugehen. Dieses Hybridmodell ist so konzipiert, dass die Interaktion der Benutzer und des Entwicklers durch ein Gleichgewicht zwischen instinktiven Reaktionen und methodischem Denken ermöglicht wird.
Anthropic enthüllt Claude 3.7: Das erste Hybrid -Argumentations -AI -Modell

Michael Gerstenhaber, Produktleiter bei Anthropic, erklärte: „Die [user] Hat viel Kontrolle über das Verhalten – wie lange denkt es und kann Argumentation und Intelligenz mit Zeit und Budget handeln. “ Claude 3.7 führt eine „Scratchpad“ -Funktion vor, die den Argumentationsprozess des Modells anzeigt und sich von dem beliebten chinesischen KI -Modell inspirieren lässt Deepseek. Diese Funktionalität hilft den Benutzern, den Ansatz des Modells zur Problemlösung zu verstehen und sofortige Anpassungen zu ermöglichen.
Dianne Penn, Product Lead of Research bei Anthropic, betonte die Wirksamkeit des Scratchpads zusammen mit der einstellbaren Argumentationsfähigkeit. Benutzer können das Modell anweisen, mehr Zeit für die Problemlösung zuzuweisen, wenn erste Versuche nicht die gewünschte Aufschlüsselung ergeben.

Die Hybridstruktur von Claude 3.7 unterscheidet sie von Wettbewerbern. Während Openai im September 2024 ein Argumentationsmodell namens O1 veröffentlicht hat und später eine robustere Version mit dem Namen O3, müssen Benutzer zwischen den Modellen wechseln, um auf Argumentationsfunktionen zuzugreifen. Der Claude 3.7 von Anthropic ermöglicht nahtlosen Umschleppen zwischen herkömmlichen Reaktionen und erweitertem Argumentation, ein erheblicher Vorteil.
Das Hybridmodell entspricht den Argumentationsrahmen, die von dem mit dem Nobel gezeichneten Ökonom Daniel Kahneman in seinem Buch „Thinking, Fast and Slow“ beschrieben wurden und sowohl instinktive als auch absichtliche kognitive Prozesse anbieten. Standardmodelle wie Großsprachmodelle (LLMs) erzeugen typischerweise sofortige Antworten, können jedoch bei Aufgaben ins Stocken geraten, die gründliche Argumentation erfordern, wie z. B. arithmetische Berechnungen.
Um die Fähigkeiten von Claude 3.7 zu verbessern, verwendete Anthropic Verstärkungslernen, um das Modell mit zusätzlichen Daten zu schulen, die sich auf Geschäftsanwendungen wie Codierung und rechtliche Untersuchungen konzentrieren. Penn bemerkte: „Die Dinge, die wir verbessert haben […] Technische Themen oder Themen, die lange Argumentation erfordern. “ Das Modell hat die O1 von OpenAI in bestimmten Frameworks wie SWE-Bench übertroffen, wenn komplexe Codierungsherausforderungen angepasst werden.
Claude Ai kann jetzt Ihren Schreibstil perfekt widerspiegeln
Claude -Code
Das Unternehmen hat Claude Code eingeführt, ein neues Tool, das mit KI-gesteuerten Codierungsaufgaben unterstützt wird, die in komplexen Szenarien eine gute Leistung erbringt. „Das Modell ist bereits gut in der Codierung“, fügte Penn hinzu. “[But] Zusätzliches Denken wäre gut für Fälle, die möglicherweise eine sehr komplexe Planung erfordern. Sie suchen eine extrem große Codebasis für ein Unternehmen. “

Claude 3.7 Sonnet ist in allen Claude -Plänen – frei, Profi, Team und Enterprise – sowie über die anthropische API, das Amazon -Grundgestein und die Vertex AI von Google Cloud verfügbar. Das Modell hält die gleiche Preisstruktur wie seine Vorgänger bei: 3 pro Million Eingangs -Token und 15 USD pro Million Output -Token, einschließlich Denktken.
Anthropic hat Claude 3.7 -Sonett mit einer Philosophie entwickelt, die die Argumentation als Kernkomponente des Modells integriert. Es fungiert sowohl als verbessertes gewöhnliches LLM als auch als Argumentationsmodell, sodass Benutzer auswählen können, wann sie direkte Antworten oder längere reflektiertere Antworten wünschen. Im erweiterten Denkmodus verfeinert Claude 3.7 seine Antworten und verbessert die Leistung bei Aufgaben in Mathematik, Physik, Anweisungen und Codierung.
Mit Claude 3.7 Sonett über die API können Benutzer ihr „Denken“ -Budget kontrollieren, indem sie eine maximale Anzahl von Token angeben. Diese Flexibilität ermöglicht es Benutzern, Geschwindigkeit gegenüber der Qualität des Ergebniss zu priorisieren.
Die jüngsten Bewertungen von Claude weisen darauf hin, dass die Führung der Codierungsfunktionen über mehrere Plattformen hinweg auftritt. Der Cursor erkannte Claude als Best-in-in-Class-für reale Codierungsaufgaben mit Fortschritten bei der Verwaltung komplizierter Codebasen. Kognition berichtete über eine überlegene Leistung bei den Änderungen des Planungscode, während Vercel seine Genauigkeit bei der Navigation komplexer Agent -Workflows feststellte. Replit hat Claude effektiv für die Entwicklung ausgefeilter Webanwendungen eingesetzt, und von Canva durchgeführte Tests zeigten, dass Claude konsequent produktionsbereitete Code mit verbesserter Designqualität und deutlich weniger Fehlern liefert.
Claude Code, der derzeit in begrenzter Forschung Vorschau ist, fungiert als kollaboratives Tool, mit dem Code bearbeiten, Tests ausgeführt und mit GitHub interagieren können, wodurch der Codierungsprozess optimiert wird. Frühe Tests haben gezeigt, dass Claude Code Aufgaben in einer einzigen Sitzung erledigen kann, die normalerweise umfangreiche manuelle Anstrengungen erfordern. Zukünftige Verbesserungen konzentrieren sich auf die Zuverlässigkeit von Tools, die Unterstützung langer Befehlsunterstützung und eine verbesserte Leistung.
Anthropic hat sein Engagement für die Entwicklung von Claude 3.7 -Sonett mit Schwerpunkt auf Sicherheit, Sicherheit und Zuverlässigkeit betont. Claude 3.7 hat erkennbare Unterscheidungen zwischen gutartigen und schädlichen Anfragen gemacht und eine Verringerung der unnötigen Ablehnungen um 45% im Vergleich zu seinem Vorgänger erzielt. Die begleitende Systemkartenkarten beschreibt Sicherheitsbewertungen, die anderen KI -Forschungsinitiativen zugute kommen und sich mit den aufkommenden Risiken befassen könnten, einschließlich schneller Injektionsangriffe.
Claude 3.7 Sonnet und Claude Code stellen signifikante Fortschritte gegenüber KI -Systemen dar, die die Fähigkeiten des Menschen effektiv unterstützen können, indem er tiefes Denken und autonome Zusammenarbeit integriert wird.
Ausgewähltes Bildnachweis: Anthropic