Anthropic hat die Einführung von zwei neuen KI-Modellen angekündigt: einem verbesserten Claude 3.5 Sonnet und einem neuen Claude 3.5 Haiku. Das aktualisierte Claude 3.5 Sonnet bietet umfassende Verbesserungen mit erheblichen Zuwächsen bei den Codierungsfunktionen. Der neue Claude 3.5 Haiku bietet erweiterte KI-Funktionen zu einem erschwinglichen Preis und erreicht die Leistung des vorherigen Flaggschiffmodells von Anthropic, Claude 3 Opus, bei gleichbleibender Geschwindigkeit und ähnlichen Kosten wie sein Vorgänger.
Claude 3,5 Sonett
Das aktualisierte Claude 3.5 Sonnet baut auf dem Erfolg seines Vorgängers auf und bietet eine verbesserte Leistung bei verschiedenen Aufgaben, insbesondere beim Codieren. Anthropic hat betont, dass Claude 3.5 Sonnet bei Software-Engineering-Aufgaben führend ist und deutliche Verbesserungen bei Benchmarks wie zeigt SWE-Bench verifiziertwo es sich von 33,4 % auf 49,0 % verbesserte und damit andere Modelle auf dem Markt übertraf.
Das Modell schnitt auch bei der Verwendung von Agententools gut ab und verbesserte die Ergebnisse TAU-Bank von 62,6 % auf 69,2 % im Einzelhandelsbereich und von 36,0 % auf 46,0 % im Fluglinienbereich. Laut frühen Testern wie GitLab und Cognition stellen diese Upgrades einen erheblichen Fortschritt für die KI-gestützte Codierung und Automatisierung dar, mit besseren Argumentationsfähigkeiten und minimaler zusätzlicher Latenz.
Claude 3.5 Haiku
Claude 3.5 Haiku ist darauf ausgelegt, modernste Leistung zu bieten und gleichzeitig die Kosten niedrig zu halten. Das Modell schneidet in Benchmarks wie SWE-Bench Verified sehr gut ab und erreicht 40,6 %, was viele Agenten übertrifft, die andere hochmoderne Modelle verwenden, darunter das Original Claude 3.5 Sonnet und GPT-4o. Das Modell zielt darauf ab, Anwendungen zu bedienen, die eine schnelle, zuverlässige KI benötigen, beispielsweise benutzerorientierte Produkte und Aufgaben, die personalisierte Erlebnisse erfordern.
Anthropic wird noch in diesem Monat Claude 3.5 Haiku veröffentlichen, zunächst als Nur-Text-Modell verfügbar, mit Plänen für die Unterstützung der Bildeingabe in der Zukunft. Es wird über die API von Anthropic, Amazon Bedrock und Vertex AI von Google Cloud verfügbar sein.
Claude AI von Anthropic ist jetzt auf Ihrem iPad
Die Computernutzung ist als experimentelle öffentliche Betaversion verfügbar
Anthropic hat auch eingeführt eine neue experimentelle Funktion namens „Computernutzung“, die in der öffentlichen Betaversion verfügbar ist. Entwickler können Claude 3.5 Sonnet anweisen, Computer wie ein Mensch zu verwenden – auf Bildschirme zu schauen, Cursor zu bewegen und zu tippen. Diese Funktion ist mit einigen Einschränkungen noch experimentell, aber Entwickler wie Replit und The Browser Company haben bereits damit begonnen, zu untersuchen, wie damit komplexe Prozesse, die viele Schritte umfassen, automatisiert werden könnten.
Diese Funktion zielt darauf ab, der KI allgemeine Computerkenntnisse zu vermitteln und sie so vielseitiger bei der Erledigung von Aufgaben zu machen, für die zuvor benutzerdefinierte Tools erforderlich waren. Entwickler können über die API von Anthropic und andere große Cloud-Plattformen auf diese Beta zugreifen. Obwohl die ersten Ergebnisse vielversprechend sind, räumt Anthropic ein, dass sich die Technologie noch in der Entwicklung befindet und einige gängige Computeraufgaben wie Scrollen und Ziehen mit Herausforderungen verbunden sind.
Unternehmen wie Asana, Canva, Cognition und DoorDash experimentieren mit den neuen Funktionen und erforschen das Potenzial von KI zur Automatisierung von Prozessen, die traditionell menschliche Eingaben erforderten. Erste Tests des US AI Safety Institute und des UK Safety Institute ergaben, dass das aktualisierte Claude 3.5 Sonnet den Sicherheitsstandards von Anthropic entspricht und für den öffentlichen Gebrauch geeignet ist.
Anthropic befasst sich auch mit potenziellen Risiken, die mit der Fähigkeit der KI zur Interaktion mit Computern verbunden sind. Um einen verantwortungsvollen Einsatz zu gewährleisten, hat das Unternehmen neue Sicherheitsmaßnahmen zur Erkennung von Missbrauch implementiert, darunter Klassifikatoren zur Erkennung potenziell schädlicher Handlungen. Anthropic ermutigt Entwickler, die Beta-Funktion für Aufgaben mit geringem Risiko zu nutzen, während die Technologie ausgereift ist.
Die Veröffentlichung der aktualisierten Versionen Claude 3.5 Sonnet und Claude 3.5 Haiku durch Anthropic unterstreicht das Bestreben des Unternehmens, die KI-Fähigkeiten zu erweitern und gleichzeitig die KI-Funktionen beizubehalten Sicherheitsstandards. Die Hinzufügung experimenteller Computernutzungsfunktionen stellt einen neuen Fortschritt im Potenzial der KI zur Ausführung allgemeiner Aufgaben dar und bietet Entwicklern neue Möglichkeiten zur Erkundung.
Bildnachweis: Anthropisch