Die auf Amazon Bedrock verfügbare Amazon Nova-Reihe umfasst Nova Micro, ein hocheffizientes Text-zu-Text-Modell, Nova Lite, Nova Pro und Nova Premier – multimodale Modelle, die Text, Bilder und Videos verarbeiten, um Textinhalte zu generieren.
Amazon stellte außerdem zwei weitere Modelle vor: Amazon Nova Canvasentwickelt, um Bilder in Studioqualität zu produzieren, und Amazon Nova Reeldas professionelle Videos generiert.
Rohit Prasad, Senior Vice President von Amazon Artificial General Intelligence, hob die einzigartige Perspektive von Amazon hervor und sagte:
„Bei Amazon nutzen wir fast 1.000 KI-Anwendungen. Dies gibt uns ein umfassendes Verständnis dafür, wo Entwickler weiterhin vor Herausforderungen stehen. Unsere neuen Amazon Nova-Modelle zielen darauf ab, Entwicklern innerhalb und außerhalb von Amazon dabei zu helfen, diese Hindernisse zu überwinden. Sie bieten außergewöhnliche Intelligenz- und Inhaltsgenerierungsfunktionen und verbessern gleichzeitig Latenz, Kosteneffizienz, Personalisierung, Retrieval-Augmented Generation (RAG) und agentenbasierte Funktionalitäten.“
Amazon Nova: Intelligenz und Geschwindigkeit in Aktion
Die Nova-Reihe umfasst vier Modelle: Amazon Nova Micro Leads mit extrem geringer Latenz und Kosten, was es ideal für Nur-Text-Anwendungen macht, die schnelle Antworten erfordern. Die verbleibenden drei Modelle verschieben die Grenzen der multimodalen KI:
- Amazon Nova Lite ist eine kostengünstige Option zur Verarbeitung von Bildern, Videos und Texten mit bemerkenswerter Geschwindigkeit.
- Amazon Nova Pro vereint Genauigkeit, Geschwindigkeit und Kosteneffizienz für ein breites Aufgabenspektrum und bietet erweiterte Funktionen für mehrere Modalitäten.
- Amazon Nova Premier ist Amazons leistungsstärkstes multimodales Modell, das sich hervorragend für komplexe Argumentationsaufgaben eignet und als idealer „Lehrer“ für die Destillation kleinerer, spezialisierter Modelle dient.
Amazon Nova Micro, Nova Lite und Nova Pro sind bereits für den allgemeinen Gebrauch verfügbar, während Nova Premier im ersten Quartal 2025 auf den Markt kommt.
Ergebnisse des Leistungsbenchmarks
Nova-Modelle wurden rigoros anhand branchenüblicher Benchmarks getestet. Die Ergebnisse zeigen, dass diese Modelle durchweg eine gleichwertige Leistung wie führende Alternativen erbringen oder diese sogar übertreffen.
- Amazon Nova Micro lieferte konkurrenzfähige Ergebnisse, die gleich oder besser waren Meta LLaMa 3,1 8B in 11 Benchmarks und Google Gemini 1,5 Flash-8B in 12 Benchmarks. Mit einer branchenführenden Ausgabegeschwindigkeit von 210 Token pro Sekunde ist es ideal für Anwendungen, die schnelle Reaktionen erfordern.
- Amazon Nova Lite zeigte bei allen Benchmarks eine starke Leistung, einschließlich der Genauigkeit bei Textaufgaben sowie beim Verstehen von Videos, Diagrammen und Dokumenten, und übertraf die Tests VATEX, ChartQA und DocVQA.
- Amazon Nova Pro stellte seine Fähigkeiten unter Beweis, indem es OpenAI GPT-4o in 17 von 20 Benchmarks übertraf und außergewöhnliche Ergebnisse für RAG-Workflows, Befehlsfolge und agentenbasierte Aufgaben lieferte.
Unterstützung langer Kontext-, mehrsprachiger und multimodaler Aufgaben
Die Modelle Amazon Nova Micro, Lite und Pro unterstützen über 200 Sprachen. Nova Micro verarbeitet Eingabekontexte mit bis zu 128.000 Token, während Nova Lite und Nova Pro bis zu 300.000 Token oder eine 30-minütige Videoverarbeitung unterstützen. Amazon plant, dies Anfang 2025 auf über 2 Millionen Token zu erweitern.
Kostengünstige Hochgeschwindigkeitsleistung
Die Modelle von Amazon Nova sind auf außergewöhnliche Geschwindigkeit und Kosteneffizienz ausgelegt. Im Vergleich zu anderen leistungsstärksten Modellen innerhalb ihrer Intelligenzklassen auf Amazon Bedrock sind Nova Micro, Nova Lite und Nova Pro mindestens 75 % kostengünstiger und bietet gleichzeitig die schnellste Leistung.
Nahtlose Integration mit Amazon Bedrock
Amazon Nova-Modelle lassen sich direkt in Amazon Bedrock integrieren, den vollständig verwalteten Service von AWS, der Kunden über einen einzigen API-Aufruf Zugriff auf Basismodelle führender KI-Anbieter und Amazon selbst bietet. Mit Bedrock können Entwickler Nova-Modelle neben anderen Optionen einfach testen und bewerten, um die beste Lösung für ihre Anwendungen zu ermitteln.
Personalisierung durch Feinabstimmung
Amazon Nova-Modelle unterstützen eine personalisierte Feinabstimmung, sodass Kunden die Genauigkeit verbessern können, indem sie die Modelle anhand von Beispielen aus ihren eigenen Daten anleiten. Die Modelle lernen, was für einen Kunden am wichtigsten ist – sei es Text, Bilder oder Videos – und Amazon Bedrock liefert dann maßgeschneiderte, fein abgestimmte Antworten.
Effiziente Destillation für kleinere Spezialmodelle
Neben der Feinabstimmung unterstützt Nova ModelldestillationDies ermöglicht den Wissenstransfer von großen, leistungsstarken Modellen zu kleineren, schnelleren und kostengünstigeren Modellen ohne Einbußen bei der Genauigkeit.
Verbesserung der Genauigkeit durch abrufgestützte Generierung
Amazon Nova-Modelle lassen sich nahtlos integrieren Amazon Bedrock-WissensdatenbankenDies ermöglicht die Retrieval-Augmented Generation (RAG) zur Bereitstellung von Antworten auf der Grundlage der eigenen Daten einer Organisation für ein Höchstmaß an Genauigkeit.
Optimiert für Agentenanwendungen
Nova-Modelle sind für mehrstufige Aufgaben konzipiert und für agentenbasierte Anwendungen optimiert, die eine Interaktion mit proprietären Systemen und Daten über mehrere APIs erfordern.
Visuelle Inhalte in Produktionsqualität
Amazon Nova Canvas Generiert Bilder in professioneller Qualität aus Text- oder Bildaufforderungen mit integrierten Steuerelementen für Bearbeitung, Farbanpassung und Layouts. Zu den integrierten Sicherheitsmaßnahmen gehören Wasserzeichen und Inhaltsmoderation, um einen verantwortungsvollen Einsatz von KI sicherzustellen. In den Bewertungen übertraf Nova Canvas Modelle wie OpenAI DALL·E 3 und Stable Diffusion.
Amazon Nova Reel ermöglicht es Kunden, hochwertige Videos aus Text und Bildern zu erstellen. Es wurde für Werbe-, Marketing- und Bildungsinhalte entwickelt und ermöglicht die Kontrolle über visuelle Stile, Tempo und Kameraeffekte. Nova Reel übertraf durchweg die Konkurrenz, wobei die Rezensenten seine Leistung dem Runway Gen-3 Alpha vorzogen. Während Nova Reel derzeit sechs Sekunden lange Videos unterstützt, wird es in den kommenden Monaten auf die zweiminütige Videogenerierung ausgeweitet.
Ausblick: Sprache und multimodale-zu-multimodale Modelle
Im ersten Quartal 2025 plant Amazon die Veröffentlichung eines Speech-to-Speech-Modell Entwickelt, um KI-Anwendungen für natürliche Sprachinteraktionen zu transformieren. Das Modell interpretiert gesprochene Sprache, Ton und Tempo, um menschenähnliche Antworten mit minimaler Latenz zu liefern.
Darüber hinaus entwickelt Amazon ein Multimodal-zu-Multimodal-Modell ist in der Lage, Text, Bilder, Audio und Video als Eingaben zu verwenden und Ausgaben über alle diese Modalitäten hinweg zu erzeugen. Dieses für Mitte 2025 geplante Modell wird Anwendungen vereinfachen, die die Übersetzung, Bearbeitung und das multimodale Verständnis von Inhalten erfordern.
Frühzeitige Adoption
Mehrere führende Organisationen übernehmen bereits Nova-Modelle:
- SAFT integriert Nova-Modelle in SAP AI Core, um KI-gesteuerte Lösungen in den Bereichen Automatisierung, Personalisierung und Lieferkettenplanung voranzutreiben.
- Deloitte nutzt die fortschrittlichen Personalisierungsfunktionen von Nova, um weltweit maßgeschneiderte generative KI-Dienste bereitzustellen.
- Dentsu Digital Inc. nutzt Nova Reel, um die kreative Videoproduktion zu optimieren und die Zeitspanne für Kampagnen von Wochen auf Tage zu verkürzen.
- Musixmatch integriert Nova Reel in seine Plattform, um aufstrebenden Künstlern bei der Erstellung hochwertiger Musikvideos zu helfen.
- 123RF vereinfacht Designprozesse für Content-Ersteller mit Nova Canvas und Nova Reel.
- Caylent nutzt Nova-Modelle, um Videoverständnis-Workflows für Medien-, Sport- und Einzelhandelskunden zu beschleunigen.
- Palantir-Technologien integriert Nova Pro in sein Ontologiesystem, um KI-gestützte Entscheidungsabläufe branchenübergreifend zu verbessern.
- Shutterstock integriert Nova Canvas in seinen AI Image Generator, um eine intuitive Lösung für die Erstellung hochwertiger visueller Inhalte anzubieten.
AWS hat detaillierte Informationen veröffentlicht KI-Servicekarten für Nova-Modelle, die Transparenz über Anwendungsfälle, Einschränkungen und verantwortungsvolle KI-Praktiken bieten: