Google hat seine neueste KI -Modellsuite Gemini 2.0 für die Öffentlichkeit eröffnet und einen bedeutenden Schritt in den Vorschriften für fortgeschrittene AI -Agenten erzielt. Die Suite umfasst Gemini 2.0 Pro Experimental, das für Codierungen und komplexe Aufgaben und Gemini 2.0 Flash Thinking entwickelt wurde und jetzt in der Gemini -App erhältlich ist.
Die Familie Gemini 2.0 ist jetzt für alle offen
Gemini 2.0 Pro Experimental wird als bisher fähigste Modell von Google beschrieben, das sich in der Codierung und Handhabung komplizierter Eingabeaufforderungen hervorhebt. Es verfügt über ein Kontextfenster von 2 Millionen Token, sodass es ungefähr 1,5 Millionen Wörter gleichzeitig verarbeiten kann. Das Modell kann Tools wie Google Search aufrufen und Code im Namen von Benutzern ausführen. Das ursprünglich in der Gemini -App in der vergangenen Woche geärgert ist und ist jetzt über Googles AI -Entwicklungsplattformen, Vertex AI und Google AI Studio sowie über die Gemini Advanced -Abonnenten in der Gemini -App zugegriffen.
Gemini 2.0 Flash, das im Dezember eingeführt wurde, ist jetzt allgemein verfügbar. Als „Workforse-Modell“ in Rechnung gestellt, ist es für hochvolumige, hochfrequente Aufgaben und kostet Entwickler 10 Cent pro Million Token für Text-, Bild- und Videoeingänge. Darüber hinaus enthüllte Google Gemini 2.0 Flash-Lite, sein kostengünstigstes Modell, das der Leistung seines Vorgängers Gemini 1.5 Flash zu dem gleichen Preis und der gleichen Geschwindigkeit entspricht. Flash-Lite kostet 0,75 Cent pro Million Token.
Konzentrieren Sie sich auf KI -Agenten
Der freigeben Übereinstimmt auf die breitere Strategie von Google, die Agent -KI voranzutreiben – Models, die komplexe, mehrstufige Aufgaben autonom ausführen können. In einem Blog -Beitrag im Dezember betonte Google seinen Fokus auf die Entwicklung von Modellen, die „mehr über die Welt um Sie herum verstehen, mehrere Schritte vor uns denken und in Ihrem Namen Maßnahmen ergreifen“. Gemini 2.0 führt neue multimodale Funktionen ein, darunter native Image- und Audioausgabe sowie die Verwendung von Tools, wodurch Google seiner Vision eines universellen Assistenten näher kommt.
Dieser Push setzt Google in direkten Wettbewerb mit anderen Tech -Riesen und Startups wie Meta, Amazon, Microsoft, OpenAI und Anthropic, die alle stark investieren Agenten AI. Die KI -Agenten von Anthropic können beispielsweise in den Computern navigieren, ähnlich wie Menschen und erledigen Aufgaben mit Zehn oder Hunderten von Schritten. OpenAI hat kürzlich Operator veröffentlicht, einen Agenten, der Aufgaben wie Urlaubsplanung und Lebensmittelbestellung automatisieren kann, während Deep Research komplexe Berichte für Benutzer erstellt.
Google hat im Dezember auch ein eigenes Deep Research Tool gestartet, das als Forschungsassistent fungiert, um Themen zu erforschen und detaillierte Berichte zu erstellen. CEO Sundar Pichai betonte die Bedeutung der Ausführung für die Erste, und sagte in einem Strategie -Treffen im Dezember: „Ich denke, das ist es, worum es 2025 geht.“
Wettbewerb mit Deepseek
Die Veröffentlichungen von Google erfolgen inmitten des wachsenden Aufmerksamkeits für Deepseek, dem chinesischen KI -Startup, dessen Modelle mit denen führender amerikanischer Unternehmen konkurrieren oder übertreffen. Deepseeks R1 -Modell aufgrund seiner Erschwinglichkeit und Leistung erhebliche Traktion gewonnen. Um dem entgegenzuwirken, macht Google das Gemini 2.0 -Flash -Denkmodell über die Gemini -App zugänglicher und zielt möglicherweise darauf ab, den Angeboten stärker aufmerksam zu machen.