Googles neuestes Projekt mit dem Codenamen „Project Jarvis“ soll KI nutzen, um webbasierte Aufgaben im Chrome-Browser zu automatisieren.
Entsprechend Die Informationendieses KI-gestützte Projekt, dessen Debüt in frühen Vorschauen im Dezember dieses Jahres erwartet wird, wird vorangetrieben von Googles Gemini 2.0 Modell und stellt ein verbraucherorientiertes Tool dar, das darauf abzielt, Online-Interaktionen zu vereinfachen. Nach dem Vorbild von Marvels fiktivem JARVIS-Assistenten wird Jarvis mehrstufige digitale Aufgaben autonom ausführen, die alles vom Online-Shopping bis zur Reisebuchung umfassen.
Gemini 2.0 treibt Projekt Jarvis an
Gemini 2.0, die neueste Version des fortschrittlichen KI-Modells von Google, dient als Grundlage für Project Jarvis. Enthüllt bei Google I/O 2024Gemini wurde mit Verbesserungen in den Bereichen Denken, Planung und Gedächtnis entwickelt, die alle darauf abzielen, Benutzer bei der autonomen Erledigung komplexer, mehrstufiger Aufgaben zu unterstützen.
Wie Sundar Pichai, CEO von Google, während der I/O erklärte, besteht das Ziel darin, „intelligente Systeme zu schaffen, die Argumentation, Planung und Gedächtnis zeigen, [and are] „in der Lage, mehrere Schritte vorauszudenken“ und bleibt dabei vollständig vom Benutzer überwacht. Mit diesen Fähigkeiten möchte Gemini ein „Flaggschiff-Beispiel„Wie zukünftige KI-Agenten die Produktivität steigern und Benutzereingaben reduzieren können.
Was Jarvis auszeichnet, ist seine Fähigkeit, innerhalb der zu agieren Chrom Browser, Screenshots aufnehmen um seine Interaktionen mit Online-Formularen und Schaltflächen zu steuern. Laut The Information erstellt Jarvis häufig Screenshots des Chrome-Fensters eines Benutzers, um die einzelnen Benutzeroberflächen zu interpretieren und so auf Schaltflächen zu „klicken“, in Felder etwas einzugeben oder sogar Elemente auf verschiedenen Websites zu vergleichen.
Die Screenshot-gesteuerte Methode ermöglicht dies auch Jarvis komplexe Formen verstehen und Layouts, die je nach Standort stark variieren. Diese Funktion bedeutet jedoch, dass Jarvis relativ langsam arbeitet und einige Sekunden braucht, um jeden Screenshot zu analysieren, bevor er mit dem nächsten Schritt fortfährt. Obwohl diese Technologie noch nicht auf Geschwindigkeit optimiert ist, verdeutlicht sie die Strategie von Google, cloudbasierte Ressourcen zur Unterstützung komplexer KI-Aufgaben zu nutzen, die andernfalls Rechenleistung auf dem Gerät erfordern würden.
Wie wäre es mit Bewerbungen?
Project Jarvis verspricht, die Art und Weise zu verändern, wie Benutzer mit digitalen Plattformen interagieren, wobei der Schwerpunkt auf der Automatisierung routinemäßiger webbasierter Aufgaben wie dem Kauf von Produkten, der Buchung von Flügen oder dem Sammeln von Recherchen liegt.
Diese Funktion könnte ein breites Publikum ansprechen, von vielbeschäftigten Profis bis hin zu alltäglichen Benutzern, die ihre Aufgaben rationalisieren möchten. Der Bericht der Information unterstreicht dies Mit Jarvis können Benutzer umfangreiche webbasierte Prozesse mit minimalem Eingabeaufwand abschließenDadurch können sie zeitaufwändige Aktivitäten an die KI delegieren. Auf diese Weise möchte Google Jarvis als verbraucherorientiertes, produktivitätsorientiertes Tool positionieren Microsofts Copilot-Vision oder Apples Apple Intelligence.
Wann können Nutzer auf Google Jarvis zugreifen?
Berichten zufolge gibt es eine frühe Vorschau auf Project Jarvis könnte im Dezember debütierenEinzelheiten können sich jedoch ändern. Das Unternehmen wird das Tool wahrscheinlich zunächst einem begrenzten Publikum zugänglich machen, um vor einer breiteren Einführung etwaige Fehler oder Einschränkungen zu identifizieren und zu beheben.
Google hat bei früheren Produkteinführungen einen ähnlichen Ansatz verwendet, wie z Barden-KIDies gibt frühen Benutzern die Möglichkeit, Feedback zu geben und zu Verbesserungen beizutragen, bevor sie allgemein verfügbar sind. Diese Testphase könnte beeinflussen, wie Google Jarvis für eine schnellere und nahtlosere Leistung optimiert und gleichzeitig sicherstellt, dass Sicherheitsprotokolle die Erwartungen der Benutzer erfüllen.
Da kommen die Bedenken
Als KI-Assistent mit erheblicher Kontrolle über das Web-Erlebnis eines Benutzers wirft Jarvis neue Datenschutz- und Sicherheitsbedenken auf. Da Jarvis auf die Interpretation von Screenshots potenziell sensibler Informationen angewiesen ist, sind robuste Sicherheitsmaßnahmen unerlässlich, um sicherzustellen, dass Benutzerdaten geschützt bleiben. Der Plan von Google sieht vor, diese Sicherheitsmaßnahmen intensiv zu testen, bevor Jarvis eine umfassendere Veröffentlichung vorsieht. Die potenziellen Risiken, die mit einem derart hohen Grad an Systemzugriff verbunden sind, lösen jedoch eine Debatte unter Datenschutzbefürwortern und Entwicklern aus.
Indem Google KI-Tools wie Jarvis direkte Kontrolle über die Geräte der Nutzer gewährt, muss es Schutzmaßnahmen implementieren, um Schwachstellen und unbefugten Zugriff zu verhindern. Während sich Project Jarvis noch in der Entwicklung befindet, verspricht es eine Revolution in der KI-gesteuerten Produktivität zu werden, indem es Benutzern ermöglicht, komplexe, mehrstufige Aufgaben innerhalb des Chrome-Browsers zu delegieren. Durch die Kombination der Leistung von Gemini 2.0 mit den Webfunktionen von Chrome entwickelt Google eine KI, die die Art und Weise, wie wir digitale Aufgaben angehen, vom Einkaufen bis zur Recherche, neu definieren könnte.
Wenn Google Jarvis für den Verbrauchergebrauch fertigstellt, könnte sein Erfolg den Weg für fortschrittlichere und autonomere KI-Erlebnisse ebnen und die Art und Weise verändern, wie wir mit Browsern und möglicherweise auch mit der Technologie insgesamt interagieren.
Bildnachweise: Emre Çıtak/Ideogramm KI