Googles „Projekt Jarvis“, das zuvor als Antwort des Unternehmens auf Microsofts Copilot galt, erhielt gerade eine zufällige Bestätigung, als es kurz im Chrome Web Store erschien.
Projekt Jarviswie Microsofts Copilotsoll als produktivitätssteigernde KI dienen, die über einfache Befehle hinaus mehrstufige, webbasierte Aufgaben erledigen kann. Seit Monaten gibt es Hinweise darauf, dass Google an einem fortschrittlichen, autonomen KI-Assistenten arbeitet, der die Chrome-Sitzungen der Nutzer steuern, Aufgaben wie Einkaufen und Reisen buchen sowie Recherchen mit minimalem Nutzeraufwand durchführen kann.
Diese zufällige Enthüllung (jetzt entfernt) auf der Chrome Web Store bestätigt das Jarvis ist tatsächlich real – und wahrscheinlich auf dem Weg zur Veröffentlichung.
Was bringt Project Jarvis mit?
Ähnlich wie die Copilot-Integration von Microsoft mit Office ist Jarvis darauf ausgelegt, komplexe Aufgaben, die mehrere Schritte erfordern, zu vereinfachen und zu automatisieren. Laut The Information wird Jarvis auf dem KI-Modell Gemini 2.0 von Google basieren, das es ihm ermöglicht, sequentielle Arbeitsabläufe und komplexe Überlegungen zu bewältigen.
Anstatt nur Antworten zu geben, ist Jarvis darauf eingestellt, autonom Aktionen auszuführen, Chrome-Registerkarten zu steuern und mit Website-Oberflächen zu interagieren, indem er Screenshots erfasst und analysiert. Diese Technologie ähnelt eher einem Mitarbeiter, der unabhängig agieren kann, als einem einfachen Assistenten.
Funktionalität, die über Sprachassistenten hinausgeht
Jarvis ist kein typischer virtueller Assistent. Während Copilot für die Navigation in Software wie Word, Excel und Teams konzipiert ist, erstreckt sich Jarvis auf die Durchführung komplexer Vorgänge auf Websites. Stellen Sie es sich als einen digitalen Assistenten vor, der in der Lage ist, eine Webseite zu „sehen“, Elemente wie Formulare oder Schaltflächen zu interpretieren und auf der Grundlage seines Verständnisses Entscheidungen zu treffen.
Es kann auf Schaltflächen klicken, Datenfelder ausfüllen und sogar Elemente auf verschiedenen Websites vergleichen – Aufgaben, die normalerweise mehrere Benutzerschritte erfordern. Die auf Screenshots basierende Navigation von Jarvis ermöglicht die Arbeit mit einer Reihe von Web-Layouts und -Formularen, auch mit solchen, die sehr unterschiedlich sind. Allerdings verlangsamt diese Methode die Geschwindigkeit, sodass die Analyse jedes Schritts einige Sekunden dauert.
Datenschutz in Frage
Wie bei Microsofts Copilot, der sich tief in Office-Umgebungen integriert, wirft Jarvis Fragen zu Datenschutz und Sicherheit auf.
Da sich der Assistent bei der Interpretation von Webseiten auf Screenshots verlässt, könnte er möglicherweise vertrauliche Informationen erfassen. Das Engagement von Google, Jarvis auf Sicherheit und Datenintegrität zu testen, wird für die Wahrung des Vertrauens der Nutzer von entscheidender Bedeutung sein. Angesichts des Ausmaßes an Kontrolle, das Jarvis über die Geräte der Benutzer haben könnte, sind robuste Schutzmaßnahmen unerlässlich, um unbefugten Zugriff oder Verstöße zu verhindern.
KI und Produktivität werden eins
Sowohl Googles Project Jarvis als auch Microsofts Copilot sind Teil eines wachsenden Trends hin zu autonomen, produktivitätsorientierten KI-Agenten. Wenn diese Technologien ausgereift sind, versprechen sie, die Art und Weise, wie Benutzer mit digitalen Arbeitsabläufen umgehen, neu zu gestalten und möglicherweise die manuelle Eingabe bei allgemeinen digitalen Aufgaben zu reduzieren. Es bleibt abzuwarten, wie sich Jarvis direkt mit KI-gesteuerten Produktivitätstools vergleichen lässt.
Während sich Jarvis seiner offiziellen Vorschau-Veröffentlichung nähert, könnte das Tool einen Blick in die Zukunft integrierter KI-Tools werfen und leistungsstarke Aufgabenautomatisierung direkt in die Browser der Benutzer bringen.
Vorerst werden wir genau beobachten, wie Google seinen neuesten Einstieg in das KI-Rennen verfeinert.
Bildnachweise: Emre Çıtak/Ideogramm KI