Dataconomy DE
Subscribe
No Result
View All Result
Dataconomy DE
Subscribe
No Result
View All Result
Dataconomy DE
No Result
View All Result

KI kann jetzt klicken, scrollen und für Sie tippen – aber ist das eine gute Sache?

byKerem Gülen
Januar 30, 2025
in Artificial Intelligence
Home Artificial Intelligence
Share on FacebookShare on Twitter

Eine aktuelle Studie from Zurich University of Applied Sciences by Pascal J. Sager, Benjamin Meyer, Peng Yan, Rebekka von Wartburg-Kottler, Layan Etaiwi, Aref Enayati, Gabriel Nobel, Ahmed Abdulkadir, Benjamin F. Grewe, and Thilo Stadelmann reveals that AI agents have officially ihre Chatbot -Phase entwachsen.

KI -Agenten führen die Show aus, klicken auf, scrollen und geben ihren Weg durch Workflows mit unheimlicher Präzision. Diese anleitungsbasierten Computerkontrollagenten (CCAs) können Befehle ausführen und mit digitalen Umgebungen wie erfahrenen menschlichen Betreibern interagieren. Aber wenn sie sich der vollen Autonomie nähern, wird eins klar: Je mehr Kraft wir ihnen geben, desto schwieriger wird es, sie in Schach zu halten.

Wie KI -Agenten lernen, Computer wie Sie zu verwenden

Herkömmliche Automatisierungswerkzeuge sind verherrlichte Makros – repetitiv, starr und ahnungslos außerhalb ihrer Skriptpfade. CCAs hingegen sind zum Improvisieren gebaut. Sie folgen nicht nur Anweisungen. Sie beobachten, interpretieren und handeln auf dem, was sie auf einem Bildschirm „sehen“, dank Vision-Sprachmodellen (VLMs) und großsprachigen Modellen (LLMs). Dies ermöglicht ihnen:

  • Lesen Sie Bildschirme wie ein MenschIdentifizieren von Text, Schaltflächen und Eingabefeldern ohne vordefinierte Koordinaten.
  • Multi-Schritt-Aufgaben ausführenwie das Öffnen einer E -Mail, das Kopieren von Daten, das Einfügen in eine Tabelle und das Drücken von Senden – alle ohne direkte Aufsicht.
  • Anweisungen für natürliche Sprache verstehenEntfernen Sie die Notwendigkeit, dass Benutzer komplexe Automatisierungsskripte lernen.
  • Sich an sich ändernde Schnittstellen anpassenwas sie wesentlich flexibler machen als regelbasierte Automatisierungswerkzeuge.

Sagen Sie einer CCA, dass sie „die Top-Verkaufsdarsteller von heute und eine E-Mail an eine Folge“ finden, und sie bewegt sich durch Apps, extrahiert relevante Daten, komponiert eine E-Mail und sendet sie wie ein menschlicher Assistent. Im Gegensatz zu RPA der alten Schule (Roboterprozessautomatisierung), die sich bei ändert, kann sich CCAs in Echtzeit anpassen, visuelle Elemente identifizieren und Entscheidungen im laufenden Fliegen treffen.

Die nächste Grenze? Integration in Cloud-basierte Wissensrepositories und autonome Entscheidungsfindung. Je mehr diese Agenten lernen, desto raffinierter werden ihre Fähigkeiten – die Fragen zu Fragen darüber, wie viel Vertrauen wir in sie stellen sollten.


Wie große Sprachmodelle Peer Review verändern


Die Vorteile: Produktivität, Zugänglichkeit und Automatisierung

Es ist nicht zu leugnen, dass CCAs ernsthafte Vorteile haben:

  • Produktivität auf Steroiden: Langwierige, zeitaufwändige Aufgaben verschwinden, sodass Arbeiter sich auf höherwertige Entscheidungen konzentrieren können, anstatt durch Dashboards zu klicken.
  • Barrierefreiheit Revolution: Menschen mit Behinderungen können durch KI-betriebene Navigation und Aufgabenautomatisierung nahtlos mit Technologie interagieren.
  • Unternehmensweite Skalierbarkeit: Unternehmen können ganze Workflows automatisieren, ohne eine Armee von IT -Spezialisten einzustellen, um kundenspezifische Lösungen zu erstellen.
  • Systemweite Integration: CCAs funktionieren über verschiedene Plattformen und Anwendungen hinweg und gewährleisten nahtlose digitale Interaktionen.
  • Immer Effizienz: Im Gegensatz zu menschlichen Arbeitern werden diese Agenten nicht müde, abgelenkt oder machen Mittagspausen.

Die Risiken: Privatsphäre, Sicherheit und Vertrauen

Für jeden Produktivitätsgewinn gibt es im Hintergrund einen gleichen und entgegengesetzten Albtraum. Die Steuerung der KI -Kontrolle über Benutzeroberflächen ist nicht nur die Automatisierung, sondern einen nicht blinkenden Zugang zu sensiblen Workflows, Finanztransaktionen und privaten Daten. Und hier werden die Dinge kompliziert.

CCAs arbeiten, indem sie Bildschirme „ansehen“ und Text analysieren. Wer stellt sicher, dass sensible Informationen nicht missbraucht oder protokolliert werden? Wer hält KI-gesteuerte Tastenanschläge in Schach?

Wenn sich ein AI -Agent in Ihre Bank -App anmelden und mit einem einzigen Befehl Geld übertragen kann, was passiert, wenn er gehackt wird? Wir übergeben die digitalen Schlüssel mit wenigen Schutzmaßnahmen an das Königreich. Wenn ein CCA einen katastrophalen Fehler macht – die falsche Datei ausschließt, die falsche E -Mail sendet oder eine katastrophale Transaktion genehmigt – wer ist verantwortlich? Menschen können abgefeuert, bestraft oder ausgebildet werden. Ai? Nicht so sehr.

Und wenn ein böswilliger Schauspieler eine CCA entführt, erhalten sie nicht nur Zugang – sie erhalten einen unermüdlichen, automatisierten Komplizen, der in der Ebene Chaos anrichten kann. Der Gesetzgeber bemüht sich, mitzuhalten, aber es gibt kein Spielbuch für KI-gesteuerte digitale Assistenten, die in Echtzeit Entscheidungen treffen.

Was kommt als nächstes?

Unternehmen bewegen sich vorsichtig und versuchen, die unbestreitbaren Effizienzgewinne mit den drohenden Risiken auszugleichen. Einige Unternehmen setzen Modelle „Mensch-in-the-Loop“ durch, bei denen KI-Agenten die Ausführung bewältigen, jedoch eine manuelle Genehmigung für kritische Maßnahmen erfordern. Andere investieren in KI -Governance -Richtlinien, um Schutzmaßnahmen zu schaffen, bevor diese Agenten im Unternehmensbetrieb Standard werden.

Sicher ist, dass CCAs kein vorübergehender Trend sind – sie sind die nächste Phase der AI -Evolution, die sich leise in Workflows und Schnittstellen überall einbettet. Wenn sie fähiger werden, geht es in der Debatte nicht darüber, ob wir sie verwenden sollten, sondern wie wir sie möglicherweise kontrollieren können.


Bilder: Kerem Gülen/Midjourney

Tags: Agenten AIAiVorgestellt

Related Posts

Google transformiert Gmail mit AI-Posteingang und natürlicher Sprachsuche

Google transformiert Gmail mit AI-Posteingang und natürlicher Sprachsuche

Januar 9, 2026
Ford kündigt auf der CES 2026 den KI-Assistenten und BlueCruise der nächsten Generation an

Ford kündigt auf der CES 2026 den KI-Assistenten und BlueCruise der nächsten Generation an

Januar 8, 2026
OpenAI führt einen speziellen ChatGPT-Gesundheitsbereich ein

OpenAI führt einen speziellen ChatGPT-Gesundheitsbereich ein

Januar 8, 2026
Skylight stellt auf der CES 2026 Calendar 2 mit KI-Organisationstools vor

Skylight stellt auf der CES 2026 Calendar 2 mit KI-Organisationstools vor

Januar 8, 2026
Google Classroom verwandelt Unterrichtsstunden mit Gemini in Podcasts

Google Classroom verwandelt Unterrichtsstunden mit Gemini in Podcasts

Januar 8, 2026
Jenseits der Halluzination: Wie KI AAA-Produktionspipelines aus dem Vakuum wieder aufbaut

Jenseits der Halluzination: Wie KI AAA-Produktionspipelines aus dem Vakuum wieder aufbaut

Januar 8, 2026

Recent Posts

  • XBrew Lab stellt auf der CES 2026 eine kartuschenfreie Nitro-Kaffeemaschine vor
  • Snowflake erwirbt die Observability-Plattform Observe
  • Google transformiert Gmail mit AI-Posteingang und natürlicher Sprachsuche
  • EU und Großbritannien prüfen Ermittlungen gegen X wegen mangelnder Schutzmaßnahmen bei Grok
  • TikTok schließt Partnerschaft mit der FIFA für WM-Highlights

Recent Comments

Es sind keine Kommentare vorhanden.
Dataconomy DE

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

  • Home
  • Sample Page

Follow Us

  • Home
  • Sample Page
No Result
View All Result
Subscribe

This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy Policy.