Microsoft hat eingeführt ein neues Multi-Agenten-System für künstliche Intelligenz (KI) namens Magnetic-One, das darauf ausgelegt ist, komplexe Aufgaben mit mehreren spezialisierten Agenten zu erledigen. Dieses als Open-Source-Tool auf Microsoft AutoGen verfügbare System soll Entwickler und Forscher bei der Erstellung von Anwendungen unterstützen, die mehrstufige Aufgaben über verschiedene Domänen hinweg autonom verwalten können.
Was ist Magnetic-One?
Magnetic-One ist ein generalistisches Multiagentensystem, das mithilfe eines Orchestrators verschiedene Agenten koordiniert, die jeweils auf eine bestimmte Aufgabe spezialisiert sind. Der Hauptagent, Orchestrator genannt, arbeitet mit vier spezialisierten Agenten zusammen:
- WebSurfer-Agent: Verwaltet das Surfen im Internet, Klicks und die Zusammenfassung von Webinhalten.
- FileSurfer-Agent: Verwaltet lokale Dateien, Verzeichnisse und Ordner.
- Programmierer-Agent: Schreibt Code und führt ihn aus, analysiert Informationen und erstellt neue Projekte.
- ComputerTerminal-Agent: Stellt eine Konsole für die Programmausführung durch den Coder Agent bereit.
Diese Agenten arbeiten zusammen, um offene Aufgaben zu lösen, wodurch Magnetic-One für Anwendungen wie Softwareentwicklung, Datenanalyse und wissenschaftliche Forschung geeignet ist. Microsoft beschreibt Magnetic-One aufgrund seines modularen Aufbaus, der das Hinzufügen oder Entfernen von Agenten ermöglicht, ohne die Kernstruktur des Systems zu beeinträchtigen, als „flexible und skalierbare Alternative zu Einzelagentensystemen“.
Hauptmerkmale
Magnetic-One zeichnet sich durch seine Fähigkeit aus, mehrere Agenten mithilfe eines einzigen Sprachmodells zu aktivieren. Das System kann verschiedene Aufgaben ausführen, von der Navigation in Webbrowsern bis zur Ausführung von Python-Code. Diese Funktionalität bedeutet, dass reale Szenarien wie das Buchen von Tickets, der Kauf von Produkten oder das Bearbeiten von Dokumenten auf einem lokalen Gerät verarbeitet werden können.
Die modulare Multi-Agenten-Architektur stellt sicher, dass jeder Agent eine eigene Verantwortung trägt, was zu einer höheren Effizienz bei komplexen, mehrstufigen Aufgaben führt. Dieser Ansatz ermöglicht es Magnetic-One, ein Problem in Teilaufgaben zu unterteilen und so sowohl die Genauigkeit als auch die Geschwindigkeit der Aufgabenerledigung zu verbessern. Wenn das System beispielsweise aufgefordert wird, eine Kinokarte zu buchen, übernimmt jeder Agent einen anderen Teil der Aufgabe, z. B. die Verarbeitung visueller Informationen, die Navigation auf der Website und den Abschluss der Transaktion.
Das AutoGen-Framework von Microsoft basiert auf Magnetic-One und unterstützt die Integration mit verschiedenen großen und kleinen Sprachmodellen, um unterschiedliche Kosten- und Leistungsanforderungen zu erfüllen. Derzeit wird das System mit Modellen wie GPT-4o und OpenAIs o1-preview getestet, bleibt jedoch modellunabhängig und ermöglicht so zukünftige Flexibilität.
Um die Wirksamkeit von Magnetic-One zu bewerten, hat Microsoft außerdem AutoGenBench veröffentlicht, ein Tool, das die Agentenleistung anhand verschiedener Benchmarks wie GAIA, AssistantBench und WebArena bewertet. Diese Benchmarks konzentrieren sich auf Aufgaben wie mehrstufige Planung und Werkzeugnutzung. Erste Tests von Microsoft vom Oktober 2024 deuten darauf hin, dass Magnetic-One im Vergleich zu modernsten Methoden konkurrenzfähige Ergebnisse liefert.
Video: Microsoft
Der wachsende Trend: Multiagentensysteme
Magnetic-One ist Teil eines wachsenden Trends hin zu Multi-Agent-KI-Systemen. OpenAI hat Swarm eingeführtein weiteres Framework, das auf den Aufbau und die Bereitstellung von Multiagentensystemen abzielt. In ähnlicher Weise hat IBM das eingeführt Bee Agent Frameworkein Open-Source-Toolkit, das die Bereitstellung agentenbasierter Workflows unterstützt und mit Modellen wie kompatibel ist IBM Granit Und Lama 3.2. Diese Systeme zielen, ähnlich wie Magnetic-One, darauf ab, skalierbare Lösungen für komplexe Problemlösungsaufgaben anzubieten.
Laut Microsoft „unterstützt das Plug-and-Play-Design von Magnetic-One eine einfache Anpassung und Erweiterbarkeit, indem es das Hinzufügen oder Entfernen von Agenten ermöglicht, ohne andere Agenten oder die Gesamtarchitektur zu ändern.“ Diese Flexibilität ist besonders wichtig für sich entwickelnde Geschäftsanforderungen und neue Anwendungen und macht Magnetic-One zu einem vielversprechenden Werkzeug für Forscher und Entwickler, die adaptivere KI-Systeme entwickeln möchten.
Hervorgehobener Bildnachweis: Kerem Gülen/Ideogramm