Große Sprachmodelle (LLMs) werden schlauer, aber es gibt ein großes Problem: Sie wissen nicht, wie sie effizient lernen sollen. Magellan ist ein neuer KI -Framework, der das menschliche Lernen nachahmt, indem er seinen eigenen Fortschritt vorhersagt – um ihn zu navigieren, um massive Zielbereiche zu navigieren, ohne auf das zu bleiben, was zu einfach oder zu schwer ist.
Entwickelt von Forschern aus INRIA und MIT, darunter Loris Gaven, Thomas Carta, Clément Romac, Cédric Colas, Sylvain Lampier, Olivier Sigaud und Pierre-Yves Oudyer, die Studie “Magellan: Metakognitive Vorhersagen des Lernfortschritts leiten autotelische LLM -Wirkstoffe in großen Torräumen”Führt einen Rahmen ein, der AI eine metakognitive Fähigkeit verleiht – im Wesentlichen die Fähigkeit, vorherzusagen, wie viel es sich verbessern wird, indem sie eine Aufgabe praktizieren. Auf diese Weise ermöglicht KI die Lernziele auf offene Weise, ähnlich wie Menschen, wenn sie neue Fähigkeiten angehen.
KI priorisiert das Lernen nicht gut
Traditionelle KI -Lernmethoden kämpfen in riesigen Zielräumen. Sie entweder:
- Verschwenden Sie Zeit für Aufgaben, die sie bereits gemeistert habenlangsame Fortschritte machen.
- Versuchsziele, die zu schwierig sindwas zu wiederholten Ausfällen führt.
- Erfordern menschliche Zielkategorienwas ineffizient ist und nicht skaliert.
Menschen hingegen instinktiv instinktiv Suche nach Herausforderungen, die ihre Fähigkeiten dehnen ohne unmöglich zu sein. Magellan bringt diesen menschlichen Ansatz in das LLM-Training.
Wie Magellan funktioniert: Vorhersage von Fortschritten, nicht nur Leistung
Die meisten KI -Trainingssysteme auch:
- Messen Sie die vergangene Leistung (was bei neuen Zielen nicht hilft).
- Verwenden Sie feste Schwierigkeitswerte (die sich nicht an sich ändernde Fähigkeiten anpassen).
Magellan nimmt eine intelligentere Route. Es schätzt dynamisch Wie viel wird eine KI ein Ziel verbessern, wenn sie es übt. Auf diese Weise können KI -Modelle Lernaufgaben auswählen, die den Fortschritt maximieren, anstatt nur die Dinge zufällig zu versuchen.
Die Methode arbeitet einen Prozess, der genannt wird Absolutes Lernfortschritt (ALP)– Übertragen Sie, wie viel eine KI eine bestimmte Aufgabe im Laufe der Zeit verbessert. Die Verwendung von ALP, Magellan Clusters, ziele in sinnvolle Kategorien ohne menschliche Intervention, KI über verwandte Fähigkeiten hinweg verallgemeinern lassen.
LLM -Leistungswerte sind aufgeblasen: Eine neue Methode zeigt die Wahrheit
KI lehren, wie ein Mensch zu lernen
Um Magellan zu testen, verwendeten die Forscher eine interaktive KI -Umgebung namens namens Little-Zoowo ein LLM -Agent verschiedene Aufgaben lernen musste – wie das Erkennen von Objekten, das Anbau von Pflanzen und sogar die Interaktion mit Tieren.
Die Ergebnisse waren klar:
- AI, das mit Magellan trainiert wurde, übertraf alle anderen Methoden und beherrschte mehr Aufgaben schneller.
- Es verallgemeinert besserwas bedeutet, dass es neue, unsichtbare Herausforderungen effektiver in Angriff nehmen könnte.
- Es wurden keine Zielkategorien von Menschen markiertseine Skalierbarkeit beweisen.
Im Gegensatz dazu nähert sich traditionelle Lernentwicklung entweder früh oder erforderlich Expertendefinierte Zielgruppensie starr und ineffizient machen.
Warum ist das wichtig
Magellans größter Durchbruch ist selbstgesteuertes Lernen. Anstatt sich auf menschliche Ingenieure zu verlassen, um Ziele auszuwählen, kann die KI autonom bestimmen, was als nächstes auf der Grundlage ihrer eigenen Fortschritte lernen soll. Dies verändert die KI davon, passiv ausgebildet zu werden, um sich aktiv zu verbessern, was es zu einem transformativen Ansatz über mehrere Felder macht.
AI -Assistenten können sich selbst neue Fähigkeiten vermitteln, indem sie Bereiche identifizieren, in denen sie kämpfen, und ihre Fähigkeit, sich ohne menschliche Intervention anzupassen, verbessern. In der Robotik können Maschinen ihre Fähigkeiten verfeinern, indem sie sich auf Aufgaben mit dem höchsten Lernpotential konzentrieren, was zu effizienteren und fähigeren autonomen Systemen führt. In der Bildung können KI-Tutoren den Unterricht in Echtzeit anpassen, nicht nur auf der Grundlage der vergangenen Leistung, sondern auch auf der vorhergesagten Verbesserung, was eine persönlichere Lernerfahrung bietet.
Magellan beweist, dass KI kann Denken Sie über sein eigenes Lernen nachdamit es in offenen Umgebungen weitaus effizienter ist. Der nächste Schritt könnte diese Methode über textbasierte Ziele in Bereiche wie Robotik, wissenschaftliche Entdeckung und sogar menschliche Bildung hinaus sein.
Ausgewähltes Bildnachweis: Kerem Gülen/Ideogramm