Das AI-Forschungs- und Entwicklungslabor von Google, DeepMind, hat Alphaevolve vorgestellt, ein KI-System, das komplexe Probleme in Mathematik und Naturwissenschaften mit „maschinenabbaubaren“ Lösungen anpasst. Das System nutzt „hochmoderne“ Modelle, insbesondere Gemini-Modelle, um mögliche Antworten auf ein bestimmtes Problem zu generieren, zu kritisieren und zu bewerten.
Alphaevolve führt einen Mechanismus zur Reduzierung von Halluzinationen in KI -Modellen mithilfe eines automatischen Bewertungssystems ein. Dieses System bewertet die generierten Antworten auf die Genauigkeit und ermöglicht es, effektiv an Problemen zu arbeiten, die selbst in Bereichen wie Informatik und Systemoptimierung selbst bewertet werden können.

Zu verwenden AlphaevolveBenutzer müssen eine Problemanweisung sowie optionale Details wie Anweisungen, Gleichungen und relevante Literatur angeben. Sie müssen auch einen Mechanismus zur automatischen Bewertung der Antworten des Systems liefern, typischerweise in Form einer Formel. Die Fähigkeit des Systems beschränkt sich auf die Beschreibung von Lösungen als Algorithmen, was es für nicht numerische Probleme weniger geeignet ist.
Bei Benchmarking -Tests wurde Alphaevolve mit rund 50 mathematischen Problemen in verschiedenen Zweigen, einschließlich Geometrie und Kombinatorik, präsentiert. Das System „wiederentdeckt“ die bekanntesten Antworten in 75% der Zeit erfolgreich und entdeckte in 20% der Fälle verbesserte Lösungen. DeepMind hat Alphaevolve auch auf praktische Probleme angewendet, z.
Video: Google DeepMind
Entsprechend DeepmindAlphaevolve erzeugte einen Algorithmus, der durchschnittlich 0,7% der weltweiten Berechnungsressourcen von Google wiedererlangte, und schlug eine Optimierung vor, die die Gesamtzeit für die Ausbildung von Gemini -Modellen um 1% verringerte. Alphaevolve macht zwar keine bahnbrechenden Entdeckungen, aber es wird behauptet, Zeit zu sparen und Experten freizugeben, um sich auf kritischere Aufgaben zu konzentrieren.
DeepMind plant, eine Benutzeroberfläche für Alphaevolve zu erstellen und ein frühes Zugriffsprogramm für ausgewählte Akademiker zu starten, bevor ein breiteres Rollout in Betracht gezogen wird. Das Labor behauptet, dass die Fähigkeiten von Alphaevolve es zu einem wertvollen Instrument für Domain -Experten machen.