In dem, was viele das „Jahr der verkörperten KI“ nennen, hat Meta einen großen Schritt gemacht bei der Weiterentwicklung der Roboterfähigkeiten durch eine Reihe neuer Technologien. Die Abteilung Fundamental AI Research (FAIR) von Meta hat kürzlich drei Forschungsartefakte eingeführt – Meta Sparsh, Meta Digit 360 und Meta Digit Plexus – die jeweils Fortschritte in der Berührungswahrnehmung, Geschicklichkeit und Mensch-Roboter-Zusammenarbeit bringen.
Was ist verkörperte KI und warum ist sie wichtig?
Verkörperte KI bezieht sich auf Systeme der künstlichen Intelligenz, die darauf ausgelegt sind, in der physischen Welt zu existieren und zu funktionieren und ihre Umgebung auf eine Weise zu verstehen und mit ihr zu interagieren, die menschliche Wahrnehmung und Handlungen nachahmt. Herkömmliche KI-Systeme sind bei der Datenanalyse hervorragend, aber bei der Anwendung auf physische Aufgaben, die nicht nur das Sehen, sondern auch sensorisches Feedback wie Berührungen erfordern, sind sie unzureichend. Durch den Aufbau verkörperter KI wollen Forscher Roboter schaffen, die ihre Umgebung wahrnehmen, reagieren und sich sogar an sie anpassen können und so die Lücke zwischen digitaler Intelligenz und Funktionalität in der realen Welt schließen.
Metas Innovationen in der verkörperten KI zielen darauf ab, das zu erreichen, was sein Chef-KI-Wissenschaftler Yann LeCun Advanced Machine Intelligence (AMI) nennt. Dieses Konzept sieht Maschinen vor, die in der Lage sind, über Ursache und Wirkung nachzudenken, Maßnahmen zu planen und sich an Veränderungen in ihrer Umgebung anzupassen und sich so von bloßen Werkzeugen zu kollaborativen Assistenten zu entwickeln.
Metas Durchbrüche in der verkörperten KI: Sparsh, Digit 360 und Digit Plexus
Die jüngsten Ankündigungen von Meta unterstreichen sein Engagement, die Grenzen der aktuellen Robotiktechnologie zu überwinden. Lassen Sie uns die Möglichkeiten jedes neuen Tools erkunden.
Meta Sparsh: Die Grundlagen der taktilen Wahrnehmung
Meta Sparsh, was auf Sanskrit „Berührung“ bedeutet, ist ein einzigartiges visionsbasiertes Tastsensormodell, das es Robotern ermöglicht, Oberflächen und Objekte zu „fühlen“. Sparsh ist ein Allzweck-Encoder, der auf einer Datenbank mit über 460.000 taktilen Bildern basiert, um Robotern das Erkennen und Interpretieren von Berührungen beizubringen. Im Gegensatz zu herkömmlichen Modellen, die eine aufgabenspezifische Schulung erfordern, nutzt Sparsh selbstüberwachtes Lernen und ermöglicht so die Anpassung an verschiedene Aufgaben und Sensoren, ohne dass umfangreiche gekennzeichnete Daten erforderlich sind.
Diese Fähigkeit zur Verallgemeinerung ist der Schlüssel für Roboter, die ein breites Spektrum an Aufgaben ausführen müssen. Sparsh arbeitet mit verschiedenen taktilen Sensoren und lässt sich nahtlos in verschiedene Roboterkonfigurationen integrieren. Indem es Robotern ermöglicht, Berührungen wahrzunehmen, eröffnet Sparsh Möglichkeiten in Bereichen, in denen geschickte Manipulation und taktile Rückmeldung von entscheidender Bedeutung sind, beispielsweise bei medizinischen Anwendungen, Roboterchirurgie und Präzisionsfertigung.

Meta Digit 360: Taktile Wahrnehmung auf menschlicher Ebene in der Robotik
Digit 360 ist der neue taktile Fingerspitzensensor von Meta, der menschliche Berührungen nachahmen soll. Ausgestattet mit 18 verschiedenen Sensorfunktionen liefert Digit 360 äußerst detaillierte taktile Daten, mit denen kleinste Änderungen der Oberfläche, Kraft und Textur eines Objekts erfasst werden können. Digit 360 besteht aus über 8 Millionen „Taxel“ (taktilen Pixeln) und ermöglicht es Robotern, Kräfte von nur 1 Millinewton zu erkennen und so ihre Fähigkeit zu verbessern, komplexe, differenzierte Aufgaben auszuführen.
Dieser Durchbruch in der taktilen Sensorik hat praktische Anwendungen in verschiedenen Bereichen. Im Gesundheitswesen könnte Digit 360 in der Prothetik eingesetzt werden, um Patienten einen verbesserten Tastsinn zu vermitteln. In der virtuellen Realität könnte es immersive Erlebnisse verbessern, indem es Benutzern ermöglicht, Objekte in digitalen Umgebungen zu „fühlen“. Meta arbeitet mit GelSight Inc. zusammen, um Digit 360 zu kommerzialisieren, mit dem Ziel, es bis zum nächsten Jahr der breiteren Forschungsgemeinschaft zugänglich zu machen.

Meta Digit Plexus: Eine Plattform für berührungsempfindliche Roboterhände
Metas dritte Hauptversion, Digit Plexus, ist eine standardisierte Hardware-Software-Plattform, die darauf ausgelegt ist, verschiedene taktile Sensoren in einer einzigen Roboterhand zu integrieren. Digit Plexus kombiniert Fingerspitzen- und Handflächensensoren und verleiht Robotern so ein koordinierteres, menschenähnliches Berührungsreaktionssystem. Diese Integration ermöglicht es Robotern, sensorisches Feedback zu verarbeiten und während Aufgaben Echtzeitanpassungen vorzunehmen, ähnlich wie menschliche Hände.
Durch die Standardisierung des Berührungsfeedbacks in der gesamten Roboterhand verbessert Digit Plexus die Kontrolle und Präzision. Meta sieht Anwendungen für diese Plattform in Bereichen wie Fertigung und Fernwartung, wo eine schonende Handhabung von Materialien unerlässlich ist. Um den Aufbau einer Open-Source-Robotik-Community zu unterstützen, stellt Meta die Software- und Hardware-Designs für Digit Plexus frei zur Verfügung.

Metas Partnerschaften mit GelSight Inc und Wonik Robotics
Zusätzlich zu diesen technologischen Fortschritten ist Meta Partnerschaften eingegangen, um die Einführung taktiler Sensorik in der Robotik zu beschleunigen. Durch die Zusammenarbeit mit GelSight Inc und Wonik Robotics möchte Meta seine Innovationen Forschern und Entwicklern auf der ganzen Welt zugänglich machen. GelSight Inc wird den Vertrieb von Digit 360 übernehmen, während Wonik Robotics die Allegro Hand herstellen wird – eine in Digit Plexus integrierte Roboterhand, die voraussichtlich nächstes Jahr auf den Markt kommt.
Diese Partnerschaften sind von Bedeutung, da sie einen Wandel hin zur Demokratisierung der Robotertechnologie darstellen. Durch die breite Verfügbarkeit dieser fortschrittlichen taktilen Systeme fördert Meta ein kollaboratives Ökosystem, das neue Anwendungen hervorbringen und die Leistung von Robotern branchenübergreifend verbessern könnte.
PARTNR: Ein neuer Maßstab für die Mensch-Roboter-Kollaboration
Meta führt außerdem PARTNR (Planning And Reasoning Tasks in humaN-Robot Collaboration) ein, einen Benchmark zur Bewertung von KI-Modellen für Mensch-Roboter-Interaktionen im Haushalt. PARTNR basiert auf dem Habitat 3.0-Simulator und bietet eine realistische Umgebung, in der Roboter mit Menschen bei komplexen Aufgaben interagieren können, die von Hausarbeiten bis hin zur Navigation in der physischen Welt reichen.
Mit über 100.000 sprachbasierten Aufgaben bietet PARTNR eine standardisierte Möglichkeit, die Wirksamkeit von KI-Systemen in kollaborativen Szenarien zu testen. Dieser Benchmark zielt darauf ab, die Erforschung von Robotern voranzutreiben, die als „Partner“ und nicht nur als bloße Werkzeuge fungieren, und sie mit der Fähigkeit auszustatten, Entscheidungen zu treffen, menschliche Bedürfnisse zu antizipieren und im Alltag Hilfe zu leisten.
Bildnachweis: Meta