Eine menschenähnliche Roboterhand ist in der Lage, den Rubik’s Cube zu lösen

Nach einigen Jahren des Versuchs war OpenAI in der Lage, eine Roboterhand in der Simulation zu trainieren, um den Rubik’s Cube zu lösen.

Roboterhand löst Zauberwürfel
Roboterhand löst Zauberwürfel

OpenAI, das Forschungsunternehmen, das künstliche Intelligenz erforscht, war in der Lage, ein Paar neuronale Netze zu trainieren, um den Rubik’s Cube mit einer Roboterhand zu lösen.

In einem Blog-Post, in dem die Errungenschaft verkündet wurde, sagte OpenAI, dass die neuronalen Netze in einer Simulation trainiert wurden und sich dabei auf den OpenAIFive-Code gepaart mit Automatic Domain Randomization stützten, einer neuen Technik, die das Unternehmen entwickelt hat.

OpenAI war seit dem Frühjahr 2017 dabei

„Mit menschlichen Händen können wir eine Vielzahl von Aufgaben lösen. In den letzten 60 Jahren der Robotik mussten für schwierige Aufgaben, die der Mensch mit seinem festen Paar Hände bewältigt, für jede Aufgabe ein eigener Roboter entworfen werden. Als Alternative haben die Menschen viele Jahrzehnte damit verbracht, Allzweck-Roboterhardware zu verwenden, jedoch mit begrenztem Erfolg aufgrund ihrer hohen Freiheitsgrade“, schrieb OpenAI.  „Insbesondere die Hardware, die wir hier verwenden, ist nicht neu – die Roboterhand, die wir verwenden, gibt es schon seit 15 Jahren – aber der Softwareansatz ist es.“

OpenAI hat seit dem Frühjahr 2017 versucht, eine menschenähnliche Roboterhand zu trainieren, um den Rubik’s Cube zu lösen, in der Hoffnung, dass das Training einer Roboterhand, die etwas so Komplexes wie den Rubik’s Cube lösen kann, den Weg zum Training eines Allzweckroboters ebnet. Die Firma konnte ihn im Juli 2017 in einer Simulation lösen, aber seit Juli letzten Jahres konnte sich die Roboterhand nur auf einem Block bewegen.

Nun aber haben sie endlich ihr Ziel erreicht.

„Einen Rubik’s Cube mit einer Hand zu lösen, ist selbst für Menschen eine anspruchsvolle Aufgabe, und Kinder brauchen mehrere Jahre, um die nötige Geschicklichkeit zu erlangen, um sie zu meistern. Unser Roboter hat seine Technik allerdings noch nicht perfektioniert, denn er löst den Rubik’s Cube in 60 % der Zeit (und nur in 20 % der Zeit für ein maximal schwieriges Scramble)“, schreibt OpenAI in dem Blogpost.

OpenAI verschmolz alt mit neu, um die Roboterhand in der Simulation zu trainieren

Wie hat OpenAI es also geschafft?

Das Unternehmen gab an, die neuronalen Netze mit Hilfe von Reinforcement Learning und dem Kociemba-Algorithmus trainiert zu haben. Die Domänenrandomisierung ermöglichte es, die Netze in der Simulation zu trainieren und dann auf die Roboterhand zu übertragen.

Um die Herausforderung zu meistern, in der Simulation Umgebungen zu schaffen, die vielfältig genug sind, um die reale Welt abzubilden, setzte es seine neue ADR-Methode ein. Mit ihr werden in der Simulation kontinuierlich immer schwierigere Umgebungen entwickelt. Das ermöglichte die Übertragung der in der Simulation gelernten neuronalen Netze auf die Roboterhand in der realen Welt.

„Mit ADR sind wir in der Lage, neuronale Netze in der Simulation zu trainieren, die den Rubik’s Cube an der echten Roboterhand lösen können. Das liegt daran, dass ADR das Netzwerk einer unendlichen Vielfalt an randomisierten Simulationen aussetzt. Es ist diese Exposition gegenüber Komplexität während des Trainings, die das Netzwerk auf den Transfer von der Simulation in die reale Welt vorbereitet, da es lernen muss, schnell zu erkennen und sich an die physikalische Welt anzupassen, mit der es konfrontiert wird.“