Als je ooit met een robot hebt gevoetbald, voelt het vertrouwd. De zon glinstert op je gezicht terwijl de geur van gras door de lucht zweeft. Je kijkt rond. Een vierpotige robot snelt op je af, vastberaden ontwijkend.
Hoewel de bot niet het vaardigheidsniveau van Lionel Messi weergeeft, is het in het wild een indrukwekkend dribbelsysteem. Onderzoekers van MIT’s Improbable Artificial Intelligence Laboratory, onderdeel van het Computer Science and Artificial Intelligence Laboratory (CSAIL), hebben een robotsysteem met poten ontwikkeld dat een voetbal kan dribbelen onder dezelfde omstandigheden als mensen. De robot gebruikte een combinatie van ingebouwde detectie en computergebruik om verschillende natuurlijke terreinen te doorkruisen, zoals zand, grind, modder en sneeuw, en zich aan te passen aan hun variërende impact op de beweging van de bal. Zoals elke oplettende atleet kan de “DribbleBot” na een val opstaan en de bal terughalen.
Het programmeren van robots om te voetballen is al geruime tijd een actief onderzoeksgebied. Het team wilde echter dat het automatisch zou leren hoe de benen te bewegen tijdens het dribbelen, zodat moeilijk te typen vaardigheden ontdekt kunnen worden in reactie op gevarieerd terrein zoals sneeuw, grind, zand, gras en bestrating. Voer in, simuleer.
Er is een robot, bal en terrein in de simulatie – de digitale tweeling van de natuurlijke wereld. U uploadt de bot en andere activa en stelt de fysieke parameters in, waarna de front-end-simulatie de dynamiek van daaruit overneemt. Vierduizend exemplaren van de bot worden parallel in realtime gesimuleerd, waardoor gegevensverzameling 4.000 keer sneller is dan met slechts één bot. Dat zijn veel gegevens.
De robot begint zonder te weten hoe hij de bal moet dribbelen – hij krijgt alleen een beloning als hij dat doet, of negatieve bekrachtiging als hij dribbelt. Daarom probeert hij vooral de opeenvolging van krachten te achterhalen die hij met zijn poten moet uitoefenen. zegt MIT-promovendus Gabe Margolis, die samen met Yandong Jie, een onderzoeksassistent bij het Improbable Film AI Lab, het werk leidde. “Als deze beloning eenmaal is ontworpen, is de trainingstijd voor de robot: in realtime duurt het twee dagen en in de simulator honderden dagen. Na verloop van tijd leert hij hoe hij de voetbal steeds beter kan manipuleren om de bal te manipuleren. gewenste snelheid.”
De robot kan ook door onbekend terrein navigeren en herstellen van een val dankzij een herstelconsole die het team in zijn systeem heeft ingebouwd. Met deze controller kan de robot na een val terugveren en terugkeren naar de dribbelcontroller om de bal te blijven achtervolgen, waardoor hij kan omgaan met wanorde en uit de hand gelopen terrein.
“Als je vandaag om je heen kijkt, zijn de meeste robots op wielen. Maar stel je voor dat er een rampscenario is, of een overstroming, of een aardbeving, en we willen dat de robots mensen helpen bij het zoek- en reddingsproces. We hebben de machines nodig om over het terrein”, zegt Pulkit Agrawal, MIT-professor en CSAIL’s hoofdonderzoeker en directeur van het Improbable Artificial Intelligence Laboratory, kunnen robots met wielen dat landschap van huidige robotsystemen niet doorkruisen.” “Ons doel bij het ontwikkelen van algoritmen voor tweebenige robots is om autonomie te bieden op uitdagende en complexe terreinen die momenteel buiten het bereik van robotsystemen liggen.”
De fascinatie voor vierpotige robots en voetballen zit diep – de Canadese professor Alan Mackworth noteerde het idee voor het eerst in een paper getiteld “On Seeing Robots”, gepresenteerd op VI-92, 1992. Later organiseerden Japanse onderzoekers een workshop over “Grand Challenges in Artificial Intelligentie, wat leidde tot discussies over het gebruik van voetbal om wetenschap en technologie te promoten. Het project werd een jaar later gelanceerd als de Robot J-League en al snel barstte de wereldwijde opwinding los. Kort daarna werd “RoboCup” geboren.
Vergeleken met alleen lopen, legt voetbaldribbelen meer beperkingen op aan de beweging van DribbleBot en het terrein dat hij kan doorkruisen. De robot moet zijn beweging aanpassen om krachten op de bal uit te oefenen om te dribbelen. De interactie tussen de bal en het landschap kan anders zijn dan de interactie tussen de robot en het landschap, zoals dik gras of trottoir. Een voetbal zal bijvoorbeeld een sleepkracht ervaren op het gras die niet aanwezig is op de stoep, en de helling zal een versnellingskracht uitoefenen, waardoor de gebruikelijke baan van de bal verandert. Het vermogen van een robot om ander terrein te doorkruisen wordt echter vaak minder beïnvloed door deze verschillen in dynamiek, zolang hij maar niet wegglijdt, dus een voetbaltest kan gevoelig zijn voor verschillen in terrein die niet alleen door beweging worden beïnvloed.
“De vorige methoden vereenvoudigen het dribbelprobleem, waarbij wordt uitgegaan van een vlakke, stevige ondergrond. De beweging is ook ontworpen om stabieler te zijn; de robot probeert niet tegelijkertijd te rennen en de bal te manipuleren”, zegt Ji. “Hier komt de moeilijkere dynamiek in het spel met het besturingsprobleem. We hebben dit aangepakt door recente ontwikkelingen die externe beweging mogelijk maken beter uit te breiden naar deze complexe taak die aspecten van beweging en bekwame manipulatie combineert.”
Aan de hardwarekant heeft de robot een reeks sensoren waarmee hij de omgeving kan waarnemen, waardoor hij kan voelen waar hij is, zijn locatie kan “begrijpen” en een deel van zijn omgeving kan “zien”. Ze heeft een set actuatoren waarmee ze krachten kan uitoefenen en zichzelf en objecten kan verplaatsen. Tussen de sensoren en de actuatoren zit de computer, of ‘brein’, die belast is met het omzetten van de sensorgegevens in acties, die via de actuatoren worden toegepast. Wanneer de robot op sneeuw rijdt, ziet hij de sneeuw niet, maar voelt hij hem door de motorsensoren. Maar voetbal is een complexere handeling dan lopen – dus maakte het team gebruik van camera’s op het hoofd en lichaam van de robot om een nieuwe zintuiglijke manier van kijken en een nieuwe motorische vaardigheid te ontwikkelen. En dan – we ontwijken.
“Onze robot kan op hol slaan omdat hij al zijn sensoren en camera’s en berekeningen aan boord heeft”, zegt Margolis. “En dat vereiste enige innovatie om de hele controller geschikt te maken voor deze ingebouwde computer.” “Dit is een gebied waar leren helpt, omdat we een lichtgewicht neuraal netwerk kunnen runnen en het kunnen trainen om de luidruchtige sensorgegevens te verwerken die een bewegende robot opmerkt. Dit staat in schril contrast met de meeste robots van tegenwoordig: een robotarm wordt meestal op een stabiele basis en zit op een werkbank met een A-supercomputer er direct op aangesloten. Noch de computer, noch de sensoren zitten in de robotarm! Daarom is alles zwaar en moeilijk te verplaatsen.’
Er is nog een lange weg te gaan om deze robots net zo wendbaar te maken als hun tegenhangers in de natuur, en sommige terreinen vormden een uitdaging voor DribbleBot. Momenteel is de controller niet getraind in gesimuleerde omgevingen met hellingen of trappen. De robot neemt de geometrie van het terrein niet waar; Het waardeert alleen materiële contacteigenschappen, zoals wrijving. Als er bijvoorbeeld een trede hoger is, komt de robot vast te zitten – hij zal de bal niet boven de trede kunnen tillen, een gebied dat het team in de toekomst wil verkennen. De onderzoekers zijn ook enthousiast om de lessen die tijdens de ontwikkeling van de DribbleBot zijn geleerd, toe te passen op andere taken waarbij gezamenlijke beweging en objectmanipulatie betrokken zijn, waarbij verschillende objecten snel van de ene plaats naar de andere worden verplaatst met behulp van de benen of armen.
Het onderzoek wordt ondersteund door het DARPA Machine Common Sense Program, het MIT-IBM Watson AI Lab, het National Science Foundation Institute for Artificial Intelligence and Fundamental Interactions, het US Air Force Research Laboratory en de US Air Force Artificial Intelligence Accelerator. De paper zal worden gepresenteerd op de IEEE International Conference on Robotics and Automation (ICRA) in 2023.