Nieuwe NVIDIA AI-agent gebaseerd op het GPT-4-model kan worden gebruikt om complexe robotvaardigheden te trainen

NVIDIA Research heeft vandaag aangekondigd dat het een nieuwe kunstmatige intelligentie-agent heeft ontwikkeld genaamd "Eureka", die wordt aangedreven door OpenAI's GPT-4 en robots autonoom complexe vaardigheden kan aanleren.

Bezoek de aankooppagina:

JD.com NVIDIA-serie productoverzicht

Het bedrijf zei in een blogpost dat Eureka, dat zijn eigen beloningsalgoritmen kan schrijven, de eerste is die een robothand traint om net als mensen snelle pen-draaivaardigheden uit te voeren. Eureka heeft de robot ook bijna 30 taken geleerd, zoals het openen van laden en kasten, het gooien en vangen van een bal en het bedienen van een schaar.

“Reinforcement learning heeft de afgelopen tien jaar indrukwekkende overwinningen geboekt, maar er blijven nog veel uitdagingen bestaan, zoals het ontwerpen van beloningen, wat een proces van vallen en opstaan blijft”, zegt Anima Anandkumar, senior directeur van onderzoek naar kunstmatige intelligentie bij NVIDIA en auteur van het Eureka-artikel, in een blogpost. "Eureka is een eerste stap in de ontwikkeling van nieuwe algoritmen die generatieve en versterkende leermethoden integreren om moeilijke taken op te lossen."

NVIDIA Research heeft ook de Eureka-algoritmebibliotheek voor kunstmatige intelligentie uitgebracht waarmee mensen experimenten kunnen uitvoeren met behulp van NVIDIA AIsaacGym, een referentietoepassing voor natuurkundige simulatie voor onderzoek naar versterkend leren. IsaacGym is gebouwd op NVIDIA Omniverse, een ontwikkelingsplatform voor het bouwen van 3D-tools en applicaties gebaseerd op het OpenUSD-framework.

De rage voor kunstmatige-intelligentieagenten is al maanden aan de gang, inclusief de opkomst van autonome kunstmatige-intelligentieagenten zoals Auto-GPT, BabyAGI en AgentGPT in april van dit jaar.

Het huidige werk van NVIDIA Research bouwt voort op eerder werk, waaronder het meest recente Voyager, een kunstmatige intelligentie-agent gebouwd met behulp van GPT-4 en die Minecraft autonoom kan spelen. Deze week publiceerde de New York Times een artikel over het veranderen van chatbots in online agenten. Jeff Clune, hoogleraar computerwetenschappen aan de Universiteit van British Columbia en voormalig onderzoeker bij OpenAI, zei: "Dit is een enorme zakelijke kans met het potentieel om biljoenen dollars aan inkomsten te genereren. Dit heeft enorme voordelen en een enorme impact op de samenleving."

In een nieuw onderzoeksartikel met de titel 'Eureka: beloningsontwerp op menselijk niveau door het coderen van grote taalmodellen', zeggen de auteurs: 'Eureka maakt gebruik van de buitengewone mogelijkheden voor het genereren van nulpunten, het schrijven van codes en het verbeteren van de context van ultramoderne LLM's zoals GPT-4 om de beloningscode te ontwikkelen.'

De resulterende beloningen kunnen worden gebruikt om complexe vaardigheden te verwerven door middel van versterkend leren. "Bij gebrek aan taakspecifieke aanwijzingen of vooraf gedefinieerde beloningssjablonen presteren de door Eureka gegenereerde beloningsfuncties beter dan door mensen ontworpen expertbeloningen. In een reeks van 29 open source RL-omgevingen met 10 verschillende robotmorfologieën presteerde Eureka beter dan menselijke experts in 83% van de taken, met een gemiddelde genormaliseerde verbetering van 52%."

"Eureka is een unieke combinatie van grote taalmodellen en NVIDIA's GPU-versnelde simulatietechnologie", zegt Jim Fan, senior onderzoekswetenschapper bij NVIDIA en medewerker aan het project, in een blogpost. "Wij geloven dat Eureka behendige robotbesturing mogelijk zal maken en artiesten een nieuwe manier zal bieden om fysiek realistische animaties te maken."