Deepminds AI navigerar otränad genom simulerade städer

Deepminds AI lyckas med konsten navigera på en för systemet okänd plats och visar återigen prov på sin vassa kapacitet.

För varje år som går investeras allt mer resurser i att utveckla avancerade och sofistikerade artificiella intelligenser. Den sannolikt mest välkända AI:n lär vara den som utvecklats av Deepmind. Företaget förvärvades år 2014 av Google och sedan dess har Deepminds olika AI-system genererat otaliga rubriker, bland annat genom dess framgångar mot mänskliga mästare i både analoga och digitala spel.

Kapaciteten i Deepminds AI går även utanför dessa områden och i en rapport (PDF) beskriver forskarna bakom hur Deepminds AI har lärt sig att navigera i okända miljöer. Den artificiella intelligensen tillgodoses inför varje virtuell strapats endast med dess nuvarande position, en bild på slutmålet och en förmåga att röra sig åt vänster, höger eller rakt fram.

Screenshot20-202020-06-16T132409.089_photos_v2_x2.png

I vanliga fall brukar artificiella intelligenser falla platt när den ställs inför utmaningen att navigera i nya miljöer, och hittills har det i regel krävts att algoritmerna får ta del av viss data för att vägleda dem i utforskandet av nya och annars okända miljöer. Det som gör Deepminds AI unik är dess precision när det kommer till att hitta i områden som den tidigare inte har någon kunskap om.

Den presterar i snitt 2–3 gånger bättre än övriga artificiella intelligenser som ställs inför samma uppgift. Framgången tillskrivs en teknik företaget väljer att kalla EPN (eng. episodic planning network). Med EPN-systemet kan AI:n se "minnen" från tidigare händelser och använda dessa för att planera återstoden av uppgiften.

Tidigare EPN-liknande system har haft god kapacitet för att utforska enligt denna princip, men Deepminds lösning är enligt företaget den första som i någon signifikant utsträckning kan planera för kommande handlingar. Lösningen gör det möjligt för Deepminds AI att hitta gemensamma nämnare i ting som kan tyckas vara utan struktur eller vara godtyckligt sammanfogade. Lösningen bygger på tidigare projekt på området inom Deepmind.

Ett av dessa är Streetlearn, vilket kombinerar data och bilder från Google Maps med modeller för hur miljöer kan utforskas utan en karta. Det sistnämnda ligger till grund för hur AI-systemet sedan kan fatta beslut baserat på vad den stöter på, och har stött på tidigare. Det andra projektet är Dreamer (PDF), som tillämpar en modell där algoritmer skapar en bild av en omvärld och agerar efter beslut som fattas efter en uppskattning av vad resultatet kan bli.

Högkonceptuellt kan Dreamer liknas vid ett system som "fantiserar" om resultatet av sina handlingar, och agerar därefter. Med hjälp av EPN-systemet och de inblandade forskningsprojekten lyckas Deepminds artificiella intelligens sammanställa en värdering grundad på data insamlad under dess resa och använda det som grund för att hitta det slutgiltiga målet.

Läser mer om Deepmind:

I butiken: Bag of Gaben

En stenhård tygpåse för sanna spelfantaster, som helt och fullt är värdig att transportera guldklimparna i spelsamlingen till valfri destination.

Köp här!