Pillanat Pszicho

Ambrózi Kata

Ambrózi Kata

A Google DeepMind evolúciója mennyivel gyorsabb az emberénél?

2017. február 28. - Ambrózi Kata

deep3.png

Úgy tűnik, a mesterséges intelligencia (artificial intelligence - AI) lesz a következő technológiai forradalom előfutára. Ha emberi beavatkozás nélkül képes lesz tanulni, gondolkodni, még tán érezni is, akkor minden, amit most ismerünk megváltozik egy éjszaka alatt.

Többek között Bill Gates és Stephen Hawking is meg vannak győződve az emberrel azonos szintű mesterséges intelligencia jövőbeni elterjedéséről. Gates szerint még sok időnk van addig, viszont itt az ideje, hogy elkezdjünk beszélni róla. 

Éppen ezért érdekes nyomon követni a ma létező mesterséges intelligenciák (AI) fejlődésében bekövetkező mérföldköveket. Egy ilyen mérföldkő volt tavaly májusban, amikor a Google DeepMind által fejlesztett AlphaGo 4:1-re verte a világ egyik legerősebb gójátékosát, Lee Sedolt. (Van, aki szerint ekkor született meg a Mesterséges Inteligencia. A gó volt az utolsó játék, ahol gép még nem győzte le az embert. Itt írtam már róla.)

Az még egyelőre kérdéses a Google számára is, hogy az AI milyen helyzetben választja az együttműködő és a versengő viselkedést, hogyan befolyásolja az AI stragégiáját a szűkös erőforrások problémája. 

Az első helyzetben (“Gathering”) a DeepMind két verziója találkozott egymással (Piros és Kék), akik azt a feladatot kapták, hogy gyűjtsenek "zöld almákat" egy adott térből. Viszont Piros és Kék is fel volt szerelve egy-egy lézerrel, ami segítségével a másikat lelőve blokkolni tudta bármikor. Így két lehetőségük volt: begyűjteni az összes almát, vagy hagyni egymást, hogy nagyjából azonos mennyiséget gyűjtsenek.  

Több ezerszer lefuttatták a szimulációt, és a Google azt találta, hogy a DeepMind nagyon békés és együttműködő volt azokban a helyzetekben, amikor sok alma volt. Viszont minél kevesebb alma volt elérhető, Piros és Kék annál inkább volt támadó és blokkolta a másikat.

Gathering gameplay. DeepMind via YouTube

A második helyzetben (“Wolfpack”) Piros és Kék feladata az volt, hogy vadásszanak egy "zsákmányra". Külön-külön is megpróbálhatták elkapni, de sokkal hatékonyabb volt számukra, ha együtt próbálkoztak (például a sarokbaszorítás könnyebb, ha többen vannak). 

Az AI gyorsan felismerte, hogy az együttműködés előnyösebb a versengésnél ebben a szituációban. 

Wolfpack gameplay. DeepMind via YouTube

A legérdekesebb az egészben, hogy a fenti esetekben a DeepMind viselkedése olyan természetesnek tűnik: tudja, hogy vadászatkor általában jobb együttműködni, de ha az erőforrások szűkösek, a versengés néha hasznosabb. Az állatok között az evolúció évmilliók alatt alakította ki, hogy milyen helyzetben érdemes együttműködni, és mikor jobb versengeni. Az emberi kultúrák hosszú évezredeken át finomhangolták az együttműködés és a versengés közötti egyensúlyt. A DeepMind-nak elég volt hozzá pár óra, hogy megtalálja a helyes stratégiát egy viszonylag egyszerű helyzetben.

Ha mást nem is, azt elmondhatjuk, hogy az AI képes volt a versengés és az együttműködés modellezésére egy összetett döntési helyzetben. Felmerül a kérdés, hogy bonyolultabb helyzetekben (közgazdasági, közlekedési modellek) vajon mennyi idő alatt fogja megtanulni a legjobb megoldást. 

Források: itt, itt, itt, itt, itt

A bejegyzés trackback címe:

https://ambrozikata.blog.hu/api/trackback/id/tr8812298241

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

süti beállítások módosítása