Nyelvet találnak ki maguknak a botok

2017. március 26. 09:30

A gépi tanulás a jelenkori számítástudomány egyik legvirágzóbb szakterülete. Nincs nélküle mesterséges intelligencia, és a nyelvtechnológiákhoz is nélkülözhetetlen. Nagy adatsorokban való bányászást mellőző, különleges tanulásalapú megoldást kínál Igor Mordatch, az OpenAI vendégkutatója: ágensei nem emberi saját nyelvet teremtenek. Egyelőre igen egyszerű a kommunikációjuk, amelyben nem-nyelvi elemeket is használnak. A kutató bizakodnak, hogy munkájuk komplex rendszerré fejlődik.

A Google DeepMind Laborja és az Elon Musk és társai által alapított san franciscói OpenAI Gym, valamint a Gymhez kapcsolódó Universe jelenleg a világ két legismertebb, valószínűleg legfejlettebb nyílt forrású mesterséges intelligencia tanulóplatformja.

Digitális játszótér

Az OpenAI digitális játszóterének – algoritmusok, ágensek és botok főként játékokon gyakorolnak – célja egyes MI algoritmustípusoknál a teljesítményértékelés (benchmarking) szabványává válni, minden eredmény nyílt forrásúvá tétele, megosztása. A legjobban teljesítők rangsorolása helyett a hasonló feladatok elvégzésére is alkalmas általánosító algoritmusokat részesítik előnyben, és ez koncepcióváltást jelent napjaink egyre szűkebb területekre fókuszáló kutatási trendjeihez képest.

A platform könnyebbé teszi a próba-hiba alapú, kockázattal járó, jutalommal illetve büntetéssel értékelő megerősítéses tanulást. Ugyanez a gépitanulás-módszer alapozta meg a goban világraszóló sikert elért AlphaGo (DeepMind) működését is. Az ágensek kemény teszteken mennek keresztül, gondosan rögzítik, mi működik és mi nem. Jó teljesítményért jutalmat kapnak, és ha valamilyen egyedi tevékenység különösen segíti őket, megjegyzik az adott tevékenységet.

Az MI idővel a tanulástranszfert is gyakorolhatja: az ágens az egyik alkalmazásban tanultakat egy másikban hasznosítja. Ez az elképzelés szintén általánosabb mesterségesintelligencia-megközelítésre utal.

Leegyszerűsítve: az OpenAI kutatói komoly gépi tanuláson alapuló, több területen alkalmazható, a jelenlegieknél hatékonyabb MI-ket akarnak létrehozni. Persze mások is, de módszereik és a nyílt forrás egyedivé teszik őket.

Nyelvtechnológiák dzsungelében

Egyes mesterséges intelligenciák, például az ukrán születésű kanadai Igor Mordatch OpenAI-ban multi-ágens rendszerként cseperedő botjai beszélni is tanulnak. Nemcsak emberekkel, hanem egymás között is, ami szintén koncepcióváltást vetít előre: a mai kutatások hatékony főcsapása az emberi nyelv rengeteg adat feldolgozásán, mintafelismerésen és mély ideghálókon alapuló utánzása, és nem új nyelv teremtése.

A nyelvmegértés már nehezebb terep, mint az utánzás. Utánoznak a reneszánszukat élő chatbotok is, a Stanford együttműködő ágensei, valamint az MIT Számítástudomány és Mesterséges Intelligencia Laborjának (CSAIL) egyik fejlesztése viszont a nyelvmegértésre fókuszál: felvett beszédet képekhez kapcsoló rendszerrel jutnának el a teljesen automatizált beszédfelismeréshez. A két különböző ideghálót használó rendszer tematikusan kapcsolódó képek és az e képeket leíró szövegek (amelyeket egy nagy audiofelvétel-gyűjtemény tartalmaz), viszonyát elemzi. Az akusztikai jegyek képekhez társításából – felügyelet nélkül – tanulja meg, hogy milyen hangzó elem milyen gépelt szónak felelhet meg. Lényegében itt is az a cél, hogy úgy tanulja meg a nyelvet, ahogy az ember, de ne csak tanulja, hanem értse is.

Innen próbálnak még kísérletibb, ismeretlenebb terepek felé mozdulni többen, köztük az egyébként nem nyelvész, hanem robotikus Mordatch is.

Nyelvet teremtenek az ágensek

A Mordatch általa épített egyszerű kétdimenziós virtuális világban zöld, piros és kék körökkel megjelenített ágensek kényszerből hozzák létre saját nyelvüket. Feladatokat kell végrehajtaniuk, együtt kell működniük hozzá, közben jutalmat és büntetést kapnak. Segítségnyújtáskor tanulják meg a nyelvet, hogy elmondhassák egymásnak, hogyan jutnak el gyorsabban valahova. Véletlenszerű karaktereket társítanak a miniatűr világban való tájékozódáskor megtanult egyszerű fogalmakhoz, egymáshoz, helyekhez, tárgyakhoz és cselekvésekhez.

A fentebbi képen a piros ágens a piros ponthoz kapcsolódó szót mond (t=0), majd, hogy „menj valahova” (t=1), ezt követően pedig, hogy „zöld ágens” (t=2). A zöld ágens meghallja az utasítást, és azonnal a piros ponthoz megy (t=3).

Mordatch és munkatársai a legegyszerűbb dolgokkal kezdték, onnan kívánnak eljutni komplexebb megoldásokig, például a botok nyelvének emberi nyelvre történő fordításáig. Már fejlesztenek is hozzá fordító botot. Szerintük így jobban érthető a nyelv. Megkérdőjelezik a vezető cégek módszerét, beszélgetési minták statisztikai azonosítását, mert úgy gondolják, hogy nagymennyiségű adat elemzésén kívül létezik egyszerűbb, járhatóbb út.

„Egy ágens használat közben, a nem-verbális kommunikációval és fizikai cselekvésekkel együtt azért érti meg a nyelvet, hogy környezetében megvalósítsa céljait” – írja Mordatch.

Szerinte az emberi nyelv szintén így, kényszerből jött létre az őskorban. Botjai ezért tanulnak más kommunikációs formákat is.

Mordatch rendszerének részei ugyanúgy maguktól és megerősítéses módszerrel tanulnak, mint a Universe szoftveralkalmazásokat elsajátító botjai.

A robotikus nem állítja hogy az övéké az üdvösséghez vezető egyetlen út. Alighanem igaza van, mert a megoldást valószínűleg a különféle technikák valamilyen hibridje hozza majd el.

A bejegyzés trackback címe: http://digit.mandiner.hu/trackback/29421