Nádej pre ľudí? Vedci objavili oblasti, kde stroje ľuďom nestačia

V spoločnosti sa téme budúcej úlohy umelej inteligencie v našich životoch venuje čoraz viac priestoru. Aj v blogoch na mocnedata.sk som ponúkol pohľad na svetlejšiu aj tu nebezpečnejšiu stránku tohto problému. V ostatnom období sa objavili opäť nové pohľady expertov na túto tému, ktoré znejú povzbudzujúco. Zostanú teda ľudia „pánom tvorstva“ ?

V špeciálnom Decembrovom čísle WIRED magazínu z roka 2018 sa objavil séria zaujímavých článkov. Vo všeobecnosti tento magazín je známy pozitívnym postojom k inováciám, snaží sa v nových veciach vidieť primárne to dobré. O to viac ma zaujala skupina článkov na tému toho, ako umelá inteligencia narazila na oblasti, kde napriek výraznej výpočtovej sile, nedokáže konkurovať ľudským schopnostiam. V čom teda ľudské pokolenie má navrch? A bude naša výhoda trvale udržateľná alebo je len otázka času, kedy stroje prevezmú aj v týchto oblastiach žezlo? Téme bolo celkom venovaných 22 strán daného vydania, pokúsim sa však hutne zosumarizovať pre vás hlavné princípy „ľudskej nádeje“ :

(Ešte než sa pustíme do skúmanie týchto oblastí jedna dôležitá poznámka: Ak má Umelá Inteligencia fungovať univerzálne pre akúkoľvek situáciu, nemôže sa spoliehať na pevne zadefinované pravidlá. Skutočná AI teda potrebuje nájsť pre všetko, čo my ako ľudia vieme, spôsob ako sa to naučiť sama, bez inštrukcií od ľudí. A to je práve jadro problému pre nasledovné oblasti.)

Pochopenie základných princípov (Common sense intelligence)

Čo sa stane s loptou, keď ju vyhodím do vzduchu? Odpoveď, že spadne opäť na zem, by zvládol zrejme už aj predškolák. Umelá inteligencia však nemá koncept gravitácie ako poznať, niekto by jej ho musel vysvetliť. Možno vám napadne, že to nie je tak ťažké (veď rovnice o páde telies sa preberajú už na základnej škole). Skúsim však váš optimizmus pribrzdiť ďalším príkladom: Čo sa stane, keď vyhodím do vzduchu (héliový) balón? Alebo: Čo sa stane, keď vyhodím do vzduchu (živú) holubicu? Umelá inteligencia by sa začudovala, prečo zrazu gravitácia už nie je vhodný koncept na správnu odpoveď. Tomuto okruhu schopností sa hovorí common sense inteligence alebo aj „sedliacky rozum„. Väčšina z nás má tieto zručnosti prirodzene odvodené od skúseností bežného života alebo poznanie princípov (aj keď ste sami nikdy živého vtáka do vzduchu nevyhodili, viete si predstaviť, čo by sa dialo). Stroje v nich hlboko tápajú.

Okrem všeobecných pravidiel prírody (ktoré by sa dali aspoň teoreticky strojom „naprogramovať“), existujú oblasti Common sense inteligencie, ktoré sa dajú získať len z interakcie s ľuďmi. Ak by ste sa niekoho v domácnosti spýtali „Máme ešte jogurty?“, zrejme by sa šiel pozrieť do chladničky (alebo komory). Umelá inteligencia by však nevedela ako sa k tejto otázke postaviť. Aby stroje vedeli, že zásoba jogurtov sa nachádza niekde inde ako zásoba klincov, či toaletného papiera, museli by s nami žiť v domácnostiach. Do tejto skupiny schopnosti spadajú aj základné psychologické interakcie medzi ľuďmi. Umelá inteligencia by sa napríklad musela naučiť, že ak do niekoho vrazíte na ulici, povedie to k zvýšenej agresivite na strane toho, do koho ste vrazili. (pevne verím, že by sme nechceli, aby sa to stroje učili z vlastných skúseností)

Problém vzájomných vzťahov objektov

Asi nám to nepríde ani na um, lebo to pokladáme za samozrejme. Avšak jednou z vecí ktoré mi ľudia robíme oveľa efektívnejšie je posudzovanie vzájomných súvislostí objektov. Napríklad nik nám nemusel povedať, že dom je väčší ako človek. Preto vieme posúdiť, že človek sa zmestí do domu, ale dom sa nezmestí do človeka. Ak si myslíte, že toto by predsa zvládla aj umelá inteligencia (keby sme jej povedali rozmery jednotlivých objektov), tak vám skúsim uviesť ešte niekoľko iných príkladov. Lietadlo má oveľa väčšie rozmery ako rodinný dom (až na pár výnimiek), ale nik z ľudí nezaváha na otázku, či dom vmestí do dopravného lietadla. Ako sa zmení Vaša odpoveď, keď poviem, že je to nafukovací dom? Rovnako nik z ľudí nepochybuje, že človek za vmestí do domu, ale odpoveď by bola rovnaká aj keby som povedal, že dom je drevený. Ako by však dopadla odpoveď, keby bol dom hračkársky? Umelá inteligencia nedokáže zatiaľ uchopiť tieto súvislosti a v tejto dobe ani neexistuje efektívna metóda, ako ju to naučiť.

Problém dlhého učenia

Aj pre tie oblasti, kde už dnes stroje dokážu poraziť človeka, zväčša býva problém v tom, že na získanie svojich schopností potrebujú veľmi vysoký počet anotovaných príkladov (viac k ich učeniu nájdete tu). Viete si predstaviť, že by ľudské dieťa muselo vidieť 10 tisíce, či státisíce rôznych mačiek, kým by bolo schopné povedať, že na obrázku je mačka? Nuž, pre neurónové siete umelej inteligencie je to momentálne nevyhnutnosť.  Trénovanie umelej inteligencie tak neraz trvá (na ľudské pomery) neprimerane dlho. Veľmi často sa tak musia zhromažďovať (alebo dokonca umelo vytvárať) neprirodzene veľké sady informácií, na učenie takýchto neurónových sietí. Pre niektoré javy dokonca nemusí ani existovať dostatočný počet opakovaní danej veci, aby sa umelá inteligencia dokázala vytrénovať. (čo s tým veda robí o pár odsekov nižšie)

CAPTCHA_imagesSkvelou ilustráciou tohto princípu je CAPTCHA. Obrazce, ktoré sú používané na potvrdenie, že webový obsah si prezerá skutočný človek a nie stroj. Bez akéhokoľvek tréningu, človek dokáže odpovedať správne hneď na prvú CAPTCHA, ktorú vidí vo svojom živote. Experti, ktorí sa pokúšali natrénovať stroj, aby dokázal prelomiť CAPTCHA kód, potrebovali dodať umelej neurónovej sieti 2.3 milióna obrázkov so správnymi odpoveďami. Zaujímavé pritom je, že keď okrem samotných príkladov dodali strojom aj niekoľko jednoduchých, ľuďmi formulovaných princípov, ako lúštiť CAPTCHA, počet obrázkov na jej natrénovanie sa znížil iba na 260.

To, že ťarbavosť strojov v učení dokážu výrazne urýchliť čo i len elementárne rady od človeka, je v skutočnosti oveľa viac ako dvihnutie nášho sebavedomia. Tento princíp má za následok, že biznisové aplikácie umelej inteligencie, kde je dôležitejšie dosiahnuť výsledok za krátky čas sa budú ešte niekoľko rokov primárne stavať na kombinácií vstupov samostatne odvodených priamo umelou inteligenciou a kritérií definovaných luďmi. Ak teda budete mať vzdelanie na navrhovanie premenných, ktorými by sa modely umelej inteligencie mali zaoberať, aby sa rýchlejšie dopracovali k výsledku, sú vaše šance na prežitie blížiacej sa vlny robotizácie oveľa priaznivejšie.

Pochopenie nových objektov

Okrem veľkého hladu po informáciách pri učení sa, vedci zdokumentovali ešte jeden podstatný problém umelej inteligencie. Aj keď sa neučí rozpoznávať určité objekty, nevie si vytvoriť z nich analógiu. Ak napríklad aj naučíte neurónovú sieť veľmi dobre rozpoznávať automobily na fotkách, ak jej ukážete fotku traktoru zapadnutého v blate (alebo snehu) tak, že nie je vidno kolesá traktoru, bude sa trápiť s rozpoznaním daného objektu. Ľudia totiž dokážu na prvý pohľad využiť okolnosti na fotografii na to, aby potvrdili alebo vyvrátili domnienku, o aký objekt ide. Pre umelú neurónovú sieť pridanie prostredia naopak znižuje istotu, s akou sa dokáže o objekte vyjadriť, lebo nikdy pred tým traktor zapadnutý v blate nevidela. Rovnako ak malému dieťaťu ukážete prvý krát v živote pásový báger, bude vám vedieť povedať, že je to nejaká forma vozidla. Podľa zrealizovaných experimentov citovaných v článku, umelá inteligencia bude za ním hľadať skôr strážnu vežu s katapultom alebo nejakú formu potrubia.

Absencia kontextu

V neposlednom rade, stroje trpia doposiaľ ešte jednou podstatnou slabinou. Pre ich rozhodovanie absentuje vnímanie kontextu, ktorý je mimo samotnú úlohu, ktorú majú riešiť. Autori článku tento jav ilustrujú na príklade: Šachový automat bude naďalej rozmýšľať nad čo najlepším ťahom v aktuálne bežiacej partii, aj keď v miestnosti, v ktorej sa partia odohráva, vypukne požiar. Dokonca bude hrať do momentu, kým sa jeho mikroprocesory v danom požiari neroztopia. Je to preto, že jeho algoritmus na hru šachu samozrejme s takýmito okolnosťami vôbec nepočíta. Popísaný príklad môže znieť trochu priatiahnuto za vlasy, ale malo by nás primäť si uvedomiť, že pokiaľ my ľudia nenastavíme okrem hlavného cieľa (vyhrať partiu) strojom aj vedľajšie ciele (napr. prežiť do konca partie), ich ľahostajné postoje k veciam, ktoré pokladáme my ľudia za samozrejmosť (až nevyhnutnosť), nás môžu zaskočiť, či dokonca nechať na holičkách. Preto, ak by ste robota, ktorý vie variť poslali do reštaurácie, nezostal by sedieť čakať, kým mu čašník objedná a prinesie jedlo, ale vrhol by sa rovno do kuchyne, aby si ho sám uvaril. Náš súčasný proces stolovanie by totiž pokladal za časovo a informačne neefektívny. Zo súčasných autorov tému širšieho kontextu a šírky motivácií, ktoré musíme umelej inteligencii dávať, asi najprecíznejšie rozobral Nick Bostrom v knihe Superintelligence (ktorej recenziu si môžete prečítať tu).

Ako teda na to?

Napriek tomu, že vedci dnes nevedia prelúskať vyššie uvedené oblasti, neskladajú úplne zbrane. S obmedzeniami v učení umelej inteligencie bojujú najmä pomocou tzv. GAN sietí (Generative Adversial Network), kde sa vytvoria dve neurónové siete a jedna z nich slúži ako učiteľ pre tú druhú. Vedci sa tak zbavia potreby vymýšľať a dokumentovať milióny príkladov na trénovanie siete a odovzdajú túto povinnosť inej neurónovej sieti. Keďže aj AI učiteľ aj AI žiak dokážu zhromaždiť za sebou obrovské množstvo výpočtovej sily, učenie prebieha násobne rýchlejšie (neraz desiatky prípadov za sekundu), čo do istej miery kompenzuje hendikep popísaný v časti o príliš pomalom učení. Aby sme však boli korektní, aj samotné naprogramovanie „učiteľa“ a spôsobu ako budú medzi sebou učiteľ a žiak digitálne komunikovať si vyžiada určité úsilie, teda celkový čas učenia zatiaľ stále predstavuje signifikantné obmedzenie praktického použitia niektorých Ai prístupov.

Na zabudovanie common-sense inteligencie zase experti prišli so zaujímavým riešením. Na miesto toho, aby programátori prácne, postupne natvrdo zapracovávali do programového kódu umelej inteligencie všetky pravidlá a spoločenské konvencie, nechajú neurónovú sieť si čítať príbehy. Aplikovaním literatúry možno vysvetliť zákonistosti javov, ktoré nie je vhodné (ako reagovať na smrť človeka) alebo je príliš nákladné zosimulovať pre učenie sa neurónových sietí (napr. pád lavíny do doliny). Zakiaľ literárnych diel (alebo jednoduchých textov) o páde lavíny je možné v priebehu niekoľkých dní poskytnúť umelej inteligencii aj desiatky príbehov takmer zadarmo, zosimulovať desiatky pádov lavín do toho istého údolia je projekt na niekoľko rokov s astronomickými nákladmi.

Rovnako absencia kontextu sa dnes už v sofistikovanejších systémoch rieši takzvanou lasso penalizáciou (alebo inou metódou regularizácie), ktorá dáva umelej inteligencii negatívne body za dosihanutie hlavného cieľa s negatívnymi vedľajšími dopadmi. Istým obmedzením v tomto ohľade však je, koľko rôznych scenárov vedľajších efektov riešenie zohľadní a ako sa bude rozhodovať medzi vzájomnými súvislosťami daných rizík.

Čo my?

Tým podstatným záverom by asi nemali byť prehnané nádeje. Áno, umelú inteligenciu stále v niektorých oblastiach strčí aj 8 ročné dieťa do vrecka. Na takmer všetky aktuálne nedostatky sa však už výskumné teamy snažia aplikovať prvé „záplaty“. Tempo odstraňovania slabín AI sa bude preto len zrýchľovať. Korektnejším záverom by preto zrejme bolo povedať, že dnešné slabiny umelej inteligencie hlavne:

a] spomaľujú tempo, akým bude technika nahrádzať ľudí v bežných životných činnostiach. Napriek tomu však možno očakávať, že prvé (nemanuálne) pracovné pozície preberú roboty už v horizonte 2-3 rokov. Ak ste profesionálny vodič alebo úradník, čo triedi dokumenty v podateľni, nemám pre vás žiadne ružové správy.

b] pre väčšinu biznis procesov však tvorba AI systémov bude vychádzať z expertného „popisu pravidiel“ doplneného o vlastné pozorovania strojov. Ak chcete teda zvýšiť svoje šance na trhu práce aj do budúcna, mali by ste sa naučiť základy databázového ukladania dát a tvorby dátových príznakov (features), ktoré popisujú procesy vašej práce.

Vsadiť môžete aj na modlitby alebo pozitívne myslenie. Len by som vám chcel potom doporúčiť si prečítať skvelú knihu Gordon R. Sullivans a Michael V. Harpera s názvom „Hope is not a method“ (Dúfanie nie je prístup k riešeniu). Aby ste vedeli, s čím všetkým v takom prípade počítať.