Aj som sa preľakol trochu … [strojmi k mentálnej obezite]

Pár týždňov dozadu som sa trochu spotil. Narazil som na článok analytického guru, Toma Davenporta (okrem iného autora skvelých kníh Competing on Analytics alebo BigData At Work ), v ktorom rozoberá, ako sa na prestížnej zahraničnej analytickej konfrencii viacerí poprední odberatelia analytického software priznali, že spoliehajú na to, že budú môcť nahradiť v rámci digitalizácie pracovných miest aj analytikov. Po dočítaní daného článku som sa trochu preľakol …

O tejto téme totiž už rozmýšľam asi 2 roky. Každému, kto čítal aspoň jeden IT odborný časopis za posledné 2-3 roky, je zrejmé, že prežívame ďalšiu (priemyselnú) revolúciu. Po vynáleze pary, následne elektriny a spaľovacích motorov, sme na prelome doby digitálnej. Informačné toky prepojili pred tým izolované ostrovy výroby (a aj prepravy), teda my ľudia máme opäť menej povinností. Či vlastne príležitostí?

Výsledok vyhľadávania obrázkov pre dopyt industrial revolution

Aké joby prežijú?

Najprv sme odovzdali strojom lopotu manuálnej práce, ale nechali sme si na pleciach aspoň povinnosť zostaviť tie stroje, čo za nás budú robiť. Neskôr sme rozvinuli strojárstvo a tak stroje mohli vyrábať iné stroje. My, ľudia, sme sa opäť stiahli a zostali sme „len“ riadiť (výrobu strojov, čo robí) stroje. S priemyslom 4.0 prichádza tzv. autonómna výroba, kde stroje dokážu riadiť iné stroje, ktoré vyrábajú stroje. Vyzerá to trochu nenápadne, ale tým sa v podstate kruh výroby uzavrel. Lebo ak stroje môžu plne riadiť výrobu iných strojov, tak si dokážu „rozkázať“ výrobu aj svojich vlastných súčastiek (prípadne vylepšení). V dnešnej digitálnej dobe, keď stroje môžu ovládať aj autonómne autá na prepravu iných strojov, tak vôbec nie je sci-fi zreťaziť plnohodnotnú autonómnu výrobu fabriky, ktorá nielen vyrabá koncový produkt, ale aj svoju vlastnú údržbu.

Keď som sa snažil extrapolovať túto situáciu o pár rokov dopredu, začala ma trápiť otázka, aké ľudské povolania (joby) vlastne tento trend prežijú? Ak príjmeme premisu, že akýkoľvek výrobný a prepravný proces môže riadiť automat, nezostáva toho až tak veľa. Zopár inžinierskych jobov, ktoré budú kresliť špecifikácie pre nové formy strojov, ITčkárske joby (ktoré budú programovať algoritmy pre stroje), analytické joby (ktoré budú vyhodnocovať dáta zo strojov) a profesie, ktoré sa venujú životu a rozvoju človeka (kultúra, lekári, učitelia, …). Tep a krvný tlak sa mi opäť vrátili k mediánovým hodnotám, veď môj job už niekoľko rokov spadá do jednej z tých kategórii, ktoré prežijú. Teda až kým som si neprečítal daný článok od T. Davenporta.

Umelo umelá inteligencia

Uvedený článok ma donútil sa nad témou nahradeniu ľudskej práce umelou inteligenciou zamyslieť ešte trochu hlbšie. Začal som detailnejšie analyzovať, ktoré časti (dnešnej) Analytickej práce je možné do akej miery prenechať strojom. Tu je krátky sumár môjho skúmania:

Očistenie a príprava dát. Prvým krokom v analytickej práci je očistenie dát a ich príprava na ďalšie analyzovanie. Detailnejšie skúmanie tejto oblasti ma prieviedlo k presvedčeniu (a rovnomennému blogu), že odvetvie Data cleaning zomiera. Nástroje ako Ataccamma a mnoho iných totiž dokážu plne vyčitiť dáta. Rovnako takmer každá štandardná databáza so sebou nesie možnosť tvoriť data procedures alebo dokonca analytical pakcages, ktoré umožňujú aj dynamicky nastaviť formu a povahu dát, ktoré majú byť analyzované.

Vytvoriť dostatok parametrov. Hneď ako sú data očistené sa analytik vrhne do tvorby parametrov, ktoré majú slúžiť ako prediktory. Na túto oblasť som spoliehal najviac ako na hrádzu proti útoku strojov. Stroj predsa nemôže vedieť, čo je predmetom modelovania a teda ťažko bude vyberať vhodné parametre. Nedalo mi to však a začal som hlbšie študovať Genetické algoritmy. Táto téma je tak fascinujúca, že jej už čoskoro zasvätím samostatný blog, tak v tomto momente poviem len toľko, že pokročilejšie genetické heuristiky dokážu jednoduché parametre vystaviť testu a z neho pochopiť, ako modifikovať jednoduchšie príznaky do komplikovanejších. Výsledkom je, že počítač začne s jednoduchými parametrami a postupne vypreparuje poriadne sofistikované s oveľa väčšou informačnou hodnotou. Taký zrýchlený Darwinizmus.

Zostaviť prediktívny model nad históriou prediktorov. Ak v predchádzajúcom bode som mal pochybnosti, v časti tvorby prediktívnych modelov v tom mám jasno. Machine learning je dnes mainstreamová záležitosť a ak podhodíte analytickým službám dáta, dokážu už samostatne vytvoriť model na predikciu daného javu. Po príklady nemusíme chodiť ani ďaleko, autonómnej tvorbe modelov sa venujú aj u nás v SR napríklad chlapci z Exponea alebo z Black Swan Rational. Táto časť už dnes reálne nie je (plne) v rukách ľudí. Do budúcna to bude už len horšie.

Testovanie modelu a jeho verifikácia. Každý analytik, ktorý tvoril nejaký komerčne užitočný prediktívny model vie, že verifikáciu modelu väčšinu analytikov odovzdáva nástrojom ako ROC selector alebo CCC overenie. Navyše, ak ste niekedy pracovali s Ensemble modelmi, viete, že stroj už dnes vie zobrať alternatívne vyvinuté modely a vybrať z každého z nich to najlepšie do supermodelu, ktorý porazí v súboji každý z pôvodných modelov. 

Pretaviť výsledok do ľudsky zrozumiteľných záverov. Takmer všetky hlavné analytické spoločnosti spoliehajú na to, že Vizualizačné softwary na seba zoberú rolu zobrazenia výsledku do ľudsky zrozumiteľnej podoby. Každý rok však narazím na Infografiku alebo formu grafiky, ktorá bola prekvapivo zrozumiteľná. Kým stroje nebudú točiť filmy, nad ktorými budeme hýkať, ľudia budú mať navrch. Problém však vidím v niečom inom: Skeptici prediktívnych modelov zatlačili na analytikov s argumentom, že prediktívny model je black box, nevieme prečo sa tak rozhodol a preto ho nevieme skontrolovať. Odpoveďou analytikov bol tzv. Explanatory assessment, ďalšia vlna AI, ktorá transformuje prediktívne pravidlá do zrozumiteľných vysvetlení. Na tento trend tlačia hlavne regulátori v Zdravotníctve alebo bankovom Risk manažmente, keď požadujú, aby modely nielen predikovali správne rozhodnutie, ale pridali aj vysvetlenie, prečo sa tak „rozhodli“. Ak sa touto cestou vyberieme hlbšie, za niektorou z ďalších zákrut už bude ľudský element zbytočný. AI bude poskytovať aj vysvetlenie prečo koná tak, ako koná.

Ako náš krátky exkurz ukázal, v 3,5 z 5 nutných krokov analytickej práce už dnes stroje dokážu držať krok s človekom a situácia sa rapídne zhoršuje. Davenportová provokačná otázka sa teda javí celkom na mieste. Na nemalú časť analytických a dátových prác proste nebude treba človeka. Opäť sa ma zmocnila analytická úzkosť. Dožijem ešte dôchodku v tejto brandži alebo pôjdem rozbíjať stroje, tak ako to robili húfy robotníkov pri prvej vlne industrializácie?

Prečo by sa to (ne)malo diať?

To, že existuje teoretická možnosť nahradenia ľudí, ešte nepredurčuje, že sa tak stane. Veď počítač nás už porazil v šachu aj v Go, ale ľudia sa napriek tomu neprestali hrať ani jednu z týchto hier. Sú teda nejaké skutočné faktory, ktoré by mali akcelerovať nahradenie ľudí strojmi aj v analytickej oblasti? Myslím si, že dnes existujú 2 takéto dôvody:

Množiace sa dáta. Určite ste počuli, že produkcia dát rastie exponenciálne. Ak by sme aj našli metódy na ich efektívnejšie analyzovanie, zníženie nárokov na ich spracovanie bude mať podobu derivácieBig data describes the exponential growth and availability of data, both structured and unstructured. This data are from e.... A ako tí zasvätenejší vedia, derivácia exponenciálnej funkcie je stále exponenciálna funkcia. Narastajúci objem dát teda aj napriek zdokonaľovaniu metód ich spracovania bude otvárať nožnice medzi
analytickými potrebami a dostupnosťou pracovnej sily na tento účel. K potrebe strojov na analyzovanie dát nás tak paradoxne stále väčší dopy po analýze samotných dát.

Analógia s retailom. Nedávno som sa rozprával s top manažmentom jednej zo siete maloobchodných predajní. Intenzívne pracujú na zavedení samoobslužných pokladníc. Keď som sa ich spýtal na dôvody tohto rozhodnutia, nedostalo sa mi odpovede, že by sa chceli priblížiť Amazon Go konceptu. Nie, skutočným dôvodom bolo, že sa stáva neudržateľné platiť ľudí (čo i len) s minimálnou mzdou a všetkými príplatkami za večer a víkend za skenovanie tovarov. Cenu IT riešení permanentne znižuje Moorov zákon a cena práce naopak kontinuálne rastie. Je len otázka času, kým cena automatizovaného modelu podlezie jednotkovú cenu človeka. Nechať si urobiť prediktívny model človekom bude teda raz rovnaký luxus ako zaplatiť si na povýsavanie upratovačku, napriek tomu, že vlastníte Roomba robota. 

Keď som konfrontoval spomínaný članok s niekoľkými expertmi v data miningu, niektorí z nich sa chlácholili, že to nemusím vidieť tak čierne. Že, áno, základný Machine Learning možno zvládne aj RAMkou a CPU nabúchana „plechovka“, ale na riadenie kvality DeepLearningových modelov alebo clustrovacích algoritmov stále bude treba ľudskú hlavu. Ako ľudia navyše máme kreativitu a tak, keď nám začne prihárať opäť vymyslíme niečo, čo nás „udrží v hre“.

Ako to vidíte vy? Na ktorú stranu sa prikloníte? Spustil som k tejto téme krátke hlasovanie, tak prosím zahlasujte, čo si myslíte.

Čo dodať na záver?

Prekvapivo podnetný vstup do diskusie ohľadne obavy o nahradenie ľudských pracovných pozícii Umelou inteligencou vniesla pomerne nečakane moja manželka, ktorá sa, chúďa, dátovou analytikou musí zaoberať, lebo ju danou témou otravuje jej bláznivý manžel. Rozoberali sme spolu, že naše deti zrejme už nebudú môcť robiť žiaden z jobov, ako ich my poznáme. Tieto joby proste nebudú existovať. Lámali sme si hlavu, ako teda ďalšiu generáciu pripraviť na ich povolanie. V čom ich viac rozvíjať, aby mali uplatnenie?

Po pár minútach, čo sme prebrali spoločenské dopady tohto trendu (masívna nezamestnanosť našej generácie, ktorá sa už nestihne preorientovať; môžu stroje pomocou VR prevziať aj úlohu kultúry? …) z jej úst zaznela skutočne zamyslenia hodná veta: „Nerozumiem, prečo ľudstvo investuje také enormné peniaze, aby ľudia získali lepšie riešenia tak, že ich bude vymýšľať niečo iné ako ľudia. Keby sme rovnaké, enormné peniaze investovali priamo do rozvoja ľudského potenciálu, neboli by sme na tom lepšie?“ Musím uznať, že tento druh uvažovania naozaj má niečo do seba. To, že nám príde prirodzené investovať radšej do výskumu AI ako do zlepšovania ľudských schopností, len dokumentuje, akou bizarnou cestou sa ako ľudstvo uberáme.

robocop

S trochou odľahčenia by som však dodal, že trend nahrádzania ľudského rozmýšlania strojmi je v podstate pochopiteľný. Ak si spomeniete, bola to práve ľudská lenivosť, ktorá poháňala vznik strojov. Keď sa dnes obhliadnete okolo seba, ľudia sú  lenivý skôr premýšlať ako vydávať fyzicku námahu (odtiaľ aj známe príslovie: „Kto nemá hlave, má v nohách“). Je to paradoxné, ale viac ľudí marketingom zblbnete, aby začali športovať, ako aby začali čítať odborné knihy. Vývoj systémov, ktoré budú za nás myslieť, tak mnoho ľudí považuje za službu ich pohodliu.

Asi len málo z nás si však uvedomuje, že v dôsledku toho nás čaká mentálna obezita. Áno, prestaneme si cybriť mozgové závity a tie nám postupne atrofujú, podobne ako svaly „tučka“, ktorý sa prestal hýbať. V pesimistickom scenári, tak ľudia budú postupne hlúpnuť a stroje sa zdokonalovať. Raz sa tak možno narodí generácia, ktorá nebude vedieť stroje „preprogramovať“, čo by mohlo mať fatálne následky pre našu civilizáciu. Kým sa tak však stane, trápiť by nás malo skôr, akú hodnotu budeme mať pre nejakého zamestnávateľa, keď budeme slabší a pomalší v myslení ako hardware. Prípadne aké nové druhy profesií by sme si mali vytvoriť, aby až raz prestaneme byť (tak nedostatkovými) Data Scientismi, sme mali čo robiť. Tak skúste nad tým popremýšľať prietalia, minimálne ako prevenciu proti mentálnej obezite.

Akýkoľvek komentár k tejto tému uvítam od vás tu.

PS: ten pôvodný Davenportov článok si nájdete tu, ak by vás to zaujímalo.