Sociálne siete majú príliš veľa Dieselu

Nie, toto nie je environmentálne okienko Mocnedata.sk portálu. A nejde ani o to, či budú zamestnanci Facebooku alebo LinkedInu jazdiť na elektromobiloch alebo tradičných spaľovacích motoroch. Tu ide o podstatne dôležitejšiu vec. Ide o naše informácie a nakladanie s nimi. Veď posúďte sami:

Nespochybniteľne najväčším škandálom Automobilového priemyslu za posledné roky bol takzvaný Diesel Gate. Podstatou tejto kauzy bolo, že výrobcovia automobilov modifikovali softvér v aute tak, že bežalo úspornejšie (so zníženým výkonom motoru) avšak iba ak auto zistilo, že je pripojené k meraciemu zariadeniu na emisie. Preto hodnoty splodín namerané počas emisných testov boli násobne nižšie ako skutočné hodnoty počas prevádzky, keď meracia jednotka nebola pripojená. Keďže väčšina krajín realizuje meranie splodín len na STK kontrolách (ako na Slovensku), dieselové autá vyzerali ako ekologické, hoci v realite boli závažnou záťažou pre životné prostredie.

Dôležitým aspektom tejto kauzy bol fakt, že automobilky si (pomocou manipulácie software v aute) vytvorili prostredie, kde boli sami sebe jediným dozorcom. A hoci byť sám sebe rozhodcom nemusí nutne znamenať, že budete švindlovať,  ak sa k tomu pridá tlak prostredia a lacnejšej konkurencie, pravdepodobnosť rastie. Preto to jediné, čo stoj medzi podvodom a férovým prístupom ku klientom, je krehká vrstva osobnej integrity manažmentu. Ako dnes už vieme, automobilky túto situáciu neustáli.

Ak teda automobilky prešli legálne oficiálnymi testmi, možno si hovoríte ako im na to mohli vôbec prísť? Story je v skutočnosti zaujímavá a myslím, že nesie aj dôležité premostenie do oblasti sociálnych médií, ktoré sú súčasťou nadpisu. Podvod automobiliek bol odhalený neziskovou organizáciou, ktorá sa venuje testovaniu skutočnej spotreby áut v prevádzke. Ich namerané čísla pre jednotlivé Diesel modely boli násobne odlišné od laboratórnych výsledkov výrobcov, ale v benzínových motoroch boli v celku porovnateľné. To vzbudilo pozornosť odbornej verejnosti a spustilo lavínu, ktorá viedla nakoniec k odhaleniu nekalých praktík. Ako sa to týka sociálnych sietí teda?

Sociálne siete dnes prechádzajú podobným obdobím ako automobilky. V otázke kontroly nad Fake news, či konšpiračnými teóriami sú SÚČASNE poslom správ a aj sami sebe dozorcom vplyvu týchto správ na užívateľa. Je len na ich vnútornej morálnej integrite ako dôsledne si budú plniť úlohu strážneho psa. Obdobne sú na tom aj v otázke analýzy osobných údajov a ich ďalšieho komerčného použitia. Napriek tomu, že ich biznis model je založený na tom, že monetizujú informácie o svojich používateľoch, neexistuje žiaden regulátor, ktorý by stanovoval primeranosť alebo trestal hamíždnosť týchto spoločností. Jednoznačne najvypuklejším prípadom bola kauza Cambridge Analytics.  Ak si myslíte, že GDPR prinieslo v tomto ohľade zásadné zlepšenie, pozrite sa ako patetické toto zlepšenie v niektorých spoločnostiach v skutku je. V otázke XAI rozhodovania (vysvetlenie tu) dokonca ešte neexistuje ani všeobecne odporúčaný postup.

Odpoveď na túto prekérnu situáciu v sociálnych médiách môže byť podobná ako v prípade Dieselu. Po tom, čo škandál s manipulovaním merania splodín na plno prepukol, automobilové koncerny sa zúfale rýchlo pokúsili skontaktovať s nezávislými agentúrami, ktoré robia meranie emisií priamo vonku za jazdy na cestách, aby im urobili skutočné testy. Pochopili totiž, že ich biznis je silne postavený na dôvere zákazníka v ich produkt a značku. Autu totiž zverujete svoj život (a život svojich blízkych). Preto zmýšľanie typu: “Ak podvádzali pri tak banálnej veci, ako sú splodiny, v čom inom mi mohli ešte klamať?” Z “neférového úderu” životnému prostrediu, (ktoré je reálne dôležité, priznajme si, len pre zlomok vlastníkov auta), by sa tak mohol stať “klientov klamajúci Volkswagen” (či iná značka). A tak prevenciu pred tým, aby sa podobný problém už nezopakoval, si zobrali na starosť nezávislé tretie strany.

Problémom sociálnych sietí však je, že zatiaľ sú stále vo “fáze Dieselu”. Nepochopili hodnotu a výhodu nezávislého auditu tretej strany. Mark Zuckerberg (a iní predstavitelia sociálnych sietí ) nás presviedčajú, že najlepšie bude, ak prevenciu fake news a primerané nakladanie s dátami budú riadiť interne vyvinuté kontrolné mechanizmy. Robia to aj napriek tomu, že niekoľko posledných mesiacov ukázalo, že ani v otázke konšpiračných správ ani pri ochrane osobných údajov svojich používateľov svoju úlohu nezvládajú. Neuvedomujú si, že tak riskujú scenár, ktorému sa rýchlo snažili vyhnúť automobilky. Ak používatelia nadobudnú dojem, že Facebook zahmlieva alebo klame ohľadne práce s ich dátami, húfne budú službu bojkotovať. Ak patríte medzi tých, čo si myslia, že zvíťazí ľudská lenivosť a ľudia nebudú ochotní vzdať sa pohodlia Facebooku a siete svojich kontaktov na ňom, rad by som pripomenul dva dôležité fakty: 1] Pre nadchádzajúcu generáciu už Facebook vôbec nie je prvou voľbou pri výbere sociálnej siete; 2] Podobný pocit bezpečia, kvôli vysokým “emotívnym nákladom” na zmenu mali mobilní operátori, banky či utility. (pozri Aký budík zvoní plynárom?) Dnes už musia tvrdo bojovať za udržanie si klientov.

V sociálnych sieťach je stále príliš veľa Dieselu. Ak chcete na tejto situácii zbohatnúť, neponúkajte Zuckerbergovi elektromobily, ale skúste navrhnúť nezávislý algoritmus na posúdenie práce s dátami v sociálnej sieti. Alebo založte novú sociálnu sieť, ktorá bude mať transparentný a verejne dostupný audit práce s dátami zabudovaný priamo v základných funkciách. Aj sociálne siete totiž čaká ich vlastný Diesel Gate. A zrejme už čoskoro …

 

5+1 zaujímavých videí o AI

Keďže recenzia knihy SuperIntelligence vzbudila medzi čitateľmi veľa pozitívnych reakcií, téma vývoja umelej inteligencie a jej napredovania zaujíma veľa členov Mocnedata.sk komunity. Rozhodol som sa preto pridať navyše ešte niekoľko názorov iných ľudí na túto tému. Aby ste sa však neučítali k smrti rozhodol som sa tento krát pre formu videa a rád by som vám sprostredkoval niekoľko výborných video príspevkov na tému AI a jej budúcnosť.

AI_videos_KAI_FULEEHow AI can save our humanity | Kai-Fu Lee

Ak pracujete vo svete AI, meno Kai-Fu-Lee vám nebude zrejme úplne neznáme, keďže stál za rozbehom AI v Apple a na mnohých iných  platformách. Jeho pohľad na AI je však celkom povzbudivý. Snaží sa nájsť oblasti, kde by ľudia mohli uspieť napriek nástupu umelej inteligencie. Ako vierohodná nádej je to? To už nechám si urobiť názor každého z vás, v každom prípade je to video hodné vašej pozornosti.

A brain in a supercomputer | Henry MarkramAI_videos_HENRY_MARKRAM

Fascinujúce na tomto videu sú hneď dve veci. Tou prvou je, že vzniklo pred 8 rokmi (!), čo len dokumentuje, že v Oxforde, kde Henry Markram pôsobil, už boli na míle vpred v tejto téme pred takmer dekádou. Ani po 10 rokoch by ste niečo podobné v našich podmienkach nenašli. Druhou fascinujúcim aspektom videa je, že neuveriteľne sviežo a pútavo za necelých 16 minút prevedie diváka od úplného začiatočníka po expertný vzhľad do problematiky Neurosimulácii. A to naozaj stojí za 16 minút vášho času.

AI_videos_ANDREW_ZEITLERThe Truth Behind Artificial Intelligence | Andrew Zeitler

Andrew mal iba neuveriteľných 17 rokov, keď predniesol reč, ktorú si tu môžete pozrieť. AK mu odpustíte trochu mladíckeho entuziazmu (ktorý občas preráža do afektu), tak vám predstaví niekoľko zaujímavých myšlienok o tom, čo sú najbližšie míľniky pre Všeobecnú inteligenciu (General AI) a ako sa bude vlôastne General AI správať. Pre zasvätených do tejto problematiky musím priznať, že niektoré pasáže jeho prezentácie sú trochu “hluché”. Ale ruku na srdce, kto z nás by v 17ich rokoch dokázal takto roztlieskať sálu plnú ľudí?

 

 

Where AI is today and where it’s going. | Richard SocherAI_videos_RICHARD_SOCHER

Richard Socher je profesor zo Stanford Computer Science Department, ktorý sa špecializuje na Deep Learning. Jasne a s humorom vysvetľuje, aký posun neurónové siete urobili za posledné roky a čo sú stále veci, ktoré zostávajú nevyriešené. Pre tých z vás, ktorí rozmýšľajú, akú tému si vybrať pre diplomovku alebo rigoróznu prácu, myslím, že je skvelý prehľad aktuálne žiadaných tém. Ak náhodou už v AI oblasti pracujete, možno inšpirácia, o aké ďalšie oblasti si rozšíriť svoje obzory. Ak aj náhodou nie ste zrovna AI nadšenec, Richard je skvelý zabávač, tak si to užite ako zábavné video na tému Umelej inteligencie.

 

AI_videos_CURTISMusic and Art Generation using Machine Learning | Curtis Hawthorne

Jedným z častých samo-chácholení sa  ľudstva v tom, ako sú ľudia nenahraditeľní, je argument, že ľudia sú – na rozdiel od strojov – predsa kreatívny. Aby ste vedeli na ako pevných nohách stojí táto téza, skúste si pozrieť video Curtisa Hawthorneho, ktorý rozoberá, ako ďaleko sa stroje dostali v ich kreativite. Až nabudúce započujete tento argument, už budete mať na to vlastný (faktami podložený) názor.

Pomyslením bonusovým +1 príspevkom je video samotného Nicka Bolstroma, autora SuperIntelligence knihy, v ktorom podáva základné princípy svojej knihy. Ak vás nenavnadila moja recenzia tejto knihy, skúste sa nechať zlákať samotným autorom.

AI kniha, ktorá bude Bibliou 21. storočia

324 strán knihy Superintelligence od Nicka Bostroma, je dielo, ktoré by si mal prečítať každý z nás. Podobne ako Biblia, popisuje totiž princípy toho, čo nás čaká, ktoré sú nad rámec nášho ľudského chápania. Zakiaľ tie biblické texty nám vysvetľujú postoje a činy “Ruky Božej” doslova od Adama, táto kniha popisuje pohnútky a správanie strojov, keď preberú žezlo najinteligentnejšieho tvora na zemi. Nie je to žiadne sci-fi, stroje nás proste dobiehajú a čochvíľa predbehnú. Preto nepotrebujeme  chlácholenie, že to nebude až tak zlé, ale reálne a precízne popísané scenáre, ako to zvládnuť. Napriek tomu, že sa umelou inteligenciou živím už nejaký ten piatok, mnohé vysvetlenia v tejto knihe boli pre mňa nové a prekvapivé. Ich dopady sú však tak závažné, že vám chcem v dobrom poprosiť, aby ste si ich prečítali. Ich neznalosť bude mať na vás podobné dopady ako sa nadšene utáboriť na svahu aktívnej sopky v predvečer jej erupcie: Zbytočne rozšírite rady obetí tejto udalosti.

Pri písaní tohto blogu sa ocitávam v prekérnej situácii. Mojou snahou je sprostredkovať vám, podľa možnosti, čo najlepšiu recenziu tejto knihy. Zároveň však chcem, aby ste si danú knihu naozaj prečítali. Oveľa dôležitejšie ako závery (ktoré by som vám tu možno stihol vymenovať), sú vysvetlenia a zdôvodnenia, prečo sa veci budú diať tak, ako sú popísané. Berte preto môj polomysteriózny tón tejto recenzie ako krehký balans medzi snahou navnadiť vás na prečítanie tejto knihy, ale zároveň vás nedostať do situácie, že po prečítaní tohto blogu by vám už samotná kniha nedala nič navyše. Kniha má v skutočnosti 15 kapitol (a len 324 strán A5 formátu), niektoré kapitoly sa však týkajú príbuzných záležitostí, takže som si dovolil jej obsah zhrnúť do 10 blokov.

[1] A bolo svetlo …

Tak ako biblický príbeh začína stvorením, aj Nick Bostrom začína krátkym vysvetlením, kde sme sa to vlastne ocitli. A hlavne, ako vývoj umelej inteligencie a strojového učenia prebiehal doposiaľ. Ak ste o superpočítačoch doposiaľ vedeli iba to, že už nás porazili v šachu, či iných hrách, tak táto kapitola vám dovysvetlí aj menej okaté míľniky v napredovaní strojov. Ak ste v AI už zorientovaní, prvých 20 strán sa vám bude čítať rýchlo, ale myslím, že vás aj tak zaujme aspoň vývoj názoru vedcov na budúcnosť strojového učenia. Tak či onak, autor intro do témy podáva veľmi hutne, takže ani sa nenazdáte a budete na priedomí asi najdôležitejšej, druhej časti.

[2] Čo nás to vlastne porazí?

Ak dnes hľadáte na webe nejaké informácie o superinteligentných strojoch, ktoré porazia/nahradia ľudí, článkom a diskusiám dominuje Artificial Intelligence (AI), teda počítačová umelá inteligencia. S istou mierou zahanbenia musím priznať, že pred prečítaním tejto knihy aj ja som považoval AI za najreálnejšiu podobu, ako nás stroje intelektuálne predbehnú. Deeplearningové algoritmy (pozri vysvetlenie) sú tak silné, tak univerzálne, a ich výsledky tak presvedčivé, že som si nepripúšťal inú alternatívu, ako by nás stroje mohli “prechytračiť”. Preto 2. a  3. kapitolu knihy pokladám za kľúčové. Autor totiž precízne vysvetľuje celkovo 5 možných spôsobov [Artificial Intelligence, Whole Brain Simulation, Biological Cognition, Brain-computer tool, Networks&Orgs], ako by mohla vzniknúť Superinteligencia v dohľadnej dobe. Zároveň popisuje, aká forma vývoja nás k jednotlivým formám dopracuje.  Uvedené 2 kapitoly, ako aj niektoré state neskôr v knihe, čitateľovi vysvetlia, že AI vôbec nie je najpravdepodobnejší scenár Superinteligencie. Bez toho, že by som prezrádzal pointu, poviem, že na Everest našej inteligencie sa budeme musieť zrejme skôr vyzbrojiť biológiou ako programovacími jazykmi. Pre mňa tieto dve kapitoly boli najkľúčovejšou časťou knihy.

[3] Rýchlosťou zvuku či svetla?

Nasledujúca časť knihy (Kap. 4) sa venuje otázke toho, ako rýchlo sa príchod umelej inteligencie udeje. Opäť sa priznám, že táto téma sa mi spočiatku zdala nepodstatná, možno až marginálna. Keď sme si nie istí, ktorá forma Superinteligencie príde ako prvá, tak načo filozofovať o tom, či od spustenia jej tvorby po ukončenie bude trvať mesiace či minúty. Odolal som však pokušeniu kapitolu preskočiť a tých 20 strán som nakoniec vôbec neľutoval. Autor totiž bravúrne argumentuje, že ak príde Superinteligencia, tak príde skôr v rádoch týždňov než desaťročí. Aby sme sa rozumeli správne: Autor nepredpokladá, že sa dnes nachádzame týždne od dokončenia AI alebo inej formy Superinteligencie. Skôr predkladá dôkazy, ktoré poukazujú na to, že v poslednom štádiu vývoja Superinteligencie sa budú veci diať tak rýchlo, že aj samotné výskumné teamy (snažiace sa o vývoj tejto Superinteligencie) budú prekvapené, ako rýchlo veci nabrali spád. Inými slovami, ľudstvo asi zostane zaskočené, že jedného rána tu zrazu Superinteligencia bude, hoci ešte minulý týždeň tomu nič nenasvedčovalo. A to je dôležité najmä pre časť [8].

[4] Spolu alebo na tajnáša

Všetko, čo človek vyvinul, sa udialo buď individuálnym objavom úzkeho okruhu ľudí (ako napríklad Teória relativity) alebo medzinárodnou spoluprácou (mapovanie genómu). Aký postup vývoja je najpravdepodobnejší pre získanie Superinteligencie? Bude to medzinárodný projekt pre rozloženie nákladov (ako je CERN) alebo niektorý štát či dokonca súkromná korporácia si postaví vlastnú Superinteligenciu. Ak sa vývoj poberie cestou izolovaného projektu, budú tajné služby iných štátov schopné detegovať progres. Vznikne niekoľko paralelných projektov a keby tomu tak bolo, ako ich vzájomná súťaživosť ovplyvní čas a mieru bezpečnosti finálneho produktu? To sú všetko otázky, ktoré kapitoly 5. a 6. zodpovedia. Azda najzaujímavejšou rozpravou tejto časti však zostáva téma, či niektorá Superinteligencia (vďaka časovému náskoku) dokáže potlačiť vývoj konkurenčných projektov a získať tak monopol (alebo aspoň oligopol) na Superinteligenciu. Ak sa vám tieto úvahy zdajú uletené, spomeňte si na atómovú bombu. Dnes je presne technologicky popísané, ako sa dá atómová bomba vyrobiť a sú dostupné aj suroviny na jej výrobu. Ale aj tak si nemôže hocijaká krajina dovoliť atómovú bombu len tak vyrobiť. Mocnosti, ktoré atómové zbrane už majú, z jej vlastníctva urobili exkluzívny klub. A noví členovia sa už do neho nepriberajú.

[5] Čo vlastne chce dosiahnuť Superinteligencia?

Dobre, raz budeme mať niečo múdrejšie ako my všetci ľudia dokopy. Ale veď, keď to nebude k nám nepriateľské a nezaumieni si nás to zničiť, nič až také hrozné sa nebude diať, nie? Ako si však môžeme byť istí, čo Superinteligencia vlastne bude chcieť dosiahnuť? Kapitola 5 pojednáva práve o tom, či by sme sa slobodnej vôle a pohnútok Superinteligencie mali vlastne po práve báť. Autor sa zdržal polemizovania o pozitívnom alebo katastrofickom scenári a najprv ponúkol analýzu toho , aké motivácie môžu vyplynúť priamo z postupu vývoja samotnej Superinteligencie. Hoci tu nám nehrozia katastrofické scenáre zo sci-fi filmov (kde sa inak neutrálny počítač zrazu zblázni a obráti stvoriteľom), budeme si musieť dať pozor, že stroje budú nasledovať svoje ciele o mnoho húževnatejšie než nám ľuďom príde primerané. Zároveň ich pri plnení vlastných vytýčených cieľov budú nechávať chladné okolnosti, ktoré sa dejú mimo (alebo sú vedľajšie dôsledky) plnenia ich  vlastných cieľov.

Istým osviežením bola časť, ktorá sa venovala tomu, neistote stroja, či už svoj cieľ naozaj vytýčil. Keďže počítač sa dokáže riadiť len pravdepodobnosťami, vždy môže mať semä podozrenia, že zo 1 milióna  spiniek, ktoré mal vytvoriť sa niektoré zlomili, stratili alebo sa pomýlil pri ich počítaní, tak to pre istotu ešte niekoľko krát prepočíta. Hoci mi pri čítaní týchto príkladov neraz vyhŕkli slzy smiechu, s odstupom času si uvedomujem, že by to mohli byť aj slzy našej bezmocnosti a frustrácie, keď sa s týmito situáciami budeme musieť naozaj potýkať. Podstatným záverom rozpravy je aj fakt, že pri väčšine spôsobov spútanie nežiaducich ciešov alebo ich korekcii sa Superinteligencia bude musieť spoliehať na vstupy od ľudí. Čo mimochodom, minimálne pre mňa nie je úľavou, ale naopak dodatočnou obavou. Probabilistické správanie je nám ľuďom úplne cudzie. Keď sme išli do práce 20x, sme pevne presvedčení, že sme naozaj išli 20x. Ani nás nenapadne skúmať, s akou pravdepodobnosťou niektorá z ciest do práce vlastne nebola cesta do práce a či ich naozaj bolo 20.

[6] Džin alebo Suverén. Čo to bude, až to bude?

Diskusia o tom, ako a kedy stroje preberú žezlo inteligencie zaberá väčšinu našej kapacity na túto tému. Prekvapivo málo energie sa však venuje otázke, ako vlastne ta Superinteligencia bude s nami ľuďmi interagovať. Necelých 20 strán 10. kapitoly preto svižne predstaví 4 konkrétne formy, ktoré Superinteligencia najpravdepodobnejšie nadobudne:

a] Veštica/Poradca (odpovie na nám ľubovoľnú otázku, ktorú jej položíme, ale nebude môcť nič reálne vykonať alebo meniť)

b] Džin (vykoná konkrétny príkaz, tak ako najlepšie sa to dá (bez toho, že by sme mu museli diktovať postup ako výsledok dosiahnuť), ale môže konať len na výslovný pokyn človeka)

c] Suverénny tvor (vykoná akýkoľvek pokyn stvoriteľa, podobne ako džin, ale medzi jednotlivými pokynmi sa neodoberie “do fľaše”, ale bude existovať samostatne a bude mať právo konať podľa svojho najlepšieho vedomia a svedomia a bez rozporu so všetkými obdržanými pokynmi človeka.

d] AI účelové zariadenia (superinteligentný počítač, ale určený len pre limitovaný okruh schopností – napr. riadenia letovej prevádzky -, ktorého jediným poslaním je vykonávať danú úlohu a ktorého nezaujímajú iné okolnosti dejúce sa mimo záber jeho vlastného procesu. )

Táto kapitola však okrem samotných foriem pomerne detailne popisuje aj to, ako nebezpečné pre ľudstvo by jednotlivé alternatívy boli a ako by sa ich správe mali ľudia postaviť. Autor síce nezúžil finálnu polemiku na jeden vhodný model, ale z ponúknutých argumentov je zrejme, ktorá z foriem je najvhodnejším riešením. Dovolím si tvrdiť, že výsledok by ste na prvý krát neuhádli (teda určite nie viac ako štvrtina z vás :).

[7] Máme to vôbec pod kontrolou?

Na otvorenie témy, či Superinteligencia bude slúžiť nám alebo naopak ľudia jej, čitateľ podvedome čaká už niekoľko kapitol. Keď sa však téma zrazu naozaj dostane v 8. a 9. kapitole na pretras, zrejme sa vám zrýchli tep. Hoci sám autor hodnotí, že katastrofický scenár nie je nutne jedinou a možno ani najočakávanejšou alternatívou, neušetrí nás tvrdého výčtu problémov, na ktoré ľudstvo zatiaľ trestuhodne nemá ani koncept riešenia. Udržať niekoho, kto je o rády inteligentnejší ako vy, “pod zámkom” alebo ho motivovať, aby robil len veci, ktoré si naozaj prajete, sa mi javí po prečítaní týchto dvoch kapitol takmer nereálne. Nemáme v túto dobu ani len návrh prototypu, ako to dosiahnuť a všetkých 4+4 menované prístupy už jednoduché kontrapríklady rozstrieľajú na cimpr-campr.  Možno však práve niektorý z menovaných prístupov sa podarí zásadne zlepšiť alebo skombinovať a inými opatreniami, takže prečítať si o ich podstate určite stojí za to. Ktovie, možno to budeš práve ty, kto navrhne novú formu “skrotenia” Superinteligencie.

Ľudia, ktorí ma poznajú osobne, vedia, že som optimista a za všetkým sa snažím vidieť najprv príležitosť až potom hrozbu. Pri čítaní tejto časti knihy sa mi však občas triasli kolená a mal som sucho v krku. Vidiac, ako ľahostajne sme sa doposiaľ postavili k otázke kontroly nad systémami umelej inteligencie, zostal som iba dúfať, že sa k Superinteligencii nedopracujeme veľmi rýchlo alebo, nedajbože, náhodne. Lebo Superinteligencia bude puška, ktorá sa dokáže sama nabiť, odistiť aj zamieriť.

[8] Dopady Superinteligencie na ľudí

Kapitola 11, ktorá pojednáva o možných dopadoch Superinteligencie na spoločenstvo ľudí na tejto planéte sa nachádza takmer tesne za polovicou knihy. Jej umiestnenie tak skoro v slede tém ma prekvapilo, lebo mnoho otázok zostáva v tom čase ešte len naznačených, ale nedopovedaných. S odstupom času však rozumiem, prečo Bostrom zaradil túto tému tak skoro do toku diskusie. Popísané trendy totiž slúžia v neskorších kapitolách ako varovanie alebo kóta, ktorej sa snažíme vo vývoji úplne vyhnúť. Vďaka tomu kniha nekončí zúfalstvom, keď na čitateľa doľahne celá tiaha budúceho problému, ale kniha ešte stačí dať aj odpovede, ako prípadne dopady na ľudstvo minimalizovať.

Obdivne treba uznať, že obraz zjavných dopadov Superinteligencie na ľudské pokolenie ide za hranicu prvoplánových (a už diskutovaných) tém ako prudká nezamestnanosť ľudí, ktorých nahradili stroje alebo precitnutie, že Superinteligencia vlastne ľudí vôbec nepotrebuje. Zaujímavé a neokukané sú rozpravy o dopade Superinteligencie na kapitál a jeho pohyb po svete alebo to, akú motiváciu na prácu bude mať systém (ľudí a strojov), kde bude všetko už optimalizované. Rozoberá sa aj pojem dobrovoľného otroctva či zvrátiteľnosti zmien spojených so Superinteligenciou. Pre mňa osobne prekvapivým (aj keď precízne zdokumentovaným) bol záver, že Superinteligencia akceleruje naše kozmické výlety. Ak by ste dostali knihu Superintelligence do ruky len na prečítanie jedinej kapitoly, určite by to mala byť práve kapitola 11. Dáva totiž vám a vašej rodine (ak viete čítať medzi riadkami) jasné rady, ako prežiť zavedenie Superinteligencie s čo najmenšími ujmami.

[9] Učíme stroje hodnotám a morálke

Pri rozmýšľaní o dôsledkoch Superinteligencie často zabúdame na to, že Superinteligencia bude rýchlejšia a prezieravejšia ako my ľudia. Bude teda vedieť veci formulovať tak, aby nás presvedčila o svojich názoroch (alebo aspoň zmanipulovala sa nimi riadiť). Človek teda prestane byť ten, kto bude určovať spôsoby (a možno ani ciele) napredovania. Ak má teda nad nami “vládnuť” nejaký iný tvor, bolo by vhodné, aby v základných princípoch zdieľal hodnoty ľudstva. Predstavte si totiž roztopašný superpočítač, ktorého zaujíma iba to, aby na planéte bolo, čo najchladnejšie, lebo vtedy jeho obvody majú ideálnu teplotu na beh výpočtov. Nerozpakoval by sa uvrhnúť ľudstvo do ďalšej doby ľadovej, čo by malo fatálne dôsledky pre našu existenciu.

Uvedené precitnutie je o to dôležitejšie, že vedecká obec sa zhoduje, že nech už dosiahneme ktoroukoľvek z 5 možných ciest (viď časť [2] blogu ), jedno budú mať spoločné: Pravidlá a morálne hodnoty pre rozhodovanie sa prvého prototypu Superinteligencie budú musieť nastaviť a zverifikovať ľudia. Musím sa priznať, že mi to príde skľučujúce. Keď si uvedomíte koľko ľuďmi vyprodukovaného zla sa deje dnes na našej planéte v dnešnej dobe, predstava že toto bude štartovací balíček hodnôt pre niečo ešte mocnejšie ako sme my sami, ma mrazí. Zároveň kapitoly 12. a 13. jasne dokumentujú ako nepresný sme pri zadávaní oveľa triviálnejších úloh počítaču (viď programovanie SW). Veľmi veľa z toho, čo skutočne chceme, je implicitne dané našimi vnútornými hodnotami. (napr. nezabíjame ľudí, aj keď už je zrejmé, že zomrú). Aj tak nekonflitkne vyzerajúci cieľ pre Superinteligenciu ako “aby bol každý človek na svete aspoň tak šťastný ako doposiaľ a ideálne ešte viac”, by viedol v podaní superpočítača preukázateľne ku katastrofe. Autor síce popisuje 8 rôznych prístupov ako možno nastaviť Superinteligencii naše hodnoty, ale čítať tieto prístupy bolo pre mňa bolestivé čítanie. Po prečítaní tejto state knihy som si uvedomil, ako pramálo máme pod kontrolou AI modely, ktoré spolu vyvíjam aj ja v práci.

[10] Ako teda pristúpiť k Tvorbe Superinteligencie?

Záverečné 14. a 15. kapitola knihy vezmú lego kocky princípov, ktoré rozpovedala kniha doposiaľ a pokúša sa nám, ľuďom, dať čo najerudovanejšiu radu ako s týmto ošemetným cieľom (zostaviť Superinteligenciu) vlastne naložiť. Bostrom ponúka vysvetlenie ako jednotlivé technologické odvetvia dokážu urýchliť (čo spomaliť) tempo príchodu Superinteligencie. Ponúka odhad toho, aké zdroje (HW, financie, …) budú zrejme potrebné na dosiahnutie tohto cieľa a v ktorých oblastiach je možné očakávať spojenie síl, či naopak ich trieštenie.

V poslednej kapitole autor pripomína, že závery [9] kapitoly a zdôrazňuje tak, čo sú hlavné obranné mechanizmy, aby sa nám Superinteligencia nevymkla z rúk. Stavia všetkých nás, ktorí dnes v oblasti AI a spracovania dát pracujeme pred niekoľko morálnych dilem. Niektoré scenáre, žiaľ aj tie pravdepodobnejšie, majú totiž doslova mrazivé rozuzlenie. Po dočítaní poslednej strany som zostal dlho premýšľať, ako je možné, že ako ľudstvo sme tak zúfalo nepripravení na príchod Superinteligencie. O mnohých očakávaných problémoch Superinteligencie neexistuje ani len diskusia,  nie to ešte návrh nejakej regulácie alebo plán, ako riziko uriadiť. Ak k Superinteligencii prídeme rovnako ako k penicilínu alebo objavu röntgenových lúčov, tak to bude stáť veľa reálnych ľudských životov. Preto vás chcem požiadať, kúpte si danú knihu, prečítajte, zariaďte svoju rodinu a blízkych podľa jej záverov a šírte povedomie o tejto téme vo svojom okolí. Tak ako som sa o to ja pokúsil práve týmto blogom.

Čo ďalšie si prečítať:

4 kvalitné knihy – Čo si prečítať o dátovej analytike

Viete, čo je XAI? Ej, veru, mali by ste.

V hurhaji okolo GDPR (pozri jeho navtipnejšie závery), zanikla jedna podstatná informácia. Regulácia o ochrane osobných dát podstatne rozširuje právo jednotlivca na vysvetlenie rozhodnutia. Hoci v tejto oblasti GDPR zatiaľ nezavádza rovnako “mastné” pokuty ako pri nesprávnom nakladaní s našimi údajmi, do budúcna ide o ešte dôležitejší krok ako to, či ste dali na spracovanie údajov súhlas. Táto téma dokonca patrí medzi TOP 15 trendov v dátovej analytike pre rok 2018.

Od Adama …

Čo vlastne teda je Právo na vysvetlenie? Ak akýkoľvek obchodný alebo servisný proces používa automatické rozhodovacie systémy, každému človeku, ktorý je predmetom takéhoto rozhodnutia, vzniká v EU právo na vysvetlenie, na základe akých kritérií sa presne stroj rozhodol. Hoci toto právo bolo prvý krát formulované už v roku 1995 (verili by ste tomu?), aktuálna GDPR smernica ho výrazne posilňuje. Je to zjavne aj preto, že s nástupom AI sa počty autonómnych procesov rozhodnutia začínajú rapídne zvyšovať. Ak pracujete v oblasti analýzy dát, zrejme si však položíte otázku: Je však táto norma v praxi vykonateľná?

EXPLAIN_networkVäčšina bežných rozhodovacích procesov vo firmách a v štátnej správe, ktoré sa rozhodujú automatizovaným spôsobom, vznikli ako Machine Learning modely.  (Viac na túto tému sme písali tu.) Pri nich nie je komplikované popísať rozhodovanie, pretože či už ide o Rozhodovacie stromy, Regresie alebo SVM modely, skladbu a významnosť jednotlivých faktorov, ktoré sa podieľali na rozhodnutí detailné poznáme. Situcia sa začína výrazne komplikovať pri Random Forest modeloch, kde síce poznáme zoznam faktorov, ktoré do rozhodnutia vstupovali, ale ich konkrétny vplyv už popísať ťažšie. Ten istý faktor môže jednom z sub-modelov mať pozitívny vplyv na rozhodnutie a vzápätí v inom sub-modeli korigovať mieru vplyvu presne opačnou koreláciou s celkovým hodnotením. Človeku by sme teda vedeli povedať, že fakt, že má aj  kreditnú kartu výrazne ovplyvnil schvaľovanie jeho hypotéky. Ale či to bol v konečnom dôsledku podporný alebo problémový činiteľ, už nie je tak jednoznačné.

Situácia sa úplne vymkne z medzí jednoduchého vysvetlenia pri prechode do Deep Learningu.  Modely umelej inteligencie postavené na neurónových sieťach sú vo väčšine prípadov neinterpretovateľné spôsobom zrozumiteľným pre bežného človeka. Systém vrstiev, v ktorých každej z nich prichádza k transformácií, vzájomnej kombinácii a prehodnoteniu významnosti jednotlivých vstupných údajov, často môže zabrať niekoľko desiatok strán na popísanie rozhodnutia a prejsť si príkladom konkrétneho rozhodnutia o konkrétnom človeku je časovo neúnosné. Ak sa k tomu navyše pridá rozmer, že neurónová sieť je učiaceho sa typu, úloha sa zdá už od základu nesplniteľná. V momente, keď človek namieta rozhodnutie a žiada jeho vysvetlenie totiž systém už môže dávno zvažovať úplne iné faktory ako v jeho prípade. Zároveň všetci vieme, že učiace modely sa zdokonaľujú najmä kvôli historickým chybám (o korekcie ktorých sa snažia spätnou propagáciou chyby). Asi by sa ťažko vysvetľovalo klientovi, že on(a) bol tá chyba, ktorá dopomohla k celkovému vyladeniu modelu.

A predsa sa točí

Nech situácia vyzerá akokoľvek beznádejne, v skutočnosti sa v tejto oblasti dejú zásadné posuny. Existujú totiž oblasti, kde dôvody rozhodnutia sú minimálne tak dôležité ako rozhodnutie samotné. Asi najvypuklejším príkladom je v tomto ohľade Zdravotníctvo. Ide o ľudský život, takže žiadne dobrodružstvá, ktoré zabijú desiatky ľudí, než sa vyladia tu nie sú prípustné. Dokonca ani test, na chorobu ktorý má čo i len 1-2% false positive mieru, nie je prijateľný. Sú totiž aplikované na vysoké počty pacientov a vytvárali by tak veľa zúfalých ľudí. (Uvedomte si, že 1% error rate by spôsobil, že v každom väčšom paneláku by žil niekto v mylnom domnení, že zomiera na rakovinu, či v každej rannej električke by bol jeden s podozrením na AIDS). Práve kvôli týmto oblastiam vznikla XAI, teda EXPLAINABLE AI. Podstatou XAI je nielen dodať kvalitný prediktívny model, ale zlomiť (doposiaľ zastávanú) paradigmu, že ak chcete čo najsilnejšiu predikciu, musíte obetovať interpretovateľnosť modelu a naopak. Aké techniky teda XAI používa?

LRP_overview

Prvou technikou, ktorú by som vám chcel dať do pozornosti, je Layerwise relevance propagation (LRP), ktorú vo vedeckom článku popísal pre troma rokmi Bach et al. Podstatou tejto metódy je analógia k back-propagation chyby modelu, ktorá však prenáša pomocou váh jednotlivých nodov vo vrstvách významnosť naspäť až na úroveň jednotlivých vstupných informácií v prvej vrstve. V prípade image recognition tak môžete dostať informáciu, ktoré časti obrázka boli pre celkové posúdenie rozhodujúce. S použitím parciálnych derivácií následne dokážu experti zostrojiť aj generickú funkciu, ktorá popisuje model aj vo všeobecnosti. Ak ste v tejto téme zatiaľ nie príliš doma, odporúčam prečítať si toto zhrnutie.

LIME_metoda_vysvetlenie

Druhou snubnou metódou XAI, na ktorú som nedávno narazil (cudos aj Banalytics skupine, kde sa táto metóda nedávno mihla), je metóda LIME, ktorú priniesli gentlemani Marco Tulio Ribeiro, Sameer Singh, Carlos Guestrin z Washington Univerzity v Seattli, USA. Musím povedať, že LIME si ma naozaj získal, keďže dokáže interpretovať ľubovoľný model, bez ohľadu na jeho architektúru (vyššie spomínané LRP dokáže demystifikovať len neurónové siete, aj to iba určitej architektúry). Je to teda univerzálny “vysvetľovač”, ktorého princíp je zázračne jednoduchý.  Na vysvetlenie hraníc oddeľujúcich ÁNO od NIE používa jednoduché lokálne modely, ktoré sú zrozumiteľné aj bežným smrteľníkom.  Jedinou nevýhodou LIME je, že dokáže vysvetliť len klasifikačné modely. Keďže však väčšina rozhodovacích procesov sú práve tohto typu, pre Explainable AI je to výrazná pomoc. Pre hĺbavejšie typy prikladám vedecký článok o tejto metóde, pre priamočiarejších čitateľov video samotného autora, ktorý vysvetľuje princíp tohto snubného počinu v XAI.

Ako vidno z oboch citovaných prístupov (zverejnené boli v 2015 a 2016), oblasť XAI je zatiaľ pomerne mladá. Je to o to fascinujúcejšie, že prvé neurónové siete vznikali už pred viac ako 40 rokmi. V každom prípade možno očakávať, že sa s podobnými prístupmi teraz “roztrhne vrece”. Pri prechode od Machine k Deep Learningu, ktorý práve zažívame, totiž “vysvetľovači” budú viac ako nutní. A to aj keď GDPR legislatív zostane k právu na vysvetlenie rovnako vágna ako je tomu aktuálne.

Tento článok je súčasťou širšieho Seriálu o umelej inteligencii. Ak vás téma zaujala, pozrite si aj ostatné diely seriálu.

Čo ďalšie prinesie Apple? 9 prekvapivých alternatív

Či už ste priaznivcom “Nahryznutého jablka” alebo Apple z duše nenávidíte, jedno sa im musí nechať. Za posledné desaťročia spustili niekoľko zásadných trendov v oblasti spotrebnej elektroniky a IT. Či už to bol umieračik pre hudobné CDčka v podobe iTunes (a s ním spojený iPod) alebo to bolo odzbrojenie NOKIE (a iných výrobcov telefónov) beztlačidlovým iPhonom. Menovať by sa z histórie Applu dalo ďalej, ale tá podstatná otázka je skôr: Čo bude ďalším prelomom z dielne tejto firmy?

Predpovedať budúce technologické zlomy od Applu je ťažké nielen preto, lebo svoje “budúce kone” veľmi dobre tají, ale najmä preto, že každý veľký počin tejto firmy bol založený prevažne na zmene biznisového modelu a zásadnej zmene správania užívateľov, ktoré boli vždy zásadným prekvapením. Erudovane odhadnúť budúce Apple výrobky si teda netrúfne hocikto. Magazín WIRED  však o to požiadal 9 popredných expertov tejto oblasti a tu sú ich pohľady:

Neviditeľná technika. Možno to nevnímame zásadne, lebo sa to deje po krokoch, ale väčšina krokov v IT viedla k tomu, že užívateľ má čoraz menší kontakt so samotným výpočtovým srdcom a výkonom zariadení. Operačné systémy neustále znižujú počet vecí, ktoré človek môže (v ich argumentoch musí) konfigurovať. S nástupom Siri, cloudových aplikácií a zariadení ako Apple Watch sme postupne odrezaný od toho, čo sa deje pod pokličkou (rozumej v procesore). AZEEM AZHAR [z Cronycle] si preto myslí, že Apple nás postupne privedie do éry Neviditeľnej techniky. Neviditeľnej nie preto, že by bol z priehľadného materiálu, ale preto, že sa naplní povaha hlášok zo Sci-fi filmov “Počítač, vyhľadaj všetky informácie o <xxx> a povedz nám, čo ďalej robiť” (prípadne pre fajnšmekrov “KITT, poďme tam po vedľajších cestách, aby si nás nevšimli”). Dobu, keď s počítačom bolo potrebné vedieť pracovať, nahradí obdobie, keď počítač začne s nami komunikovať “rečou nášho kmeňa”. A to doslova. Výpočtový výkon priamo v hodinkách, telefónoch či tabletoch prestane byť dôležitý, lebo tieto zariadenia sa stanú len prijímačom našich prianí a pokynov a ich skutočné vykonanie bude zabezpečovať nejaký vzdialený počítač. Technika sa tak v určitom zmysle pre nás stane naozaj neviditeľná.

Výrazný vstup do obsahu. Hoci “jabĺčko” je známe najmä pre svoje hardwarové počiny, v skutočnosti má “na svedomí” aj niekoľko zásadných SW či dokonca obsahových prielomov. Zavedením iTunes naučil ľudí kupovať pesničky po kusoch, nie po albumoch. S príchodom AppStore nás naučil dokupovať si “virtuálne veci” do hier alebo “pustiť žilou” za jednotlivé aplikácie. SARAH LACY [Pando] preto predpovedá, že Apple (pomocou akvizícií) skonsoliduje svoj mediálny arzenál. Príklad Apple Music (aj keď stále zápasiacej so Spotify) je jasný dôkaz toho, že keď vlastníte veľký (digitálny) obchodný dom, začať v ňom predávať vlastný obsah je nielen možné, ale aj slušne profitabilné. Medzi odborníkmi preto pulzuje presvedčenie, že Apple Music nie je posledný segment ovsahu, ktorého sme sa od Apple dočkali. Sarah však zároveň dodáva, že chlapci z Netflicu, či Amazonu, už začínajú mať citeľný náskok, takže “jablčáci” by mali švihnúť kostrou.

Domáce jablko. Firma Apple nám priniesla niekoľko zásadných prielomov v používaní elektroniky (Macintosh, iPhone, iPad). Napriek tomu experti pozorujú, že zaostáva za Googlom alebo Amazonom v oblastiach ako autonómne autá, virtuálna realita, či hlasové systémy. Aby sa dotiahli v tomto ohľade na konkurentov, GADI AMIT [FitBit designer] si myslí, že Apple sa intenzívne vrhne na (zatiaľ) fragmentovaný trh s domácimi systémami. Tento trh predstavuje potenciál s biliónovou hodnotou v dolároch, takže niečo, čo iste aj predstaviteľov láka. Navyše aktuálne ponúkané riešenia sú väčšinou svoj stojné, izolované zariadenia bez integrácia s inými dôležitými systémami v rodine. Za to Apple má sovje vlastné počítače (iMac), domáce siete zábavy (Apple TV), reprosústavy (Beats) a mobilné telefóny a tablety. Na trh uviedlo aj svoj HomePod aktívny reproduktor, akési skríženie hlasového ovládania a Audio sústavy. Apple dôslednejšou integráciou svojich zariadení (a príchodom 5G sietí s väčším prietokom dát) dokáže teda vyradiť káblové televízie, pevné linky a mnohé iné služby dnes nakupované od špecializovaných poskytovateľov. (o to viac dáva zmysel odsek o obsahu – poznámka mocnedata.sk). OD tohto statusu je už len kúsok k polohe univerzálneho rozhrania pre komunikáciu kuchynských, bezpečnostných či iných domácich systémov. Ak sa to Applu podarí, na práčke či chladničke budúcnosti tak možno budeme hľadať označenie “Kompatibilné s Apple Home”.

Záchranár.  Keď Apple uviedol na trh iWatch, pre mnohých to bol len ďalší displej, z ktorého na mňa môžu vykúkať emaily, či mini aplikácie. Pre relatívne obmedzené funkcionality prvej verzie Apple hodiniek, niektorí dokonca posmešne dodávali, že Apple už vám nemal čo predať do vrecka, tak musel vyliezť na zápästie. S postupom času však iWatch pribudli nové senzory, výpočtová sila aj lepšia konektivita s ostatným svetom. To vedie LEANDERa KAHNEYho [CfAoSM, Demos] k názoru, že Apple použije tento produkt na razantnejší vstup do sektoru zdravotníctva. Ako postupne pribúdajú do zariadenia senzory na monitorovanie životu a životného štýlu užívateľa, iWatch by sa mohli stať nielen detektorom zdravotných problémov, ale priamo záchrancom života. Stavy ako epileptický záchvat, hyperglykémia, infarkt či mozgová príhoda užívateľa vie rozpoznať a včasne privolať potrebnú pomoc. V niektorých futuristických verziách tohto produktu, možno pomocou elektród priamo aj posielať elektrické signály do správnych častí nervovej sústavy pacienta, aby pomohol priamo na mieste alebo tlmil bolesť.

Otroctvo z mobilov.  V roku 1976 sníval (vtedy iba 21 ročný) Steve Jobs o tom, že prinesie počítač každému z nás. O niekoľko desaťročí neskôr k tomu aj významne prispel, veď 1/3 populácie používa smartfón, ku popularizácii ktorého výrazne prispel. Tento fascinujúci fenomén má však aj svoje odvrátené stránky (viac tu). S mobilmi a ich neustálym spojením s internetom sme sa stali vazalmi týchto. Nie náhodou viaceré štúdie ukázali, že prvú vec, po ktorej človek siahne ráno, keď sa zobudí je smartfón. TONY FADELL [CoInvertor of iPod] preto zdôrazňuje, že hoci mnohí si myslia, že závislosť od smartfónov je skôr problémom Facebooku (a podobných), v skutočnosti sa všetko odvíja od funkcií samotného zariadenia. Hardware zároveň má “moc” regulovať či odoprieť užívateľovi používanie aplikácií, ak by to bolo v rozpore s jeho zdravím. Súčasťou problému je aj to, že hoci v strave vieme, čo sú dobré proteíny a nie príliš vhodné tuky, v digitálnom svete nemáme jasne pomenované, čo je ešte v norme a čo už je nezdravé používanie týchto technológií. Preto prvým krokom, nazdáva sa Fadell, je aby výrobcovia vytvorili jednoduché nástroje na sledovanie svojej digitálnej spotreby. Tieto funkcie však nesmú byť schované v 3tej úrovni menu nastavení, ale mali by byť dostupné rovnako ľahko ako odblokovanie obrazovky, či dokonca sa proaktívne ozývať. Odborníci sa v tomto ohľade spoliehajú na “prvý ťah” Applu aj preto, že je vnímaný ako ten, kto udáva trendy (a tento problém je u iOS užívateľov ešte vypuklejší, lebo žijú rýchlejší život).

Mocné iMessage. Ku koncu tohto roka sa Apple chystá uskutočniť veľkú zmenu, keď spustí Business chat, nástroj, ktorý umožní pomocou iMessage správ firmám priamo kontaktovať konečných spotrebiteľov. Hoci niektorí zlomyseľne poukazujú na to, že je to len kopírovanie WeChatu, ktorý tento krok už umožnil v Číne, faktom zostáva, že pôjde o krok výrazne revolučný. Otvorením stavidiel komunikácie pre firemný sektor nielen zasadí ďalšiu ranu SMSkám (viac tu), ale umožní obísť aj cielenie cez reklamné, či mediálne agentúry. CONNIE CHAN [Andreessen Horowitz] preto nepochybuje, že tento prielom v komunikácií s klientom povedie k ešte výraznejšiemu posunu k mobilnej verzii ako prvotnej platforme na nákup a servis klienta. Avšak na to, aby Apple so svojim Business chatom mohol uspieť voči WhatsAppu a iným messengerom, bude nutné, aby udelil iMessage niekoľko “neférových” výhod. Apple zrejme umožní iMessage ako jediným hlbšiu integráciu so základnými iPhone aplikáciami ako Kalendár, Wallet, Music či Files. Udelenie výhradnej integrácie s ApplePay by bolo jadrovou zbraňou, lebo by v podstate okamžite vyradilo z hry (na iOS zariadeniach) všetky platobné služby ako PayPal či služieb ako u nás populárne Viamo. Na zaplatenie bude stačiť odpísať v chate cez iMessage “I agree to buy now”., navyše budete mať garanciu vrátenia peňazí, ak by išlo o podvodné vylákanie peňazí od vás. Okrem dopadu na e-commerce, ktorý si viete asi predstaviť, to nepochybne povedie k ešte väčšiemu rastu významu chatbotov. Stroj už tak nielen bude vedieť vás presvedčiť o kúpe, ale rovno aj skasírovať.

Najväčšia univerzita a úplne bez školného.  Enormný obchodný úspech Apple produktov spôsobil, že Apple doslova sedí na halde peňazí. Ich hotovostná “zásoba” (ak sa to vôbec dá tak označiť) je väčšia ako celý akciový trh Ruska. Ak by sa rozhodli, môžu si kúpiť celý Boeing a Nike v ten istý deň bez toho, že by si museli požičať čo i len cent (a to by ani nemuseli rozbiť celé prasiatko).Čo rozumné (a strategicky hodnotné) teda s takou hotovosťou urobiť, aby priniesla Applu ďalšie zhodnotenie? SCOTT GALLOWAY [NY University Stern School of Business] predpovedá, že Apple by mohol byť prvou firmou na svete, ktorá postaví Univerzitu svetovej úrovne bez akéhokoľvek školného. Študenti (nielen) v Amerike sa zadlžujú obrovskými čiastkami, aby zafinancovali svoje vzdelanie. Aby svoj dlh splatili musia sa na 5-10 rokov “dobre” zamestnať. Pritom školné na popredných univerzitách kontinuálne rastie (najmä kvôli inflácií platov profesorov). Prečo teda neotočiť tento prastarý biznis model? Apple spustí Univerzitu, kam budú síce prísne prijímačky, ale štúdium bude zadarmo. Študent sa však musí zaviazať, že po skončení štúdia odpracuje určité obdobie buď pre Apple alebo pre partnera, ktorý sa rozhodne od Appla si absolventov “objednať”. Čo teda potrebujete, aby ste mohli založiť kvalitnú univerzitu. V prvom rade priestory a kvalitných učiteľov. V niektorých krajinách už Apple experimentuje v prepožičiavaniu svojich Apple Store a firemných officov na večerné komunitné aktivity, spraviť z nich posluchárne pravidelného Univerzitného vyučovania by bolo teda zjavne veľmi jednoduché.  S hotovosťou na stole, prestížou značky a armádou 123 000 zamestnancov po celom svete určite nebude ťažké nájsť niekoľko desiatok odborníkov ochotných učiť na Apple University. Jasné, zrejme nebudú učiť medicínu alebo teológiu, ale biznis a IT odborníkov, ktorí majú čo študentom odovzdať určite nájdu aj priamo medzi svojimi radami. Mnohí by “vraždili” za predmet vyučovaný Tim Cookom alebo Jonym Ivom, ale Apple má ponúknuť toho oveľa viac (pozri zoznam možných tútorov). Tento projekt by navyše pre Apple nemusel byť “charitatívny”, lebo ak sa im podarí pritiahnuť naozaj tých najtalentovanejších, na trhu je iste dosť spoločností, ktoré radi zaplatia za možnosť osloviť s ponukou konkrétnych absolventov.

Carpe diem.  Už dávne psychologické pokusy z obdobia BF Skinnera preukázali, že keď ineteligentným organizmom pravidelne pridepíte odmenu po určitej činnosti, organizmy začnú opakovať danú činnosť častejšie, aby si “vypýtali” viac odmeny. Už menej známa je verejnosti alternatíva, keď odmenu nedostane zakaždým, ale len s určitou pravdepodobnosťou (povedzme každý 3tí krát). Mnohí sa nazdávajú, že v takom prípade robíme činnosť menej často, lebo vidina odmeny je, akosi, menej istá. Výskum však ukázal, že presný opak je pravdou. Keď odmena je menej istá, ľudia (a iné zvieratá) skúšajú danú činnosť viac pre istotu, aby sa aspoň raz odmena dostavila. V podvedomí tak vzniká rovnica “Ak chceš mať benefit, urob to viac krát, lebo odmena nie vždy prichádza po prvom raze” DAN ARIELY [Futurista, Autor viacerých bestsellerov] si myslí, že toto je presne vzorec, akým smartfóny odpútavajú našu pozornosť. Vieme, že v priemere sú emaily, sociálne statusy, či správy na messengri nezaujímavé. Ale občas sa medzi nimi nájde niečo naozaj hodnotné, tak sa k nim opakovane vraciame, aby sme našli svoju dennú “dávku dopamínu“. ARIELY verí, že Apple sa k tejto téme postaví čelom a pomôže užívateľom zvýšiť svoju produktivitu. Ak napríklad píšem nejaký text na iOS zariadení, tak okrem urgentných správ rodiny všetky ostatné počkajú na doručenie, keď prestanem písať (alebo sa zdvihnem a odchádzam od stola). Na základe rozsiahlej histórie by dokonca AI v Apple zariadeniach mohla sama vyhodnocovať významnosť/prínosnosť správ a servírovať ich postupne v čase. Ak by sa “jabĺčkárom” podarilo tento pattern ľudského správanie poupraviť a citeľne zvýšiť produktivitu práce používateľov, získalo by si väčšiu popularitu (najmä ako služobný telefón, či tablet).

Data prideľovač. Nachádzame sa na križovatke toho, či budeme vnímať, že či sa s našimi dátami nakladá len poza náš chrbát alebo sme súčasťou tohto procesu. Hoci naše dáta primárne vytvárajú a ukladajú softwarové aplikácie, sú to práve hardwarové spoločnosti, ktoré dokážu výrazne vychýliť opäť k nášmu prospechu. To vedie CARLa MILLERa [CfAoSM, Demos] k názoru, že práve Apple (a jemu podobné firmy) v tom zohrajú dôležitú úlohu. Prvým dôvodom, prečo v to verí, je fakt, že hoci iOS zariadenia o nás zbierajú enormné data sety, ich prežitie nie je od týchto dát rovnako závislé ako v prípade Googlu alebo Amazonu. Sú teda v komfortnejšej pozícii “venovať” nám naše vlastné dáta. Tým druhým dôvodom je, že sú tak veľké, že dokážu vytvoriť sieť pre ďalšie využitie dát svojich užívateľov. V kombinácii týchto dvoch vecí tak Apple zariadenia môžu ukladať dáta vo svojich útrobách a ponúknuť možnosť užívateľovi vyťažiť (alebo odpredať) svoje dáta na dobrovoľnej báze. Nerobme si ilúzie, mnohí by radi za peniaze speňažili svoje dáta (viď viac tu). Preto model, kde tak dobrovoľne môžu urobiť  a získať za to reálne peniaze, je pre iOS užívateľov výhodnejší ako čistú nulu, ktorú teraz majú od Facebooku, či Googlu. Tvrdošijne odmietavé postoje Applu pri historických pokusoch polície nariadiť firme, aby odomkla iPhony podozrivých ľudí, naznačujú, že Apple by mohla túto úlohu zohrať.

Blog je inšpirovaný článkom “Think Different” z May-June 2018 vydania WIRED magazínu. Ak si chcete pozrieť aj iné technologické zmeny očakávamé v tomto roku, začnite tu.

Neznáme algoritmy II. – Small data pravdepodobnosti

V dnešnej dobe väčšinu analytického diskurzu zaberá BigData, pri ktorých prestáva zmysel hovoriť o vzorkách. Často máte k analýze dispozícií celú históriu javu. Pre odhad pravdepodobnosti nejakého javu v BigData stačí pozrieť ako často daná situácia už v minulosti nastala. V bežných, civilných životoch však zriedka máme k dispozícií viac než zopár opakovaní procesu. Napriek tomu však musíme byť schopní odhadnúť pravdepodobnosť daného javu. Ako nestrieľať odboku a správne odhadnúť svoje celkové šance napríklad v lotérií, z ktorej máme len zopár žrebov?

Tento blog je súčasťou seriálu o Menej známych algoritmoch v dátovej analytike. Ak si chcete prečítať aj iné články z tohto seriálu, nájdete ich tu. Ak ešte nie ste členom MOcnedata.sk komunity zadarmo sa zaregistrujte tu a budete dostávať aj rozšírene materiály k týmto blogom.

Predstavte si nasledovnú úlohu. Milujete stieracie žreby, máte radi to vzrušenie, keď zotriete polia a zistíte, či ste niečo vyhrali. Ako váš dobrý priateľ vám chcem urobiť radosť. Dám vám k dispozícii 100 EUR, za ktoré si môžete kúpiť žreby (jeden stojí 2 EUR) a vždy keď niečo vyhráte, môžete výhru opäť premeniť na ďalšie stieracie žreby. Aby príklad nebol zbytočne komplikovaný, povedzme, že na výherných žreboch sa dá vyhrať iba vždy tá istá suma = 50 EUR. Koľko žrebov celkovo zostierate, kým sa vám minú peniaze odo mňa a z potenciálnych výhier?

Úloha by bola celkom jednoduchá, keby ste vedeli pravdepodobnosť výhry. (aj tu by bola odpoveď závislá od šťastia, s akým vyberáte žreby, ale pri dostatočne vysokých počiatočných sumách na nákup žrebov, by ste sa trafili pomerne presne). Ako to už však v lotériách chodí, pravdepodobnosť výhry konkrétneho žrebu nepoznáte (väčšina lotérií je postavených tak, že jej prevádzkovateľ v konečnom dôsledku zarába aj po vyplatení všetkých výherných prémií,  takže sa pravdepodobnosťou výhry príliš nesnaží chváliť). Ako teda odhadnúť skutočnú pravdepodobnosť celkovej výhernosti v danej lotérií, keď máme iba limitovaný počet pokusov?

Aj keď ide o pomerne komplikovaný výpočet, matematikom BayesoviLaplaceovi sa už v stredoveku podarilo prísť na veľmi jednoduchý vzorec ako výpočet realizovať. Ako to už v stredovekej vede chodí, jeden o druhom navzájom nevedeli a dopracovali sa k tým istým záverom. Iróniou osudu je, že hoci väčšia časť práce by sa dala pripísať Laplacovi, do dnešného dňa nesie táto oblasť štatistiky meno práve po Bayesovi. Avšak späť k samotnému výpočtu pravdepodobnosti, ktoré znie nasledovne:

                              P = (m+1) / (n+2)

Kde p = pravdepodobnosť javu, m = počet priaznivých pokusov (v našom prípade výhier), a n= celkový počet opakovaní procesu. Ak teda máte 10 stieracich žrebov, z ktorých 4 vyhrali, tak celková pravdepodobnosť lotérie je približne 5/12 = 42%. Všimnite si, že bežný človek by predpokladal len 40% na základe histórie. Práve šírka skúsenosti s lotériou je tu mne vo vzorci premietnutá. V odbornej verejnosti sa ujal pre tento výpočet názov Laplacovo pravidlo.

Teraz však späť k lotériovej otázke z úvodu. Ak vám dám 100 eur, kúpite si zopár (napr. 10) žrebov. Na základe výsledku budete vedieť solídne odhadnúť, aká je pravdepodobnosť výhry, teda budete vedieť, koľo žrebov si budete môcť kúpiť za výhry (a následne žrebov dodatočne bude možné kúpiť z druhej, tretej, … vlny výhier).  Ak si dáte to pomeru aj (primernú) výhru k cene nového žrebu viete pomerne presne dohadnúť, koľko žrebov vlastne budete môcť zotrieť.

Toto pravidlo má však aj oveľa praktickejšie využitie ako spomínané stiracie žreby. Môžete pomocou neho totiž odhanúť šance akéhikoľvek javu, ktorý sa v živote deje často, ale vy s ním nemáte doposiaľ (skoro žiadnu) skúsenosť. Ako presné sú príchody vlakov, ak ste sa presťahovali do novej krajiny a doposiaľ ste v nej vlakom šli len zopár krát? Ako spoľahlivý je finančný partner, ktorý vám doposiaľ uhrádzal len niekoľko platieb? Ako dochvílny bude nový kolega na základe niekoľkých stretnutí, ktoré ste mail? Všade tam, kde máme málo skúsenosti, ale potrebujeme odhad pravdepodobnosti, Laplacovo pravidlo nám výborne poslúži,

A predsa sa točí…

presypacie_hodinyPravdepodobnosť určitého javu však nie je jedinou vecou, ktorú musíme v bežnom živote odhadovať z pomerne nízkeho počtu vstupných dát. Osobitnou oblasťou ľudských odhadov je snaha o odhad budúceho trvania, najmä pre veci ktoré už bežia. Koľko bude nízka nezamestnanosť, ktorú teraz máme? Koľko rokov bude žiť ešte Kim-Čong-Un? Ako dlho bude ešte fungovať Facebook?

Aj tejto otázke sa pokúšali stredovekí matematici dať ľudstvu nástroj na jednoduchý odhad. Hoci pravidlo je porovnateľne jednoduché, otvorene treba povedať, že aj výrazne menej presné.  Tzv Kopernikovo pravidlo znie:

Ak nemáte žiadne iné údaje o podstate daného javu, tak potom najpresnejší odhad trvania je predpokladať, že jav sa nachádza aktuálne presne v polovici svojho celkového trvania a teda, že celkovo bude trvať ešte toľko, koľko už trval doposiaľ.

Ak si okamžite vybavíte 75 ročného človeka, takáto rada pre odhad dĺžky jeho života je zrejme až tragikomická. Problémom v tomto ohľade je, že odhad, že 75 ročný človek by mal žiť ešte ďalších 75 rokov nám príde absurdný len preto, lebo niečo vieme o strednej dĺžke života človeka. Ak by na zemi pristáli Marťania a stretli 75 ročného človeka, pre nich by naozaj najpresnejším odhadom dožitia človeka bolo predpokladať ďalších 75 rokov. Prečo je to však vlastne tak? Prečo predpokladá Koperníkovo pravidlo, že človek má ešte raz toľko pred sebou?

Pre ľudí znalých štatistiky je odpoveď pomerne jednoducho uchopiteľná. Pointa je, že keď Marťan stretne pozemšťana v našom vyššie uvedenom prípade, nevie v ktorej časti života sa človek nachádza. Keďže stretol náhodného človeka, to v akej fáze života ho stretol podlieha normálnemu, Gaussovému rozdeleniu. V tom však platí, že najpravdepodobnejšia hodnota je hodnota presne uprostred. Z toho aj plynie, že ak stretávate ľudí, tak najviac ľudí štatisticky stretnete v ich strednom veku. Ak teda neviete nič o (štandardnom) trvaní javu, na ktorý sa pozeráte, ale potrebujete odhad toho, koľko trvá, nuž predpokladajte, že ešte raz toľko ako doposiaľ.

— Tento blog je súčasťou seriálu o Menej známych algoritmoch v dátovej analytike. Ak si chcete prečítať aj iné články z tohto seriálu, nájdete ich tu. Ak ešte nie ste členom MOcnedata.sk komunity zadarmo sa zaregistrujte tu a budete dostávať aj rozšírene materiály k týmto blogom. —