Lietadlá ukázali famózny výsledok

Ak lietate často, občas narazíte v lietadle na ľudí, ktorí sa lietania boja. Niektorí sa modlia, in sa snažia zaspať, prípadne si dodať guráž nejakým alkoholom. U niektorých zašla fóbia tak ďaleko, že radšej nelietajú vôbec. S trochou odstupu možno povedať, že ide o absolútne iracionálny strach. Na cestách každoročne zomiera násobne viac ľudí ako v lietadlách, ale nepoznám nikoho, kto by zo strachu nesadol do autobusu alebo sa modlil celú cestu. Rok 2017 opäť ukázal ako nezmyselná je táto obava.

Ešte než sa pustíme do samotnej podstaty článku, dovoľte mi krátky experiment. Doprajte si chvíľu na rozmyslenie a skúste si spomenúť: “Kedy naposledy ste zachytili správu, že zomreli cestujúci pri páde alebo nehode lietadla nejakej aerolinky?”

A]  za posledný týždeň

B] za posledný mesiac

C] za posledného pol roka

D] za posledný rok

E] za posledných 5 rokov.

Úprimne, skúste sa nad tým zamyslieť, bez toho, že by ste googlili. Ak patríte do väčšiny (správami zdecimovanej) verejnosti, hádali ste niektorú z možnosti A] až D]. Ja sám som tipoval možnosť D. Ďalší odsek vás presvedčí, ako hlboko máme tento stereotyp vrytý do podvedomia.

pristatie

Podľa aktuálne publikovanej správy organizácie Flight Safety Foundation, rok 2017 bol naozaj výnimočný. Počty ľudský obetí z komerčných letov klesajú už dlhodobo, ale v roku 2017 sa podarilo dosiahnuť  skutočnú nulu. Počas celého roka 2017, na celej planéte nebola ani jedna udalosť, kde by zomrel čo i len jeden pasažier prúdového lietadla pri preprave leteckou linkou. Hoci číslo obetí dlhodobo klesá, absolútnu nulu táto štatistika dosiahla vôbec prvý krát za celú históriu lietania. Pre korektnosť je potrebné dodať, že štatistika meria nehodovosť iba komerčnej prepravy pasažierov prúdovými lietadlami. (súkromné lety menšími  vrtuľovými lietadlami, preprava nákladu alebo vojenské lety do tejto štatistiky nespadajú). Nejde však o žiaden trik s číslami, lebo práve letecká preprava pasažierov prúdovým lietadlom je to, čo vás čaká, keď najbližšie poletíte na dovolenku alebo na výlet niekam aspoň 1000 km. Turbovrtuľové lety sa totiž používajú už iba vyhliadkové lety a prepravu na krátke vzdialenosti do 700 km, kde prúdové lietadlo nestihne vystúpať do patričnej výšky, aby prúdový let bol rentabilný.

Že nejde o náhodu a v roku 2017 sme proste mali len šťastie, dokumentuje ďalší ukazovateľ, ktorý organizácie na vyšetrovanie leteckých nehôd monitorujú. Okrem celkových obetí na životoch sleduje sa aj počet nebezpečných incidentov. Ide o situácie, keď lietadlo zažilo nejakú skutočnosť, ktorá ohrozila bezpečnosť letu (napríklad porucha počas letu, zrážka s vtákmi alebo núdzové pristátie). Každá letecká katastrofa je zároveň aj nebezpečným incidentom, zmena v počte incidentov hovorí niečo aj o riziku fatálnych havárií. Podľa iného reportu sa podarilo počet nebezpečných incidentov udržať v kontinuálnom poklese a to dokonca napriek neustále rastúcemu počtu letov. (z dostupných údajov som vám pripravil graf, ktorý to jasne dokumentuje). To dáva nádej, že dosiahnutá nula nie je šťastná zhoda okolností.

LETECKE incidenty

Podľa komentárov expertov je zaujímavé, že  bezpečnosť úmerne stúpa na trhoch, kde je premávka lietadiel intenzívna. Ak by ste vyššie uvedenú testovaciu otázku položili Američanovi, ani jedna z odpovedí by nebola správna. Posledný pád lietadla s ľudskými obeťami tam mali až v roku 2009. Aj keď je pravda, že občas majú piloti  naozaj “na mále” (pozri video), ale opäť sa potvrdzuje, že neplatí že by väčší počet letov zvyšoval šancu na letecké nešťastie. Naopak hustota prepravy buduje návyk na vychytanie múch, ktoré sa zanedbajú pri menej frekventovaných letiskách alebo menej skúsených aerolinkách.

Nielen v celej Európe, ale dokonca na celom svete, nezomrel ani jeden cestujúci komerčnej aerolinky. Na druhej strane okrem Monaka v Európe neexistuje štát, kde by ročne na cestách nezomrel aspoň jeden človek. Áno aj v San Maríne, či Andorre zomrie ročne niekoľko ľudí pri autohaváriách. V celej Európe je to pri tom spolu ročne viac ako 80.000 ľudí. Napriek tomu, sa nikto netrasie strachom pri štartovaní autobusu alebo osobného auta. Letecká doprava opäť ukázala svoju profesionalitu. Optimizmus by nám mali dodať aj slová Johna Coxa, bývalého pilota a toho času vyšetrovateľa leteckých havárií : “Úlohou najbližšieho desaťročia bude z dosiahnutej nuly v počte mŕtvych vytvoriť štandard.” Zostáva dúfať, že jediným nepríjemným letom bude, keď niekto “vyletí zo zamestnania”.

V čom sa 8 ročné dieťa smeje neurónovým sietiam?

Hoci by aktuálny mediálny povyk mohol naznačovať opačný dojem, neurónové siete v skutočnosti zatiaľ ovládli len časť nášho inteligenčného spektra. Áno, existujú oblasti, kde už dostávame na frak, ale naopak sú oblasti, kde schopnosti umelej inteligencie nestačia ani na úroveň osemročného dieťaťa, nieto ešte na úroveň vysokoškolsky vzdelaného jedinca. Poďme si teda rozobrať kategóriu po kategórii, kde sa AI nachádza. Pre lepšiu orientáciu čitateľa pridávam hodnotenie 0 až 10 bodov, pre ohodnotenie úrovne pokrytia danej témy. Uvedené hodnotenia sú mojim expertným hodnotením a nie sú doložené detailným výskumom témy.

Optické rozpoznanie objektov [8/10]

rozpoznanie objektovRozloženie obrázkov alebo videa na komponenty a ich rozpoznanie zvládajú neurónové siete už na veľmi vysokej úrovni presnosti. Algoritmy na vyhľadávanie objektov alebo ľudí z obrazu už sa stávajú takmer komoditou. Napriek tomu zostávajú niektoré oblasti, kde optické rozpoznanie stále pokrivkáva. Ide napríklad o čítanie rukou písaných textov, bio snímkov alebo špeciálne upravovaných obrazcov. Najlepším dôkazom toho, že AI ešte nedosiahla na ľudskú úroveň je fakt, že práve Captcha (špeciálne upravené obrázky) sa používajú na odlíšenie ľudí od strojov pri registrácií alebo prihlasovaní na stránkach.

Prepis hlasu do písaného slova [9/10]

rozpoznanie hlasuZapísanie hovorenej reči do textu je jednou z pých umelej inteligencii, aspoň v západných jazykoch. Práve preto, že slová sa skladajú z hlások a zoznam slov je daný slovníkmi, vyhľadať kombináciu písmen, ktorá sa najviac podobá na to, čo zaznelo, je pre počítače pomerne jednoduchá úloha. Určitou prekážkou v tomto ohľade zostávajú dialekty (ani google translate nezná hutoric) a jazyky, kde sa slová neskladajú z hlások (znakové písma) alebo kde ten istý zvuk má veľa významov podľa intonácie alebo podľa kontextu vo vete (mandarínčina).

Porozumenie významu textu [6/10]

neuneurolinguisticke programovanieHoci konvertovať reč do textu je pre neurónové siete pomerne jednoduché, porozumieť tomu, čo vlastne chceme povedať, vedia siete stále len pomerne slabo. Skladanie slov do viet totiž má za následok exponenciálny rast počtu učiacich prípadov (viď princíp učenia), ktoré treba sieti predložiť, aby sa naučila s textami pracovať. Vety ako „Tak Ti pekne ďakujem“ totiž môžu mať presne opačný význam a počítače zatiaľ len slabo dokážu rozoznať iróniu, vtip alebo iné emócie v našom verbálnom prejave. Koniec koncov ani my, ľudia, sme si niekedy nie úplne istí, či to ten druhý myslel vážne alebo to bola len nadsádzka.

Simulácia ľudského pohybu [3/10]

krasokorculovanieSchopnosti umelej inteligencie konkurovať človeku v pohybovej kultúre možno viacerých z vás zaskočia. Hýbajúce sa roboty totiž boli v histórií jedným z prvých prejavov techniky. Ak by ste sa však pozreli veci “bližšie na kobylku”, zistili by ste, že roboty po nás dokážu opakovať len veľmi limitované pohyby. Ak by ste chceli naprogramovať robota, ktorý chodí po lane, lyžuje v ľubovoľnom teréne alebo robí krasokorčuľovanie, pochopili by ste ako v plienkach táto oblasť umelej inteligencie stále je. Jedným z problémov týchto odvetví je aj fakt, že neexistuje dostatočne rozsiahly počet detailné popísaných príkladov týchto javov (neexistuje databáza pokusov chodenia po lane alebo detailný popis fyzikálnych parametrov krasokorčuľovania).

Pochopenie ľudských emocií [2/10]

ludske emocieNapriek tomu, že neurónové siete dokážu prepísať náš prejav do textu, rozložiť text na jednotlivé vety a ich význam, práca s emóciami je stále relatívne v začiatkoch. Pustite človeku nemé video iného človeka a on vám poľahky povie, ako sa ten druhý cíti. Prejavov tej istej emócie je však tak veľa, že stroje zatiaľ nestačili poňať. Ak zoberieme len gestá (napr. bulharské kývanie hlavou vs. slovenské kývanie hlavou), ich interpretácia závisí od kultúry a ďalšieho kontextu. Ten istý pohyb slúži v karate na začatie boja a v hovorovej reči na rázne ukončenie diskusie. Tu čaká AI ešte naozaj dlhá cesta. Aj 8 ročné dieťa by porazilo v čítaní emócií najkvalifikovanejšie AI nástroje.

Rozhodovacieho a odporúčacie algoritmy [9/10]

rozhodovanieNaopak oblasť rozhodovacích procesov je už takmer na svojom strope. Takmer ľubovoľný rozhodovací proces už dnes troje dokážu robiť porovnateľné alebo lepšie ako ľudia. Hlavným dôvodom pre rýchly progres Ai v tejto oblasti je, že samotní ľudia väčšinou používajú jednotky parametrov, keď sa o niečom rozhodujú, takže latka pre stroje bola postavená pomerne nízko. V oblasti nákupných rozhodnutí a preferencií (napríklad súvisiace produkty, podobné knihy alebo hudba, …), kde je veľa podkladových dát už stroje vedia o nás viac ako vieme sami o sebe.

V seriály neurónových sietí si prečítajte aj ďalej:

Ako začali neurónové siete a prečo fungujú?

Akú máme vlastne alternatívu voči umelej inteligencii? 

Koľko rôznych druhov neurónových sietí vlastne poznáme? [coming soon]

Ak ste sa k našej sérii blogov o neurónových sieťach dostali neskôr a chceli by ste ju čítať od počiatku, začnite tu.

Akú máme vlastne alternatívu voči umelej inteligencii?

Umelá inteligencia a jej uplatnenie v čoraz väčšom počte odvetví nášho života sa na nás hrnú každý deň. Prečítať si ekonomický časopis bez zmienky o AI, alebo s ňou súvisiacich tém, už ani pomaly nie je možné. Slovami pospolitého ľudu: “otvorím chladničku a sa bojím, že aj odtiaľ na mňa vyskočí umelá inteligencia”. (Čo sa mimochodom deje.) Ak máte aspoň špetku kritického myslenia v sebe, položíte si zrejme tú istú otázku ako Bobek otcovi Bobovi na povel o vstávaní a cvičení: “Ale prečo?!” (pre mladšie ročníky pripájam video na vysvetlenie)

Ako to už chodí, profesionálna slepota je pomerne silný jav. Neobišiel ani mňa. Denne musím rozmýšľať, ako vytvoriť alebo zlepšiť prediktívne modely a strojové uvažovanie. Preto postrčenie o tom, že prečo sa vlastne rútime touto cestou, som dostal od nečakaného autora. Naša komunikácia sa krásne vinula, keď zaznela tvrdá a dobre mierená otázka “Prečo ako ľudstvo investujeme toľké peniaze do toho, aby niečo iné bolo lepšie ako my? Kam by sme sa mohli posunúť, keby sa všetky tieto miliardy investovali do rozvoja ľudského intelektu?” Nadýchol som sa, že spustím niektoré z jasných výhod AI a … potom som prehltol danú vetu uprostred. To je vlastne fakt. Je k tomuto trendu alternatíva?

Bolo krásne jesenné popoludnie a my sme sa prechádzali so psami po jednom z nie mnohých Bratislavských parkov (btw, viete koľko stromov je v BA?). Snažil som sa svojej skvelej žene, ktorá je už niekoľko rokov uznávaným trénerom ľudských soft skills pre jednu veľkú firmu, popísať príklad AplhaGo a jej víťazstva nad majstrom sveta v hre GO. (tomuto prípadu sa mimochodom v našom seriáli o neurónových sieťach ešte budeme venovať). Pokojne si ma vypočula. Potom zastavila krok, pozrela sa na mňa bokom a spýtala sa: “Prečo ako ľudstvo investujeme toľké peniaze do toho, aby niečo iné bolo lepšie ako my? Kam by sme sa mohli posunúť, keby sa všetky tieto miliardy investovali do rozvoja ľudského intelektu?” Ako každý manžel na – pre mňa nepochopiteľné – nápady a postrehy svojej polovičky už som privykol. Ešte než sa však zo mňa vysúkala  odpoveď, musel som si priznať, že takto som sa na to pozeral. Existenciu umelej inteligencie som pokladal za akosi samozrejmú, rovnako ako drevorubač nerozmýšľa nad recykláciou papiera.

Táto provokatívna otázka ma donútila zamyslieť sa nad tým, či vôbec a akú vlastne máme alternatívu voči umelej inteligencii. Ale hlavne: Prečo sa ako ľudstvo tak pachtíme za pokrokom v umelej inteligencii? Nuž tak sa na to skúsme pozrieť spolu:

Prapôvodná motivácia

Na počiatku počítačov a ich užitočnosti bola túžba spočítať veci, pri ktorých sa človek môže mýliť. Hlavne komplikované výpočty na veľa desatinných miest. Jedinou alternatívou tej doby totiž bol papier a súčet pod seba. Voči tejto ambícií sa ťažko namieta, lebo vieme, že ľudia sú omylní. Férovo však treba dodať, že najmä bežní jedinci bez tréningu. Vystríhať sa chybám totiž dokážeme natrénovať. Dôkazom toho je team, ktorý som mal tu česť viesť v Poštovej banke. Asi tucet dám v strednom a staršom veku mali za úlohu denne každá pretypovať viac ako 10 000 dokladov o vkladoch a prevodoch z bankových účtov, ktoré klienti vypísali rukou. Napriek tomu, že išlo o monotónnu prácu (predstavte si, že prepisujete 8 hodín denne čísla z papiera do počítača), ich chybovosť bola na úrovni stotín promile. Teda jednu chybu urobili v priemere tak každý druhý týždeň. Ak k tomu pridáte krížovú kontrolu 4 očí, sme na úrovni jedna z 10 miliónov. Omylnosť teda nie je neprekonateľný argument.

Paradoxne, druhou motiváciou, ktorá podnietila výrazný rozvoj dopytu po počítačovej inteligencii, bola snaha ukryť niečo pred ostatnými ľuďmi. Šifrovanie a prelomenie šifier bolo výrazným impulzom pre výpočtovú techniku. Treba si uvedomiť, že tento motív bol zároveň prvým, ktorý bol namierený priamo proti ľuďom. Na prvý pohľad teda ťažko hľadať alternatívy. Idealistickejšia duša by mohla namietať, že keby sme si ako ľudstvo viac dôverovali, nebolo by treba šifrovať. Ale to je tak široká téma, že asi ťažko dúfať v úspech, keď aj triviálne správy zo svojho života sme vždy posielali v zalepenej obálke. Potreba šifier proste súvisí s možnosťou manipulovať druhými. A tej sa ľudstvo proste nechce (a zrejme tak skoro ani nebude chcieť) vzdať.

Tak sme sa postupne prepracovali k tretej motivácií, ktorá viedla ľudstvo k masívnemu používaniu počítačov: pohodlnosť. Tak ako iné stroje, aj počítače vhodne brnkli na našu strunu komfortu, či priam lenivosti. Iste, aj človek dokáže vyskúšať hľadať riešenie numerickej optimalizácie, ale keď môže dosadiť do rovníc 20 000 rôznych alternatív počítač, prečo by sa s tým páral nejaký smrteľník, nie? Najútrapnejšie na tom celom je, že dôvodom pre použitie počítačov nebola vyššia inteligencia počítačov pri hľadaní správnych riešení, ale hrubá sila. (rýchlosť akou dokázali zadať veľa zlých riešení, aby ich vylúčili až kým nenájdu tie správne) Pri tom, vo svojom živote som stretol hneď niekoľko ľudí, ktorí oplývali výnimočným talentom na bleskové výpočty. Mladšie ročníky možno zas prekvapí, že aj na výpočet odmocniny existuje „papierový postup“, takže ju vieme (v hlave) zrátať úplne bez kalkulačky.

Iste, zrejme aj s rozsiahlym tréningom by nik z ľudí nebol schopný zrátať milióny výpočtov za sekundu, ako sú schopné dnešné moderné procesory. Ale pre korektnosť diskusie treba povedať, že aj najvyspelejšia umelá inteligencia dospela k tomu, že nie je efektívne budovať stále väčšie a väčšie procesory, ale je nutné zapriahnuť viacero bežných procesorov do spoločného výpočtu. Ak teda zoberiete do úvahy, že iba jednotky percent ľudí sa živia tým, že niečo celý deň v hlave počítajú, stále sme mali aj ako ľudstvo rezervy, na ktoré sme nesiahli, kým sme sa vrhli na pospas umelej inteligencii. V tomto duchu úvaha mojej manželky naozaj zostáva na zamyslenie: Prečo sa ľudstvo rozhodlo budovať lepšiu elektrónkovú krabicu než zlepšovať inteligenciu ľudí okolo nás?

Klinec do rakvy

klinecTo všetko by sa dalo ešte zvrátiť, keby v tom celom procese ľudstvo neurobilo ešte jedno podstatné rozhodnutie. Dlhé desaťročia zamestnávala inžinierov a technikov snaha nahradiť čo najviac manuálnej práce robotmi. Na začiatku 90tych rokov svoje úsilie viac menej dokonali a tak ich, ľudovo a trochu vulgárne povedané, začali „opäť žrať mrle“. A tak výskumné centrá po celom svete sa postupne vrhli najprv na simulovanie, neskôr na kopírovanie, ľudských rozumových procesov. Aby to bolo možné, museli najprv stroje skopírovať naše kognitívne zmysly. Tak sme naučili počítače najprv čítať text, potom analyzovať hlas a obrazový vnem, tak ako to robíme my. Len čo stroje boli schopné „vnímať okolie“, začali sme ich učiť jednoduché vzorce rozmýšľania. (ak klesne teplota pod túto hranicu, tak spusti kúrenie, …) Avšak keďže ani svoj proces rozmýšľania nemáme detailne popísaný, čoskoro sme narazili na problém, že niektoré postupy nevieme pre počítače zapísať jednoduchou algoritmickou ak-tak reťazou. Tak sme sa rozhodli nechať počítač skúšať daný krok toľko krát až sa to (opakovane) naozaj podarí a nechať ho odvodiť si pravidlá, ako má rozhodovanie fungovať. Oblasti, kde sme dodnes nie schopní poskytnúť počítaču dostatočné podklady na jeho pokus-omyl učenie, zatiaľ počítače nezvládajú.

Kam to (na)smeruje(me)

Z vyššie uvedených faktov je zrejmé, že nástup umelej inteligencie nebol nevyhnutný, a tento vlak sme do stanice nasmerovali my ľudia. Najprv netrpezlivosťou k vlastným omylom, neskôr podozrievavosťou k ostatným ľuďom a nakoniec „lenivosťou“ k opakovaným mentálnym úkonom. Bez toho, že by som bol nejaký rojko, nie som si úplne istý, či ľudské schopnosti dostali férovú príležitosť „dorovnať“ umelú inteligenciu.

Keďže aktuálne už sme pokročili opäť o krok ďalej, dnes už vyvíjame univerzálnu umelú inteligenciu, ktorá dokáže rozmýšľať nad tým, či správne rozmýšľa. Existuje už dokonca niekoľko rôznych spôsobov, ako počítače učiť ľudské postupy. Áno, zostáva niekoľko oblastí, kde zatiaľ nie je jasné, ako ich stroje naučiť, ale stačí jeden či dva výskumné projekty, ktoré si dajú tú námahu zozbierať dosť (rozumej milióny) príkladov na daný jav a aj tieto nedokonalosti budú prelomené. Nech sa na to pozerám z ľubovoľného hľadiska, „džin je von z flaše“ a proces dorovnania a následne prekonania ľudského rozmýšľania pomocou strojov je neodvrátiteľný. Aké možnosti nám teda ešte zostávajú?

Tá najnaivnejšia alternatíva je to celé zastaviť. Zostáva ešte niekoľko schopností, ktoré stroje nemajú a nebudú ich mať, kým im ľudia neukážu, ako sa ich naučiť. Ale keď to čítam po sebe, pripadá mi to ako výzvy na zbúranie strojov, ktoré mali zobrať prácu robotníkom pri predchádzajúcej priemyselnej revolúcii. Tento scenár pokladám za vrcholne nepravdepodobný.

Druhou možnosťou je použiť vyvinutú umelú inteligenciu, aby spätne podporila rozvoj ľudí. Ak si spomeniete na rok 1996, keď Gary Kasparov hral proti počítaču, prvú hru prehral. Medzi svojimi súčasníkmi nemal ľudského oponenta, ktorý by ho priviedol tak do úzkych. Pod stimulom tvrdého počítačového oponenta sa však dokázal vypäť k ešte väčšiemu výkonu a celkovo počítač poraziť. Ak by sme teda použili umelú inteligenciu na stimuláciu ľudského rozvoja, v niektorých oblastiach by sme dokázali opäť získať prevahu. To by však znamenalo pridať do AI vrstvu, ktorá vysvetľuje človeku nové princípy, na ktoré „sama prišla“.

čipTreťou možnou alternatívou k dominancii umelej inteligencie je vyskúmať, ako umelú inteligenciu včleniť do tej ľudskej. Teda nájsť spôsob ako náš biologický mozog môže (pomocou implantátov) byť doplnený o ďalšie vrstvy z umelej inteligencie. S veľkou mierou nadsádzky by sa to dalo prirovnať k tomu, keď do foťáku vložíte pamäťovú kartu. Týmto spôsobom by všetky úspechy AI sa stali okamžite aj rozšírením ľudského potenciálu. Tento princíp v sebe skrýva mnohé morálne riziká (kto bude mať právo programovať hlavy iným), ale na druhej strane odvracia hrozbu nadvlády strojov nad človekom.

Tak či tak …

Napriek povzbudeniu v predchádzajúcich odsekoch, obávam sa, že nemám happy-end pre tento príbeh. Aby sme totiž mohli aspoň čiastočne vrátiť späť ručičku na váhach inteligenčných schopnosti smerom k ľudstvu, potrebovali by sme dva dôležité predpoklady: A] Zdroj informácií nezávislý od počítačovej infraštruktúry (ináč časom nebudeme vedieť rozlíšiť, čo je skutočný fakt a čo je počítačom vygenerovaný údaj). Teda v skutočnosti presne opačný odklon od cloudu, do ktorého smerujeme. A k tomu B] rýchlu replikovateľnosť poznania medzi ľuďmi, najmä naprieč generáciami. Na rozdiel od strojov, ktorým sa naše schopnosti stačí naučiť raz a potom si ich pre budúce stroje uložiť do pamäte, my, ľudia, sa musíme celé poznanie ľudstva naučiť v každej generácii znova. V oboch prípadoch síce existujú teoretické riešenia, ale nevidím ich na horizonte najbližších rokov. Vzhľadom na rýchlosť napredovania umelej inteligencie, by sme sa teda mali pripraviť na scenár, že dosiahneme singularitu (pozri viac tu) a spoločenské javy z nej plynúce. Tie najbližšie, ktoré si rozoberieme aj tu na mocnedata.sk sú silná vlna nezamestnanosti a kríza kariérneho smerovania.

Diel 2. – Prečo neurónové siete skutočne fungujú?

Aby diskusia o trendoch 2018 v neurónových sietí dávala zmysel, je dôležité, aby sme všetci boli aspoň na podobnej úrovni pochopenia ich podstaty. Tento blog teda berie neurónky od gruntu a vysvetľuje (možno tým menej zasväteným), ako neurónové siete fungujú. Pre skúsenejších deep minerov môžu nasledujúce odseky prísť trochu triviálne.

 

Miesto pod Slnkom

miesto pod slnkomAk by sme si dali dostatočný počet krokov späť a pozreli sa na oblasť dátových analýz (a predpovedí) naozaj zo široka, mohli by neurónové siete “splynúť v dave”  s inými formami analytických postupov. Aby sme sa tejto začiatočníckej chybe vyhli hneď na začiatku, začneme tým, že vysvetlíme, čo oprávňuje neurónové siete mať vlastne miesto pod Slnkom.  Cieľom neurónových sietí je na základe určitého množstva vstupných informácií dospieť k rozhodnutiu. (napríklad na základe informácií o novom, neznámom človeku rozhodnúť sa, či je chybou pozvať ho/ju na rande). Tento základný mód “daj mi vstupy, poviem Ti ako sa rozhodnúť” majú neurónové siete ešte spoločný s inými typmi data mining algoritmov ako sú rozhodovacie stromy, regresie či support vector machine. (súborne sa nazývajú aj strojové učenie alebo Machine Learning). Tou podstatnou deliacou čiarou je, že zakiaľ každý z postupov Machine Learningu si bude od vás pýtať zoznam kritérií, na základe ktorých chcete aby sa rozhodol, neurónové siete si vypýtajú len hrubé fakty a faktory rozhodovania si už vytvoria sami. Ak by sme to premietli do vyššie zmienenej analógie s rozhodovaním o rande, tak Machine learning (napr. rozhodovací strom) bude chcieť od vás, čo všetko (by) ste vy sami zohľadnili, keď sa rozhodujete medzi viacerými adeptmi na rande (napr. je vtipný, je mi vekom primeraný, máme spoločné hobby, má deti s inou, …). &neurónové siete si dokážu odvodiť takéto faktory rozhodovania, bez toho, že by ste ich museli pomenovať (napr. prídu na to, že muži po 50ke, žijúci na vidieku, veľmi často majú deti s inou. A to vám akosi nepasuje do schémy :).

Pre človeka, ktorý nepracoval detailne s neurónovými sieťami, tento rozdiel medzi rozhodovacím stromom a neurónovou sieťou môže pripadať ako drobný. Skutočná hĺbka tohto rozdielu však spočíva v tom, že keďže neurónové siete nepotrebujú vedieť faktory dôležité pre rozhodnutie. Dajú sa teda použiť aj na otázky, v ktorých my sami ľudia nevieme úplne presne, ako vybrať najvhodnejšie riešenie. Inak povedané, neurónové siete by vedeli vybrať relatívne dobrého partnera na rande aj pre ľudí, ktorí nevedia, na základe čoho sa rozhodnúť. Rozhodovací strom bez faktorov, na základe ktorých sa rozhodovať – to by dopadlo rovnako katastrofálne ako v bežnom živote dopadajú ľudia, čo nemajú jasno v kritériách, koho pozvať na rande.

Pre úplnú korektnosť témy treba povedať, že teoreticky aj machine learning modely môžeme “nakŕmiť” len hrubými faktmi rovnako ako neurónové siete. Ale ich výsledky však budú zväčša citeľne horšie, ako dosahujú (dobre natrénované) neurónové siete s rovnakými vstupmi. (Teda napríklad rozhodovací strom odhalí, že čím je muž starší vekom, tým je väčšia šanca, že má deti s inou, ale už nemusí postrehnúť, že táto tendencia sa inak prejavuje pri odlišnej farbe pleti (rôzne národy majú odlišné rodinné pomery)). Rovnako treba povedať, že aj sloboda neuróniek samostatne si vytvárať faktory pre rozhodovanie prestane byť výhodou, ak nie je umožnené sieti vytvoriť dostatočný počet vlastných rozhodovacích vrstiev (o tom však neskôr). Ak necháme bokom tieto extrémy, za priaznivých okolností je postup neurónových sietí inteligenčne nadradený bežným machine learning postupom. Mal by preto dosahovať aj vyššiu presnosť rozhodovania. A to dokonca v oblastiach, kde my ľudia nevieme, aké je optimálne riešenie. To je zrejme jeden z dôvodov prečo začínajúci Data Scientisti túžia pracovať na neurónových sieťach a naopak na “bežný machine learning” sa pozerajú trochu s dešpektom.

Ako to vlastne funguje

Tých menej zasvätených možno prekvapí, že podobne ako mobilný telefón alebo CDčko, neurónové siete predbehli svoju dobu a prišli dávno pred tým, než sme ich začali masovo používať. Prvé primitívne neurónové siete boli zostrojené už takmer pred 70 rokmi. Teda ešte v čase, keď čísla do počítačov sa zadávali cez dierne štítky a o disketách, či USB kľúčoch sa ešte ani nechyrovalo. Zlomom vo vývoji bol vynález  postupu Spätnej distribúcie chyby (back propagation), s ktorým prišiel Geoffrey Hinton z Toronta v roku 1986. Tento princíp si zachviľu rozoberieme podrobne, poďme však poporiadku:

Ako to fungujeDôvodom, prečo sa neurónové siete tak volajú, je fakt, že v teoretickej podstate vychádzajú z modelu ľudskej neurónovej bunky. Aj keď v hlave máme rôzne typy neurónov, vo všeobecnosti možno o nich povedať, že každý neurón má jedno, či viac spojení, ktoré prinášajú vstupné vzruchy (v našej hlave sú to chemicko-elektrické signály) a jeden či viac výstupných spojení s ďalšími neurónmi (do ktorých sa prenáša výsledok “rozhodnutia” daného neurónu). Niekde v hlave teda máme aj neurón, ktorý zoberie do úvahy, či daný potenciálny partner na rande má “deti s inou” a zvýši alebo zníži tým šance daného jedinca byť pozvaným na rande. Počítačové neurónové siete fungujú podobne. Majú niekoľko vstupov, cez ktoré im pošleme informácie a jeden či viac výstupov, kam pošlú svoje rozhodnutie. Dôležité pritom je, že jeden neurón sa dlhodobo špecializuje len na jedno rozhodovanie. Teda ten istý neurón, ktorý zapracuje informáciu o iných harantoch potenciálneho partnera, nebude za hodinu rozhodovať o tom, či vonku sneží alebo prší.

Spôsobom, ako sa každý jeden neurón rozhodne, sa nazýva aktivačná funkcia. V našej hlave (a pôvodnom primitívnom modeli neurónovej siete) sa predpokladá, že vstupy sú len binárne (má deti s inou /nemá deti s inou). V takom prípade aktivačná funkcia vyžaduje určitý minimálne počet vstupných podmienok aby bolo splnených, aby neurón povedal finálne áno alebo nie. Ak napríklad pre stretnutie na rande zvažuje nejaká konkrétna dáma, či je muž pekný, vtipný a bohatý, môže si povedať, že musí spĺňať aspoň 2 z 3 alebo aspoň jednu z daných 3 podmienok.  V súčasnej dobe sa umelá inteligencia posunula tak ďaleko, že dokáže teoreticky pracovať so vstupmi aj číselnej či textovej povahy. Aktivačná funkcia, ktorá dáva na základe vstupov finálnu odpoveď, tak môže byť vo svojej podstate aj veľmi komplikovaná. Z praktických dôvodov sa preferujú také funkcie, ktorá sa dokážu rozhodovať “rázne a s istotou”. Cieľom je, aby čo najmenej rozhodnutí končilo niekde v strede pri “ani áno, ani nie” a aktivačná funkcia bola nútená povedať aspoň “skôr áno” alebo “skôr nie”. Pre matematicky zdatnejších je možné dodať, že takéto vlastnosti majú napríklad funkcie sin(x), hyperbolický tangens, AcrTan,  Inverzná odmocnina, ktoré preto často slúžia ako aktivačné funkcie v neurónových sieťach.

Hoci samotné rozhodnutia jednotlivých neurónov sú pomerne primitívne (deti s inou >>> skôr nepozvať na rande), poskladaním veľkého počtu neurónov do vzájomnej siete je možné kombinovať čiastkové rozhodnutia a tým dosiahnuť aj veľmi komplikované . V praxi teda neurónová sieť spravidla má niekoľko vrstiev na seba nadväzujúcich neurónov. Prvá vrstva napríklad môže zobrať ako vstup môj vek a vek potenciálneho partnera a ako výsledok vrátiť odpoveď, či sme si navzájom vekovo primeraný alebo nie. Ďalšia vrstva môže zobrať už hotovú vekovú primeranosť a rozhodnúť, či tento fakt zvyšuje alebo zhoršuje šance jedinca na rande (niektoré dámy majú napríklad slabosť na výrazne starších mužov, iné chcú na rande rovesníka). Aby si mohli medzi sebou jednotlivé vrstvy neurónov odovzdávať  čiastkové výsledky, je ešte potrebné nastaviť dôležitosť jednotlivých informácií. Pre niektorých môže vekový rozdiel predstavovať väčšiu prekážku, iní môžu byť tolerantnejší k tomuto aspektu. Dôležitosť odovzdávaného medzi výsledku pre ďalšiu vrstvu sa nastavuje pomocou koeficientu významnosti informácie (alebo aj váhy informácie). Každý výstup neurónu v jednej vrstve má priradenú váhu s akou sa zohľadňuje v ďalšej vrstve. To už sme sa prepracovali k najdôležitejšiemu princípu neurónových sietí.

Justicia by ShootyPred vynájdením spätnej distribúcie chyby (back propagation v angličtine) mali všetky siete vopred nastavené, pevné váhy medzi jednotlivými neurónmi. Sieť bola statická v čase. To spôsobovalo jav, ktorý by sme my ľudia nazvali asi tvrdohlavosť. Ak sa totiž o nejakom predloženom prípade rozhodla nesprávne, tým, že váhy boli konštantné, ak ste jej preložili ten istý prípad na opätovné posúdenie, opäť sa rozhodla rovnako nesprávne. To spôsobovalo, že tieto prapôvodné neurónové siete boli schopné sa rozhodovať len o veľmi primitívnych veciach, ktoré sa navyše nemenia v čase. Hintonova spätná distribúcie chyby umožnila presne to, čo mu mi ľudia hovoríme “poučiť sa na vlastných chybách”. Podstatou spätnej distribúcie chyby je totiž, že ak sa sieť pri učení pomýli, neurónová sieť prechádza spätne cez jednotlivé vrstvy a zistí, ktorá čiastková informácia spôsobila najviac odchýlenie sa od správneho rozhodnutia. Avšak nielen “vypátra vinníka”, ale na rozdiel od slovenskej justície, ho aj patrične potrestá. Upraví informačné váhy tak, aby tento čiastkový neurón mal väčší (alebo menší) vplyv na celkové rozhodnutie (niekedy môže totiž nastať chyba aj nedostatočným vypočutím niektorého neurónu, teda pre korekciu je potrebné zvýšiť jeho vplyv). Preto ak, napríklad, neurónovej sieti posunieme na posúdenie krásneho, bohatého a vtipného gay kandidáta na rande, ktorého sieť vehementne odporučí, ale my preferujeme heterosexuálne rande, tak vstupnému neurónu, ktorý nesie informáciu o sexuálnej orientácii, sa na základe spätnej distribúcie chyby upraví koeficient, tak aby zohrával významnú rolu v rozhodovaní.

Proces spätnej distribúcie chyby však funguje iba vtedy, ak sieti preložíme veľmi veľa prípadov na posúdenie. Keďže sieť sa učí len na svojich chybách, musí ich urobiť veľmi veľa, aby sa niečo naučila. Navyše jej musíme predložiť čo najviac “exotov”. Ak by sme jej posielali na posúdenie stále len toho istého kandidáta, tak po niekoľkých opakovaniach by sa už váhy nemali ako zmeniť. Jediný typ rande partnera, by nastavil váhy optimálne pre tento typ človeka. Opätovné predkladanie toho istého typu, by už váhy nedokázalo meniť, sieť by sa totiž už nemala ako mýliť. (tomuto javu sa hovorí aj pretrénovanie a pri stavbe skutočne kvalitných neurónových sietí je nutné proti nemu aktívne bojovať). Preto, ešte pred tým než je možné neurónovú sieť použiť na skutočné rozhodovanie (na ostro), je potrebné jej predložiť veľký počet (podľa možnosti čo najrozmanitejších) prípadov na vyladenie váh, aby sa sieť čo najpresnejšie naladila. Pre vytvorenie kvalitnej neurónovej siete je potrebné dodať rozmanité vstupy a čo najviac prípadov, kde vieme ako rozhodnutie má dopadnúť. Ak by som mal teda vytvoriť kvalitný model na výber partnera na rande, museli by ste mi predložiť čo najviac vecí, ktoré (možno aj podvedome) vstupujú do rozhodovania a dať mi rozsiahly listing ľudí, s ktorými by ste chceli alebo naopak vôbec nechceli ísť na rande.

Čo z toho plynie

Nutnosť vysokého počtu trénovacích (tzv. anotovaných) prípadov je jedným z dôvodov, prečo v týchto oblastiach umelá inteligencia ešte ani z ďaleka nedosahuje výsledky blížiace sa ľuďom. Je totiž jednoduché (a stroje už dnes vedia dobre) rozoznať naše emócie z fotky  (je pomerne ľahké dodať veľký počet ľudských fotiek s popisom akú emóciu človek na fotke vyjadruje). Je však omnoho komplikovanejšie pre všetky jazyky sveta dodať také množstvo textov, aby stroj presne odhadol našu emóciu v ľubovoľnom jazyku. Hlavne keď pre vety typu “Ty brďo!” sa skutočná emócia dá rozoznať iba na základe tónu hlasu alebo kontextu iných viet povedaných tesne pred alebo po tomto výroku. Vyššie spomenuté má za následok, že stroje budú vedieť iba to, na čo im ľudia predložia dostatočne veľa anotovaných podkladov.  To otvára niekoľko filozofických možností, ako s neurónovými sieťami do budúcna naložiť. Zároveň to vysvetľuje, prečo hry ako šach boli prvé, v ktorých stroje porazili človeka (každá šachová partia má jasne určeného víťaza a pomocou spätnej distribúcie chyby je možné každému ťahu priradiť vplyv na celkové víťazstvo v partii).

neural_network_examplePre odborné dokreslenie problematiky, v neurónových sieťach sa rozlišujú zvyčajne tri druhy vrstiev: vstupná vrstva (to sú neuróny, ktorú nesú pôvodné vstupné informácie, napr. vek, sexuálne orientácia, telesná výška potenciálneho rande partnera a pod.), skrytá vrstva (kde sú neuróny, ktoré používajú dostupné vstupy pre vytvorenie čiastkových rozhodnutí. Kvalitné neurónové siete môžu maj niekoľko desiatok  skrytých vrstiev, lebo musia zohľadniť veľa čiastkových vplyvov na celkové rozhodnutie. ), výstupná vrstva (ktorá obsahuje už neuróny dávajúce finálne rozhodnutie. Väčšina sietí je budovaná pre jedno výstupné rozhodnutie, ale neurónová sieť môže dodávať aj viac rozhodnutí naraz. Napr. či pozvať na rande a v ktorý deň v týždni pozvať na rande, do akého miesta rande situovať alebo akou formou komunikácie najlepšie pozvať daného človeka na rande)

Rôzne rozloženie (topológia) neurónov do vrstiev umožňuje špecializovať sa sietiam na konkrétne druhy úloh/rozhodnutí. Ak chcete naučiť robota variť, musí si napríklad pamätať  svoje vlastné, už realizované kroky a sledovať ich dopad (napr. omáčka mi pomaly hustne). Naopak ak chcete rozoznať, či je na obrázku opica, tak, čo bolo na predchádzajúcom obrázku, nie je pre rozhodnutie o tomto konkrétnom obrázku zrejme dôležité. V ďalších dieloch si preto povieme:

V čom sa 8 ročné dieťa smeje neurónovým sietiam?

Akú máme vlastne alternatívu voči umelej inteligencii? 

Koľko rôznych druhov neurónových sietí vlastne poznáme? [coming soon]

Ak ste sa k našej sérii blogov o neurónových sieťach dostali neskôr a chceli by ste ju čítať od počiatku, začnite tu.

Neurónové siete – 1.časť – Kto a prečo?

A čo by ste chceli robiť? Nuž ja by som chcel hlavne robiť s neurónkami. Aha, a ktorú oblasť neurónových sietí ovládate? Nuž skúšal som niečo v Kerase a TensorFlowe a chcel by som to robiť nad Big Data, lebo môj dataset bol len pár tisíc riadkov.

IPhone dátovej analytiky

Takto nejako vyzerá väčšina rozhovorov s kandidátmi, ktorí sa uchádzajú o prácu v mojom teame. Za posledné dva roky sa medzi kandidátmi rozmohla neutíchajúca túžba pracovať s neurónovými sieťami. Pri väčšine kandidátov však nadšenie nahrádza (neraz aj maskuje) skutočné znalosti tejto oblasti. Neurónové siete sú takým iPhonom dátovej analytiky. veľa sa o nich píše, každý túži s ním pracovať, ale nikto nevie prečo vlastne po ňom túži. Ak vás to ťahá k neurónovým sietiam a neviete prečo, tak tento seriál je aj pre Vás.

Je nespochybniteľnou pravdou, že Deep mining predstavuje akúsi vyššiu formu dátovej analytiky (prečo je tomu tak si ešte dnes vysvetlíme). Preto vzhliadanie  k neurónovým sieťam môže pre nezasvätených  pripadať prirodzené. Najmä ak váš zamestnávateľ od vás požaduje stále dookola “len nudné” Machine learning prediktívne modely. Problémom však je, že väčšina obdivovateľov neurónových sietí vidí túto oblasť ako prekrytie doposiaľ existujúcich (alebo v ich ponímaní doposiaľ zvládnutých) data miningových metód. Teda akýsi nový model, ktorý funkciami predčí ten pôvodný a každý, kto sa zapodieva “starým modelom” je buď nezorientovaný alebo priam nemoderný.

Ak  si spomeniete na veľký prieskum realizovaný v medzi expertmi na data analytiku, tak biznis potrebuje niečo iné ako “hrať sa s neurónovými sieťami”. Vo svojej podstate sa to dá prirovnať v situácií, keď mladý šofér príde na pohovor do dopravnej spoločnosti a plamenisto vysvetľuje ako to on s autami vie, dokonca sa mu podarilo niekoľko sekúnd ísť bokom iba na dvoch kolesách. Studenou sprchou mu je, keď sa od budúceho šéfa dozvie, že pri jazde s dodávkou sú situácie na dvoch kolesách dosť nevhodné a že v práci bude jazdiť pekne po 4 či dokonca 6 kolesách ako všetci ostatní na ceste.

Pripoj sa, kde sa Ti to hodí

Keďže každý z nás sa nachádza na krivke poznania neurónových sietí v inej polohe, tento seriál slúži na to, aby ste sa mohli pripojiť do príbehu vtedy, keď vám to vyhovuje. Tí z nás, čo už nejakú tu neurónku netrénovali, by zrejme pri úplných základoch zívali nudou. Nie je preto zmysluplné ich ťahať cez vysvetlenia základných princípov. Naopak, tí z vás, ktorí budú tento seriál považovať za nakopnutie k tomu, vyskúšať si po prvý krát na vlastnej koži neurónovú sieť by určite mali prelúskať aj základnými princípmi neuróniek, aby vedeli, čo im to vlastne pod rukami robí a či je výsledok aspoň trochu relevantný vzhľadom na pôvodný cieľ. Je preto možné, že seriál  o Neurónových sieťach nebudete čítať lineárne. To je v poriadku, môj blog totiž nemá ambíciu konkurovať odborným knihám v tejto oblasti. Veď hlavné je, že si z toho niečo odnesiete. A to je dôvod prečo blogy na mocnedata.sk vlastne píšem.

LetThereBeLight

 A boh povedal buď svetlo …

Áno tak, ako život sa vysvetľuje od stvorenia (či už BigBangovej verzie alebo tej z nadpisu tohto odseku), tak aj neurónovými sieťami by sme sa mali začať zaoberať od prvotných počiatkov a princípov. Bude nám to nevyhnutne treba pre pochopenie rôznych typov neurónových sietí, ktoré sa vyvinuli, ako aj pre pochopenie nedostatkov, s ktorými stále v neurónových sieťach bojujeme. Pre matadorov neurónového remesla zrejme nebude lákavé prechádzať si pojmami ako back-propagation či aktivačné fukcie. (aj keď myslím, že by ste to mohli skúsiť aspoň zo zvedavosti, lebo toto vysvetlenie je trochu nekonvenčné).

Preto pre znalých problematiky môžeme pokročiť k tomu, čo neurónové siete doposiaľ nezvládajú, napriek intenzívnemu rozmachu. Je to férové pojednávanie o tom, v čom nám stroje už dokážu prekvapiť  v čom, sa im 8 ročné dieťa ešte stále vysmeje do ich CPU/GPU. Táto rozprava nám bude zároveň slúžiť ako predpolie pre popísanie nových trendov, ktoré sa v oblasti neurónových sietí dejú. Niektoré vznikajú z nadšenia, niektoré z tlaku biznisu na vyriešenie nedostatkov, ktoré sú v praxi netolerovateľné.

Rozcestník ďalšieho čítania nakoniec ponúka alternatívu aj pre viac filozofické duše. V zaujímavom zamyslení – od pomerne nečakaného autora – vám sprostredkujem pohľad na to, akú mame vlastne alternatívu voči umelej inteligencii? Čo nástup AI znamená pre výchovu a vzdelávanie našich detí? V tejto línií nás zároveň čaká polemika o tom, či umelá inteligencia je naozaj len priemyselnou revolúciou 4.0 alebo to bude mať aj rozsiahlejšie významy.

Čo čítať ďalej:

Ako začali neurónové siete a prečo fungujú?

V čom sa 8 ročné dieťa smeje neurónovým sietiam?

Akú máme vlastne alternatívu voči umelej inteligencii? 

Ako na Nový rok, tak po celý rok

Iste poznáte slovenské príslovie “Ako na Nový rok, tak po celý rok …”, ktoré nás motivuje robiť prvý deň nového kalendárneho roku veci, ktoré chceme potom robiť počas celého roka. A tak po rannej prechádzke sa v posteli hrám so  svojim trojmesačným synom, poškuľujem po rozčítanej knihe a … píšem tento blog. Lebo v písaní blogov pre komunitu mocnedata.sk a jej anglickej verzie www.mightydata.com chcem aj v roku 2018 určite pokračovať. Aby to blogovanie malo hlavu pätu pripravil som si približný edičný plán, ale o tom až za chvíľu.

Ešte než nadvihneme pokrievku nad hrncom 2018 mocných dátových blogov, dovoľte mi sa vám, vernej komunite mocnedata.sk portálu, úprimne ospravedlniť. Keďže posledný blog v roku 2017 vyšiel až 22. novembra, odmlčal som sa preto približne na 1.5 mesiaca. Spojený efekt nového zamestnania, novonarodeného Olivera v našej rodine a príprav na sťahovanie celej rodiny do nového bývania v Nemecku mal za následok, že počas nocí a víkendov (zvyčajne vyhradených pre písanie nových blogov) som prevážal a skladal nábytok alebo pomáhal svojej úžasnej manželke s našou ratolesťou. Keďže Silvestra už sme definitívne všetci spolu strávili v Berlíne v našom novom byte, verím, že sa mi podarí opäť postupne nabehnúť aj na rytmus príspevkov pre Vás, moji drahí čitatelia. Za krátkodobý výpadok autorského materiálu sa dodatočne ospravedlňujem a ďakujem za vaše pochopenie. Povzbudením do novej tvorby je pre mňa fakt, že komunita mocnedata.sk už nabrala určitú zotrvačnosť. Ani absencia nových článkov totiž neposlal čítanosť blogu do nuly a dokonca aj počas môjho odmlčania prichádzali komentáre, či otázky od čitateľov, ktorí si našli cestu k niektorému zo starších blogov.

2018

O čom bude rok 2018 na mocnedata.sk

Mojou prapôvodnou motiváciou pre  písanie blogov bolo sprostredkovať  pre širší okruh s dátami pracujúcich ľudí aktuálne trendy a polemiky. Preto aj v toku 2018 sa budem snažiť písať o témach, ktoré formujú toto odvetvie. Viaceré zdroje nasvedčujú, že koncept tradičných dátových skladov (DWH) začína narážať na svoje limity a tak si povieme niečo o tom, ako a čím ich nahradiť alebo doplniť. V TeamVieweri som začal intenzívnejšie pracovať na analýze vzájomných spoločenských (social) prepojení zákazníkov v dátach a tak sprostredkujem, viac či menej, seniorné poznatky z tohto (na Slovensku nie veľmi častého) odvetvia dátovej analytiky.

Súčasťou mojej práce sa stali aj BigData z Internet Of Things (IoT), preto určite sprostredkujem návody, čím sa práca s týmto druhom dát odlišuje od bežnej dátovej analytiky. Rovnako pomenujem, aké nástroje na tento druh analýz používať a na čo si dať pozor pri tvorbe modelov nad

Do popredia sa tlačia Artificial Intelligence (AI) technológie a AI nahrádzanie ľudskej práce. Tomuto trendu sa budeme venovať intenzívnejšie (načali sme ju tu) a skúsime sa priniesť trochu reálnych podkladov do inak  pomerne plytkej diskusii o tom, čo tieto zmeny budú znamenať aj pre náš región. Ak čas dovolí rozoberieme si bližšie dátové súvislosti autonómných vozidiel alebo iného odvetvia, kam sa AI vkráda najintenzívnejšie.

Rok 2018 bude intenzívny na športové zážitky (olympiáda, majstrovstvá vo futbale či hokeji) a aj do tejto oblasti budú prenikať čoraz viac dátové analýzy. Preto nezostaneme pozadu a určite sa budeme tejto téme venovať viac aj na našom portáli.  Aj v športe a fanúšikovskom prostredí totiž vznikajú zaujímavé dátové príležitosti, o ktorých by sa malo nielen hovoriť.

Väčšina analytikov prechádza v týchto rokov od tradičného machine learningu k deep learningovým modelom (alebo ich to aspoň výrazne ťahá týmto smerom). Najbližší rok by som sa chcel preto intenzívne venovať jednotlivým typom neurónových sietí, ich trénovaniu a vzájomným rozdielom. Pokúsim sa namiešať rozumný mix pre začiatočníkov v tejto téme ako aj úplne nových trendov pre pokročilých Deep minerov.

Tradičným korením počas roka budú rozhovory s expertmi, recenzie odborných kníh a ďalšie kolá dátových hádaniek (v ktorých budem pokračovať, hneď ako naplním rest vyhodnotenia ostatného kola). Samozrejmosťou budú novinky z oblasti dátovej analytiky, ktoré sa objavia. Ak Vám chýba nejaká konkrétna téma, s ktorou by ste chceli, aby sme sa na mocnedata.sk venovali viac, hneď mi napíšte na info@mocnedata.sk, rád vašej prosbe vyhoviem.

Rovnako by som rád využil tento prelom roku na prosby, aby ste mi poslali na daný email spätnú väzbu o tom, čo sa vám páči a čo nie na mocnedata.sk. Všetky Vaše podnety pretavím do predsavzatí, ako zlepšiť tento portál pre vás.

Na záver mi dovoľte vám všetkým popriať v súkromných aj data-analytických životoch veľa úspechov, radosti z poznávania nových súvislostí, pevné zdravie a špetku šťastia k tomu. Nech vám ROC, Gini koeficient a CHI kvadrát robia radosť po celý rok!