Šport je veľmi ťažkým chlebíkom a existuje mnoho aspektov života, v ktorých športovcom nie je čo závidieť. Existuje však aspoň jedna oblasť, pre ktorú by si mnoho ľudí prialo byť športovcami. Je jedno či ste malý alebo veľký, na začiatku kariéry alebo na jej sklonku, je jedno z ktorého kontinentu pochádzate. Ak chcete napredovať vždy existuje celosvetové (objektívne) meradlo, ako dobrý/á ste.

S prichádzajúcimi Olympijskými hrami sa mi vždy vynorí obrázok športovca, ktorý aby získal Olympijské zlato, musí dosiahnuť výsledok, aký nikdy zo seba nedal. Na Olympiáde drvivá väčšina účastníkov zlomí svoje osobné maximá. Neraz tak prepíše nielen vlastné limity, ale aj limity ľudstva. Za posledné olympiády padlo v priemere 30 svetových rekordov. To znamená, že v 30 zručnostiach človek objektívne posunul schopnosti svojho živočíšneho druhu ako takého. A čo okrem titulu svetového rekordéra je na tom závidenia hodného?
Si Olympijský víťaz?
Ak patríte medzi tých, ktorí chcú zostať na tepe odvetvia, v ktorom pracujete, potom ste si určite už položili otázku „Ako dobrý/á v skutočnosti som v tom, čo robím?“ A pre mnoho odvetví toto nie je jednoduchá otázka. Napriek tomu, že pre nemalý počet povolaní by bolo možné postaviť hodnotiace kritéria, väčšina oblastí, kde ľudia pracujú nemajú porovnanie ani medzi kolegami s rovnakým popisom práce, nie to ešte naprieč mestami, či štátmi. Ako dobrým štátnym úradníkom ste? Kto je najlepší turistický sprievodca alebo vodič autobusu na Slovensku?
Nadchádzajúce Olympijská atmosféra ma preto inšpirovala k úvahe: „Ako by sa mal merať zručnosť/výkon dátového analytika? Aké osobné rekordy by sme mali mať, aby sme ich mohli prekonávať?“ Lebo ak nevieme preukázať, že sme pokorili nejakú objektívnu hranicu, ako vieme že napredujeme? A hlavne ako vieme, či napredujeme rovnako rýchlo ako „zvyšok pelotónu“ alebo sme dávno už Eric Moussambani olympijského bazénu?
Ako už samotný názov notoricky známej športovej relácie Góly, Body, Sekundy napovedá, ani samotné športy nemajú rovnakú metriku úspechu.
Je však zaujímavé, ako mnoho športov dokážu tieto 3 metriky: góly + body + sekundy zhodnotiť. Je pomerne ťažké si spomenúť na šport, v ktorom by aspoň jeden z týchto troch parametrov nebol rozhodujúci. (ak ste nad tým práve začali rozmýšľať v tomto doplnkovom blogu pre verných čitateľov nájdete odpoveď) Ak by sme zobrali analytickú prácu ako odvetvie, aké športové analógie môžu byť užitočné pre meranie napredovania v analytike?
Práca s dátami zvádza k očakávaniu exaktných parametrov výkonu (ako metre, centimetre či sekundy). Napriek kvantitatívnej povahe práce, keď príde na porovnávacie kritéria jednotlivých dátových analytikov, absolútne hodnoty sa hľadajú ťažko. Áno, je možné pozerať sa na ROC, Lift, miscalassification rate alebo iné parametre kvality predikcií, ale ak defaultným nastavením natrénovaný model rozhodovací strom dosahuje lift 3.0 je vaša regresia s 3.8 liftom skutočne tak dobrá, ako by absolútne číslo napovedalo? Alebo proste jav je dobre predikovateľný a analytik tomu nepridal zásadnú pridanú hodnotu? Veci sa ešte viac skomplikujú, keď máte za úlohu segmentovať klientov pre účely zvýšenia spokojnosti klientov. Akú časť koncového efektu prisúdiť modelu a akú samotnej realizácii segmentácie po jej namodelovaní?
Tým sa dostávam k pohľadu, že analytická práca sa dá merať spôsobom ako šach, futbal či tenis. Čím viac súperov malo lepšie výsledky ako vy,
tým horšie je vaša pozícia „v rebríčku“. Ak v krajine, či nebodaj na svete, nie je nik, kto by dokázal vyrobiť lepší model ako vy, asi ste naozaj špička. Hoci tento druh merania výkonu analytikov je naozaj výpovedný, jeho problémom zostáva, že pre väčšinu pracovných úloh nemáte šancu, aby paralelne na tom istom modeli pracovali viacerí analytici. Preto pre porovnanie sa analytici musia zúčastňovať hackatonov a Kaggle súťaží. Nie každý si nájde na to čas (čo vám mimochodom prudko odporúčam) a preto ak nemáte v práci viac Data Scientistov (čo jej jedným zo symptómov dátovej osamelosti), ku ktorým by ste sa “pomerali“, asi ani táto vetva hodnotenia nie je pre vás veľmi prínosná.
Pri hlbšom zamyslení, však prídete na to, že práca analytika v konečnom dôsledku skôr pripomína krasokorčuľovanie alebo skoky do vody. Aby ste mohli byť svetový šampión, potrebujete poznať nielen základné prvky, ale aj zložitejšie úkony. Olympijskú medailu vám nezavesia na krk po voľnej jazde bez aspoň jedného trojitého skoku. Preto prvým záujmom dátového analytika by malo byť poznať a trénovať pokročilé postupy analytiky. A to aj v prípade, keď vášmu šéfovi „stačí“ narýchlo zbúchaná lineárna regresia. Žiaden z olympijských víťazov krasokorčuľovania neskočil rozhodujúci skok prvý krát v živote práve v Olympijskom finále. Takže trénovať treba naozaj priebežne.
V biznis realite však samozrejme nestačí iba skočiť 4té salto vzad skrčmo s 1,5 vrutom (v našej analógii, rozumej, ensemble model neurónky a spline regresií), rovnako ako v športe, ide o to, aké prevedenie prvkov zvládnete predviesť. Body za „umelecký dojem“ mnoho dátových analytikov podceňuje alebo priam odcudzuje. Aj skvelé modely tak zaniknú v ich slabej vizualizácii alebo prezentácii biznis užívateľovi.
Ak by sme mali náš exkurz do hľadania kritérií pre benchmarking dátových analytikov, znelo by to asi takto: Je fajn, keď sa snažíte vo svojich projektoch o najvyššie absolútne hodnoty úspešnosti modelov, aj keď pre porovanie s inými by malo byť zrejmé, akú pridanú hodnotu priniesol model nad rámec nejakej primitívnej metódy. (rovnako ako svetový rekord v atletike neplatí, ak bola príliš veľká nedovolená podpora vetra). Oveľa lepšiu spätnú väzbu na svoje kvality však získate, keď sa zapojíte do nejakého hackatonu alebo Kaggle súťaže. Ak ani to nie je pre vás reálne, skúste aspoň trénovať (rozumej vyskúšať v projektoch) čoraz sofistikovanejšie metódy analýzy. A nezabúdajte na umelecký dojem, dobrá vizualizácia a prezentácie výsledkov je súčasťou práce dátového analytika, aj keď niektorí nad tým ohrnú nosom.
Ak patríte medzi členov mocnedata.sk komunity, nahliadnite aj do tohto doplňujúceho blogu (budete musieť zadať heslo), kde sa dozviete nielen odpoveď na hádanku ohľadne športov nad rámec Gólov, bodov a sekúnd, ale môžete sa inšpirovať aj tým, aké KPI zvyčajne dátovým analytikom nastavujú západne firmy.
Ak ešte NIE STE členom mocnedata.sk komunity, môžete sa ním bezplatne stať hneď TU.
Ďalšie blogy súvisiace s Olympiádou, ktoré by vás mohli zaujímať:
Pre koho je Olympiáda nočnou morou?
Je to bezpečné, keď také množstvo ľudí letí na opačnú stranu zemegule?
Utopili by ste sa, aj keby ste boli M. Phellps

Raj na zemi pre manipulátorov opäť prinieslo zavedenie rozhlasu a televízie. Rovnako ako noviny umožňoval rozšíriť informáciu bleskom medzi široké masy, ale “konečný spotrebiteľ klamstiev” už nemusel za obsah platiť, čo robilo mediálnu manipuláciu udržateľnejšou. Navyše, prevádzka celonárodných rozhlasov alebo televízie je tak nákladná, že vo väčšine krajín dlho bola výsadou len štátu, čo umožňovalo propagandu ušetriť akejkoľvek konkurenčnej kritike. (len si spomeňte, ako závažnú úlohu zohralo Rádio Twist a Markíza pri boji proti mečiarizmu). V krajinách východného bloku sa cenzúra televízie a rozhlasu stala ústredným nástrojom politického prežitia. (ako mimochodom do dnes je v Severnej Kórei). Z dnešného pohľadu aj to boli Fake news, ale zaujímavé, že vtedy sa to tak ešte nebralo.
Ak prijímate informácie od jedného, pre vás neosobného, zdroja, ste v strehu si overiť vierohodnosť takýchto informácii. Čo však, ak správu dostanete od niekoho blízkeho, kto by vám predsa neklamal?! Nebudete pátrať, je predsa jedno odkiaľ ju on(a) má, keď mi to hovorí, bude to zrejme pravda. Tento efekt sa umocňuje o to viac, ak vám informáciu nehovorí z očí do očí, ale pošle vám ju, a vy si ju čítate s časovým posunom oproti tomu, ako ju on(a) poslal. Keby to bola blbosť, tak už to predsa niekto medzičasom vyvrátil, nie? Sociálne siete poskytujú ideálne podhubie pre všetky vyššie uvedené predpoklady Fake news:
Ešte než sa pustíme k popisu budúcnosti Fake news, dovoľte mi jeden postreh: Nástup fenoménu Fake news poukazuje aj na to, ako sú niektorí politici pozadu. Snahy Danka a SNS pomocou riaditeľa televízie získať možnosť manipulovať masy sú úplne mimo. Jediné, čo tým dosiahne, je, že zdecimuje počet divákov RTVS a kvalitu samotného média. Títo politici si totiž neuvedomili, že hoci budete kontrolovať televíziu a rozhlas, stačí raz pobozkať výložky a echo “kapitán Danko”, ktoré sa vám vráti zo sociálnych sietí, je desať krát horšie ako vplyv, ktorý máte v danej televízii. Stratégovia Putina, Zemana či Trumpa, naopak pochopili, že udávať prím vo Fake news na sociálnych sieťach je dnes už oveľa dôležitejšia zbraň ako byť vo všetkých televíziách.
typu “Veľmi pekne Ti ďakujem!” je potrebné preniesť aj emóciu, ktorá s daným textom súvisí (napr. sarkazmus alebo nadšenie). Na svoju legendárnu dráhu tak nastúpili
Hoci pre krajinu, kde neexistuje ani povinnosť vratných PET fliaš, to môže znieť vzdialene, rok 2018 bude asi prvý rokom, keď sa ľudstvo začne odvracať od plastov. Za svoju existenciu ľudstvo vyprodukovali asi 8 miliárd ton plastových obalov. Z toho 6,3 miliardy skončilo na skládkach alebo na dne oceánov. Toto enormné znečistenie sa ľudstvu postupne
Veľké stroje však zanechávajú za sebou na poliach „obete“, nie sú príliš ekologické a na ich obsluhu stále treba ľudí. (aj keď to posledné sa snažia vyriešiť autonómne traktory). Riešením, ktoré odstraňuje všetky tri problémy vyzerajú byť drony. Dokážu pozorovať a ošetrovať polia zo vzduchu a teda neničiť samotnú úrodu. Navyše môžu byť ľahko ovládané na diaľku alebo dokonca automatizované na pravidelné prelety. V spojených štátoch sa predpokladá na rok 2018 predaj 300.000 dronov a poľnohospodárstvo bude po bezpečnosti hneď druhé odvetvie kam budú drony smerovať. Ak sa chcete nechať inšpirovať tým, ako užitočné môžu byť drony v prírode,
V Európe to celé začne GDPR reguláciou. Od mája 2018 sa misky váh súkromia výrazne naklonia v prospech koncového užívateľa, keď získa tvrdo vynútené právo stiahnuť, obmedziť a vymazať akékoľvek dáta o sebe v ľubovoľnom IT systéme (s výnimkou tých vládnych). Tento rázny krok však nielen zatrasie marketingom a procesmi na kontakt s klientom, prinesie zároveň úplne nový rozmer služieb. Informácie, ktoré o nás nazbieral Google alebo Amazon, vôbec nemusia byť otravné alebo pohoršujúce. Je v nich určite aj veľa užitočných informácií, z ktorých doposiaľ mohli ťažiť len dané spoločnosti. Teraz budú dostupné aj nám, bežným smrteľníkom. Ako užívateľ budete môcť teda stiahnuť si dáta z Google o vašej ceste do práce a poskytnúť ich nejakej aplikácií, ktorá vypočíta optimálnu cestu do práce, aby ste ušetrili čas. Podobne to môže byť so spánkom, pohybom, nákupnými preferenciami. (predstavte si, že sa presťahujete a aplikácia vám vyhľadá potraviny, ktoré sú čo najviac podobné tým, ktoré ste kupovali v domovskej krajine), plus nájde ich najvýhodnejší nákup (prípadne priamo objedná). Aby ste však mohli svoje informácie legálne presúvať medzi jednotlivými aplikáciami, budeme potrebovať niečo ako (bankový) informačný účet. A to bude jedna z hlavných technológií najbližších mesiacov. [k tejto téme plánujem samostatný blog ]
kombinácií dokážu výrazne hýbať svetom. Ak dnes nejaká komunita ľudí narazí na spoločný problém (napríklad chýbajúce detské ihrisko), dokáže sa zorganizovať a dokonca aj finančne vyzbierať na vyriešenie tohto problému. Pritom sa nikdy nemusia ani stretnúť. Pospolitý ľud tak získal možnosť vyplniť diery po (alebo dokonca priamo oponovať) štátnej moci. Prvou vážnou ilustráciou tejto sily bola
a užívajú si duopol. Na prvý pohľad je teda nepochopiteľné, ako by tieto digitálne pevnosti mohli padnúť vďaka „nejakému online obchodu“, ktorý je sám výrazným inzerentom u týchto dvoch hráčov. Fígeľ spočíva v tom, že FB a Google ovládajú trh reklamy iba v podobe, kde človek aktívne zadáva informácie (napr. do vyhľadávača). Akonáhle sa však zmení
Rok 2018 bude možno rokom nádeje pre mnohé odvetvia, určite to však nebude bankovníctvo. Banky čaká dvoj úder v podobe regulácie, ktorý nielen výrazne zatne do nákladov, ale potenciálne podkope odvetvie ako také. Podľa
príležitosť, ako realizovať výmenu medzi ľuďmi. Akúkoľvek výmenu. A tak si blockchain našiel svoje uplatnenie aj ako nástroj na organizovanie tajných party. Pomocou tokenov distribuovaných len medzi „zasvätenými“ (a za ktoré sa platí samozrejme len kryptomenami), sú organizátori schopní oznámiť miesto a čas konania koncertu len úzkemu okruhu pozvaných, bez obavy, že by sa o tom dozvedeli nevhodné osoby alebo polícia.
na ktorom čísle sa nachádza písmeno R, neporozumejú ani otázke. (schválne spomeniete si, že bolo 3krát potrebné stlačiť číslo 7?) V týchto mesiacoch nás čaká podobný zlom v ovládaní technológii. S príchodom Siri, Alexy a podobných nástrojov, prestaneme svoje inštrukcie písať, začneme ich diktovať. To rozdáva nanovo karty v mnohých odvetviach (
S príchodom
okuliare, optické technológie rozpoznajú skutočný objekt pred vami a v databáze vyhľadajú doplnkové informácie alebo obrazce, ktoré vám „pripnú“ k tomu objektu. Ak teda namierite váš smartfón na obraz v galérií, systém ho rozpozná a poskytne vám audio alebo video doplňujúce informácie k tomuto obrazu. Dlho sa táto technológia trápila, lebo nevedela nájsť svoje skutočné komerčné uplatnenie. V posledných mesiacoch však prerazila idea, že AR môže byť akýmsi virtuálnym manuálom. Namieriš svoj mobil na tlačidlo na kávovare a on ti zobrazí interaktívne video, ako kávovar obsluhovať. Ak sme doposiaľ museli hľadať inštruktážne videá na YouTube, teraz už bude stačiť len pozrieť sa na objekt cez mobil. AR rozhodne čaká prudký nástup.
Fenomén falošných správ, šírených úmyselne cez sociálne siete s úmyslom manipulovať mienku ľudí, už sa rozvinul a jeho dopady bolo vidno na niekoľkých posledných voľbách (vrátane
ich vzájomných súvislostí. Známy dátový expert 
vstupuje medicína na diaľku. Koncept, s ktorým sa už
Niekoľko rokov po sebe sa stupňuje progres v oblasti dekódovania a analýzy ľudského genómu. Hoci technologicky už je ľudstvo pripravené na sekvencovanie DNA, proces bude ešte niekoľko rokov čakať na masové rozšírenie. Pomyselnou brzdou dostupnosti tohto nástroja je, pomerne nečakane, diskový priestor. Na uloženie výsledku detailnej bunkovej analýzy nádoru je totiž potrebný až 1 TB diskového priestoru. Teda len na uloženie takýchto záznamov všetkých obyvateľov Slovenska by bolo potrebné dátové centrum, akým nedisponuje ani Facebook. A to sa bavíme len o jednorazovej snímke, pri pravidelnom sledovaní vývoja zdravia človeka sa tento objem ešte samozrejme násobí. Tí IT zručnejší z nás si povedia, nuž nevadí, veď podľa
Jazda na koni predurčila, že sa cválalo vľavo. Bolo to dané tým, že väčšina ľudí boli praváci, takže, aby sa mohli brániť (alebo zaútočiť) voči niekomu inému, potrebovali mať voľný priestor pri pravej ruke a to je možné, iba ak idete koňom vľavo Ak by ste jazdili v pravo, stretávali by ste súpera vnútornou ľavou rukou, čo je nepraktické. Preto až najbližšie uvidíte Old Shatterhanda ako vo filme cvála po pravej strane, schuti sa filmárom zasmejte.
Zvláštne je, že pomerne veľké množstvo krajín (konkrétne 49 krajín) počas svojej existencie zmenilo spôsob šoférovania. Ešte viac vás prekvapí, že jednou z nich je aj
Slovensko. V Rakúsko-Uhorsku totiž všetci jazdili vľavo. (dôkazom toho sú aj tieto fotky z Viedne a Bratislavy z 30tych rokov) Hitlerovské výpady však zasiahli aj do tejto zdanlivo nenápadnej oblasti života. Počas protektorátu a Slovenského štátu Nemci zaviedli jazdu vpravo, po vzore Nemeckej ríše. A šoférovanie vpravo už nám prischlo.