Analytik použiteľný pre firmu – Kde najčastejšie uplatníš ML znalosti v biznise

Nedávno som mal prednášku pre študentov vysokej školy, ktorí sa pripravujú na povolanie dátových analytikov. Bola to veľmi milá udalosť, po skončení prednášky som mal možnosť diskutovať so skupinkou študentov nad pizzou a kofolou o tom, čo ich trápi. Okrem tradičných “slabôstok” slovenského školstva ma zaujala jedna veta: “Nevieme sa dobre pripraviť na prax, lebo na univerzite sa nedozvieme, ktoré z množstva algoritmov, z ktorých máme skúšku, od nás budú vlastne požadovať budúci zamestnávatelia.”

Musím sa priznať, že otázka mi prišla bazálna, možno až humorná. Ale na druhé zamyslenie musím uznať, že je to pádna požiadavka. Ak aj vysoká škola ponúkne praktické cvičenia pre preberanú látku na reálnych dátach z biznis prostredia, málokedy ich má viac setov na ten istý problém. Pokojne sa vám môže stať, že logistickú regresiu sa naučíte modelovať na dátach o donoroch z neziskovky alebo na infosete o prežití na Titaniku, ale dáta na predikciu odchodovosti klientov vám asi dá málokto k dispozícii. Pritom problémom nie je to, že sa postupy učíte na inom druhu biznis problémov (nie odchodovosť ale ochota dať sponzorský dar), skutočným problémom je, že sa nedozviete, aké sú tie skutočné použitia dát vo firmách (kam sa môžete uchádzať o prácu). Ak si teda naivne nemyslíte, že firmy zachraňujú pasažierov z Titaniku.

Keď som sa pustil do písania tohto blogu, ktorým by som chcel pôvodne iba obslúžiť nástojčivú prosbu študentov, uvedomil som si, že podobný problém vás môže postretnúť, aj keď už reálne v našej branži pracujete. Stačí, že ste sa niekoľko rokov venovali analytike v tom istom odvetví. Poznáte jeho potreby, ale z prechodu do iného odvetvia máte, hm, minimálne obavy. (pozdravujem Ťa, Nika) Do ešte horšej situácie sa môžete dostať, ak ste aj pracovali v nejakom odvetví, ale manažment od vás požadoval len určitý (neraz triviálny) druh analýz. To sa môže stať, že pohoríte aj na pohovore u konkurenta, ktorý to s analytikou myslí trochu vážnejšie ako Vaša firma.

Ako čítať odporúčania

(Ešte než sa ponoríme do samotných oblastí, dovoľte mi jeden disclaimer: Nižšie uvedené uplatnenia Machine Learningu sú z biznisu. Biznis nie je jediná možnosť, kde sa dá pracovať s dátami, určite existujú aj iné oblasti pôsobenia (napr. výskum, neziskový sektor, vládne agentúry, … ), kde nižšie menované metódy nie sú až tak užitočné a musíte vedieť niečo iné. Preto nižšie uvedenými radami sa zaoberajte, iba ak ste odhodlaný/á hľadať si analytickú prácu v nejakej komerčnej firme. Rovnako pripúšťam, že uvedené oblasti biznisu by sa dali riešiť aj inak ako Machine Learningom, ale to by bolo na iný článok. ) Nakoniec je dôležité povedať, že tieto postupy ocení len erudovaný šéf.  4 typy nevhodných šéfov sme rozobrali v minulom blogu.

Základný pohľad odporúčaní je zoradený podľa oblastí prínosu analytiky pre biznis. Teda naozaj odpovedá na otázky, ako môžete byť užitoční pre svojich zamestnávateľov. Následne komentujem, pre ktoré odvetvia daná oblasť dáva najväčší úžitok (a teda, v akých firmách ho od vás budú požadovať). Na koniec pridávam aj stručný prehľad algoritmov, ktoré je nutné vedieť pre zdarnú implementáciu ML v danej oblasti, pričom ich rozdeľujem na ZÁKLADNÉ/advanced postupy. Podklady pre tieto odporúčania sú kombináciou publikácie Where Predictive Analytics Has Biggest Impact zostavenej za pomoci T. Davenporta (guru analytiky) pre Harward Business Review (Winter 2017 edition) a doplnení z mojich vlastných postrehov zo SR biznisu.

1] Vytváranie dopytu

1.a] Pravdepodobnosť nákupu konkrétneho produktu

Prediktívny model, ktorý na základe histórie nákupov daného produktu, vyšpecifikuje faktory, ktoré zvyšujú náchylnosť k nákupu daného produktu a pre (každého) klienta spočíta pravdepodobnosť nákupu daného produktu. Klienti nad stanovenú minimálnu pravdepodobnosť bývajú oslovení ponukou na kúpu daného produktu. 

Odvetvia, kde používané: Ľubovoľné odvetvie, kde existuje digitálny údaj o nákupe klienta. Najpálčivejšie to je v RETAILE, POISŤOVNÍCTVE, TELCO.

Najčastejšie analytické metódy: ROZHODOVACIE STROMY, LOGISTICKÉ REGRESIE, NAIVE BAYES, / Random forests, Ensemble modely, …

1.b] Odporúčacie mechanizmy

Algoritmy, ktoré podľa podobnosti buď produktov alebo ľudí, ktorí kupujú konkrétny produkt (na základe štatistickej analýzy podobnosti), generujú návrh, čo by bol pravdepodobne vhodný doplnkový produkt. Ten sa následne klientovi ponúkne, aby sa zvýšila celková hodnota nákupu daného klienta.  

Odvetvia, kde používané: Pre tento druh analýzy je potrebné mať pomerne veľký počet produktov alebo ich variantov. Zároveň o historických nákupoch musí existovať digitálna stopa, takže zrejme nebudete predikovať aká iná zmrzlina sa hodí v miestnej zmrzlinárni k vanilkovej. Z uvedených dvoch podmienok jasne plynie, že hlavnými kandidátmi na tieto postupy sú E-SHOPY a MALOOBCHOD v kamenných predajniach, ako aj ODVETVIA predávajúce ZÁBAVNÝ OBSAH (Netflix, Kiná, divadlá, knihkupectvá, …)

Najčastejšie analytické metódy: ASOCIAČNÉ pravidlá, CLUSTERING (k-means, …) / Collaborative filtering, Latent Factor Models, Content based filtering, DBSCAN, …

2] Predchádzanie nežiaducemu správaniu klienta

2.a] Pravdepodobnosť odchodu klienta

Prediktívny model, ktorý na základe už v minulosti stratených klientov sa snažíte odhaliť premenné, ktoré mali spoločné. Následne pre každého klienta učíte mieru náchylnosti (pravdepodobnosti) odísť v nejakom najbližšom časovom úseku. Klienti nad stanovenú minimálnu pravdepodobnosť bývajú oslovení špeciálnymi ponukami na veľmi výhodne produkty alebo dodatočnými službami zdarma, s cieľom udržať si ich. 

Odvetvia, kde používané: Aplikovateľné v každom odvetví, ktoré nie je monopolom. Obzvlášť populárne sú však tieto postupy v odvetviach, kde pred tým vládol pokoj (klienti nepreskakovali od konkurencie ku konkurencii) a za posledné roky sa tieto “bočné” úmysly zosilnili, ako TELCO, BANKOVNÍCTVO, ELEKTRÁRNE A INÉ UTILITY ale aj akékoľvek formy PREDPLATNÉHO (Noviny).

Najčastejšie analytické metódy: ROZHODOVACIE STROMY, LOGISTICKÉ REGRESIE, K-NEAREST NEIGHBORS / Random forests, Ensemble modely, …

2.b] Credit/Payment & Process risk manažment

Manažovanie rizika má svoje všeobecné kontúry, kde hlavnými cieľmi analytky je samotná kvantifikácia miery rizika. Následne sa kvantifikované hladiny rizika používajú na výpočet potenciálnej straty (resp Value at Risk) z daného procesu/aktivity. Následne v užšom slova zmysle sa risk manažéri snažia podrobnejšie kvantifikovať riziko konkrétneho klienta v danom procese. Najbežnejším prípadom sú riziká spojené s finančnou disciplínou klienta, prípadne s budúcou finančnou situáciou daného klienta. 

Odvetvia, kde používané: Všeobecnú kvantifikáciu rizika je možné realizovať vo všetkých odvetviach (kde sú nejak zmapované procesy). Tam, kde však prípadne škody majú závažné dôsledky (veľká finančná strata alebo dokonca ujmy na ľudskom zdraví) však risk management naberá na dôležitosti. Hlavnými odvetviami, kde sa risk manažment dopracoval až k sofistikovanejšej analytike sú BANKOVNÍCTVO, POISŤOVNÍCTVO, METEOROLÓGIA,  ale aj MEDICÍNA a FARMÁCIA.

Najčastejšie analytické metódy: VALUE-AT_RISK, FAULT TREE ANALYSIS, Markovové procesy, Gini, PD/LGD, Altamn Z-score/Stochastické modely, MONTE CARLO metódy, Survival analysis

3] Cenotvorba

Základom tejto oblasti je odhaliť ktoré z faktorov produktu ako vplývajú na vnímanie jeho ceny, prípadne navrhnúť takú cenu, kde dopytová reakcia (buď pokles predaja po zdražení alebo nárast predaja po zlacnení) v spojitosti so samotnou zmenou jednotkovej ceny vytvárajú vyšší zisk pre spoločnosť ako v pôvodnom nastavení. Do tejto oblasti spadajú aj bočné vetvy dynamickej cenotvorby (kolísanie ceny výrobku podľa dopytu alebo typov klientov, ktorí kupujú v konkrétnu časť dňa) ako aj  stratégií konkurenčného cenového vymedzenia (napr. IFTTT scenáre)

Odvetvia, kde používané: Cenu je možné optimalizovať samozrejme v každom odvetví, takže nižšie uvedené analytické metódy sa vám zídu takmer v každom odvetví. Absolútne nevyhnutné sú však pricing postupy v odvteviach rýchlo obrátkových tovarov, kde sa nákup opakuje často a teda zmena ceny dokáže mať rýchly efekt. Do tejto kategórie určite patria E-SHOPY a ODVETVIA predávajúce ZÁBAVNÝ OBSAH (Netflix, Kiná, divadlá, knihkupectvá, …) Istý potenciál predstavujú tieto metódy aj v MALOOBCHODE v kamenných predajniach, avšak do nasadenia digitálnych cenoviek je v takom supermarkete nemožné počas dňa niekoľko krát zmeniť ceny pre veľkú skupinu tovarov a tak niektoré cenové postupy tu zatiaľ majú len teoretické uplatnenie.

Najčastejšie analytické metódy: CONJOINT analýza, FACTOR ANALYSIS, MULTIVARIATE LINEAR REGRESSION, IFTTT  / Anomaly detection, CLUSTERING (k-means, …), Stochastické modely, Dynamic conversion pricing

4] Optimalizácia zásobovania

Pre oblasť optimalizácie zásobovania logistiky sú najcennejšími analýzami optimalizačné metódy, ktoré dokážu, po zohľadnení daných obmedzení, určiť najkratšiu cestu, prípadne optimálnu kombináciu tovarov pre prepravu a zásielky. Dôležitým aspektom je vedieť aj odhadnúť, koľko vlastne čoho objednať, na čo sa zvyčajne používajú informácie o historickom priebehu dopytu po danom výrobku alebo simulačné modelovanie vývoja na trhu. 

Odvetvia, kde používané: Využitie týchto typov analýz je zrejmý už z povahy ich názvu. Uplatnia sa tam, kde je kritické odhadnúť správne množstvo a čas, kedy má byť tovar doručený z jedného miesta na iný. Samozrejmými konzumentmi týchto druhov analýz sú teda E-SHOPY a MALOOBCHODNÉ PREVÁDZKY (najmä potraviny, drogérie, odevy a lekárne), kde  absencia tovaru vedie k ušlému biznisu (ak klient potrebuje chleba a nekúpi ho u vás, zájde ku konkurencii. Ak sa to stane opakovane prestane k vám chodiť úplne) prípadne k zvýšeným nákladom (expirácia tovaru, prípadne vysoké náklady na skladovanie tovaru). Samozrejmými cieľmi tohto druhu analytiku sú aj DOPRAVNÉ a LOGISTICKÉ firmy, ktoré potrebujú prepraviť, čo najefektívnejšie náklady. Vďaka novodobej špecializácii firiem, neraz od správnej optimalizácie zásob súvisí aj efektívna VÝROBA, keďže máloktorá firma si dnes vyrába všetky súčiastky a dielce od primárneho dolovania nerastných surovín až po ich finálne vmontovanie do finálneho výrobku.

Najčastejšie analytické metódy: ARIMA (a iné analýzy časových radov), SIMPLEX (a iné optimalizačné metódy), FORECASTING (extrapolácie) / Anomaly detection, Stochastické modely, Logistická a Lineárna regresia, Analýza grafov a sietí

Koho iného by mohli zaujímať tieto dáta

Okrem vyššie uvedených dvoch cieľových skupín (budúcnosť hľadajúci študenti VŠ + v nejakom odvetví uviaznutí reálni analytici) mi napadlo ešte niekoľko skupín ľudí, ktorých by vyššie uvedené odporúčania mohli zaujať.

Manažéri analytických teamov. Ak ste sa náhodou ocitli v inom odvetví alebo od vás vo vašej práci nadriadení v minulosti chceli len limitovaný okruh analytiky, skúste sa pozrieť za odporúčania sofistikovanejších algoritmov (za lomítkom malými písmenami). Tie najpoprednejší hráči vášho odvetvia totiž už dnes používajú aj tieto sofistikovanejšie prístupy. Ak ste náhodou k nim (ani) nepričuchli, začínate zaostávať vo svojej oblasti. Na vašom aktuálnom mieste to možno do vás nikto chcieť nebude, ale akonáhle sa rozhodnete zmeniť zamestnávateľa, mohlo by si vás to škaredo počkať.

Profesori, Docenti a Asistenti na vysokých školách. Prapôvodný impulz k vzniku tohto blogu mi dali študenti, ktorí sa “posťažovali”, že na prednáškach a cvičeniach sa nestretávajú priamo s datasetmi, ktoré by kopírovali use-casy tak, ako ich budú očakávať budúci zamestnávatelia. Tomuto sa však dá pomerne jednoducho predísť. Pokúste za z Kagglu, OpenData zdrojov alebo od partnerských firiem získať anomymizované dáta, ktoré by zodpovedali priamo daným problémom. Netrénujte na cvičeniach a semestrálnych zadaniach analytické metódy na akýchkoľvek dátach, skúste simulovať priamo vyššie uvedené problémy. Keď vaši absolventi prídu na pracovný pohovor, či do reálnych pracovných zadaní, budú si vedieť spomenúť, presne ako sa s týmto problémom “popasovali” na cvičeniach. Dajte si tu námahu a zozbierajte dáta na každý druh analýz podľa vyššie pomenovaných prípadov použitia.

Zopár rád nakoniec

Ak patríte medzi študentov alebo ste v prvých rokoch svojej analytickej kariéry, dajte si záležať, aby ste vedeli to, čo si trh naozaj pýta. Na portáli mocnedáta sme tejto téme venovali niekoľko blogov,  odporúčam začať TU alebo prípadne TU. Ak sa náhodou rozhodnete uchádzať o prácu v zahraničí, odporúčam prečítať si aj tento seriál blogov. Zároveň sa priamo na pohovore (dobre mienenými otázkami) uistite, že sa nerútite do náruče jedného z Analytike nerozumejúcich manažérov. To totiž často býva jedným zo spúšťačov nebezpečného javu, ktorý sa volá Osamelosť dátoveho analytika, ktorý by som vám fakt neprial zažiť. A ak už v analytike pracujete, nezabudnite si správne stanovovať analytické ciele pre seba, aby ste v rozvoji neustále napredovali.

Ak máte k niektorému z vyššie uvedených odporúčaní otázku, neváhajte sa ozvať sa mi TU. Držím palce!

Šéfe, si úplne mimo! 4 druhy manažérov, čo nerozumejú analytike

Keď som pred pár týždňami napísal blog o Syndróme Osamelosti analytika, mal som tušenie, že nehovorím o ojedinelých prípadoch. Avšak početné ohlasy zo strany čitateľov ma úplne odrovnali. Bol to taký ten zmiešaný pocit smútko-radosti, že ste niečo správne pomenovali, ale je vám zároveň ľúto, že toľko ľudí trpí týmto syndrómom. Rozhodol som sa preto porozprávať s niektorými z tých, čo sa ozvali po tomto blogu a napísať jeho voľné pokračovanie. Tento krát o jednom z 3 faktorov analytickej osamelosti: o manažérskej stránke veci.

Klasické HRistické príslovie hovorí:  “Zamestnanci neodchádzajú od firiem, ale od svojich nadriadených.” Hoci s týmto zovšeobecnením nie úplne súhlasím, musím priznať, že v 4 z 5ich prípadov, keď som menil prácu to bola pravda (týmto ťa pozdravujem, Rasťo, si tá výnimka). Od šéfa sa dá odísť z rôznych dôvodov, vo väčšine prípadov však je to kombinácia niektorých z nasledovných “evergreenov”: Nevie oceniť moju prácu ; Nerozumie danej oblasti a teda robím zväčša nezmyselné úlohy ; Neverí mi a dáva mi to najavo ; Ničím ma neinšpiruje ani nerozvíja, zakrnievam ; Jeho/Jej morálne kvality a prístupy sú v rozpore s mojim presvedčením.

Určite, manažérska povrchnosť a nekompetentnosť vás môže postretnúť takmer v každom odvetví, ja by som sa však chcel špeciálne povenovať typickým príkladom tohto neduhu vo vodách dátovej analytiky a Datascience. Tradičné kokteily vedúcich v tomto odvetví získali ešte niekoľko korenistých prísad. Veď posúďte sami, tu sú 4 typy manažérov, čo nerozumejú analytike:

1] Neťahaj ma do detailov

BOSS_type_1Charakteristika: Je to neuveriteľné, ale aj v dnešnej dobe stále existuje mnoho firiem, kde dátová analytika “uviazla” pod šéfom obchodu alebo marketingu. Je to tak trochu tragické vyústenie toho, že všade sa hovorí, že dáta dokážu výrazne ovplyvniť výsledok spoločnosti. Výsledkom je, že analytici spadajú pod šéfa obchodu alebo marketingu. To sú ľudia, ktorí zvyčajne už na (základnej či strednej) škole získali averziu k matematike. Čokoľvek zložitejšie ako percentá už ich nechávajú nekľudnými. Jednoduché počty ako súčet a priemer (samozrejme myslia len aritmetický) to áno, ale všetko ostatné je už zbytočné komplikované. Akákoľvek štatistika za horizontom korelácií už sú len také “akademické kudrlinky” (či žvásty). Ich fóbia z čísiel a sofistikovanejších analýz plynie z toho, že tejto oblasti nikdy nerozumeli, nemajú ju pod kontrolou a teda sa jej obávajú. Neveria v silu výpočtov, či AI, všetko riešia skôr intuitívne a na základe osvedčených prístupov (rozumej aspoň raz mu to zafungovalo v minulosti).  Preferuje ľudskú reč ako komunikáciu, každú schému či tabuľku zjednoduší do 2-3 viet. Nech je analýza akokoľvek komplikovaná, na konci všetko musí skončiť v Exceli, v ktorý sa dá filtrovať podľa stĺpcov, a nesmie to mať viac ako 50 riadkov. Keď sa pokúsite “zasvätiť ” do výsledkov svojej práce, povie vám “Let’s do not get too technical” (alebo slovenský ekvivalent Neťahaj ma do technických detailov veci, povedz mi  len podstatu)

Dôsledky pre vašu prácu: Ak pracujete pre takého manažéra, čaká vás zrejme  veľmi frustrujúci pracovný život. Keďže tento druh manažérov nikdy žiadnu analytickú prácu nerobil, neviem čo je reálne a čo nie. A to ani z hľadiska postupov a výsledkov, ale hlavne, ani z hľadiska času, ktorý na to potrebujete. Pripravte sa teda na to, že budete dostávať nezmyselné úlohy v šibeničných termínoch (čo by na tom mohlo toľko trvať, nie?). O každom zadaní, ktoré vám dá, má svoje intuitívne očakávania výsledku. Kk sa do nich netrafíte skutočnými dátami, čaká vás ťažký týždeň. Nech pripravíte výstup akokoľvek kvalitný, on(a) si z toho zoberie jeden či dve najevidentnejšie (= najprimitívnejšie) závery, čím vás postupne vyfrustruje a odradí od sofistikovanejších postupov. Skôr či neskôr sa objavia aj pokusy o cenzúru “nelogických” výstupov analýz.  Ak treba závery prezentovať “vrchonosti”, nechá to urobiť vás (pričom vám polovicu slidov povyhadzuje ako zbytočné), lebo keby sa to top manažmentu náhodou nepáčilo, tak vás kľudne potopí s tým, že ani jemu to nedáva zmysel, ale tak to proste vyšlo. V oblasti expertného a osobnostného rozvoja vás čaká čistý osud Robinsona Crusea.

Rada, čo s tým: Nerád som zlý prorokom, ale ak to so svojou kariérou analytika myslíte vážne, tak odtiaľ utečte. U tohto druhu manažéra totiž nie je reálne sa dočkať zlepšenia, on(a) totiž považuje zložitejšiu analytiku za nutné zlo, ktoré mu vyhovuje len keď potvrdzuje jeho intuitívne hypotézy, inak je zbytočné mudrovanie, ktoré nemá oporu v (jeho/jej) realite. Jedinou alternatívou k úteku by bol pokus o palácový prevrat (natriete ho vyššej úrovni riadenia a oni ho vymenia), ale úprimne tento druh manažérov má tuhší koreň a viac výložiek za zásluhy ako vy presvedčivých argumentov. Takže skôr či neskôr odtiaľ proste (s veľkou úľavou) odídete.

2] Vystrašený zajac

BOSS_type_2Charakteristika: Tento typ manažéra pramení z prvého typu a neraz predstavuje generačný posun, či osobnostný vývoj od Neťahaj ma do detailov typu. Čo zostalo rovnaké je, že sám nikdy analytickú pracu nerobil a teda sa veci nerozumie. “Posunom vpred” však je, že sofistikovanejšiu analýzu neodmieta, lebo už pochopil, že sa to bez nej nedá. K tomuto “zlepšeniu” ho dotlačil buď postoj CEO/akcionára alebo fakt, že si všimol, že všetci konkurenti okolo tú analytiku už majú, tak ju, hold, musíme mať aj my. Keďže však sám veci nerozumie, snaží sa postupovať len po veľmi elementárnych krokoch, často odkukaných z odborných konferencií alebo hype hesiel typu Hadoop. Je stuhnutý/á vždy, keď vojdete do jeho kancelárie, lebo vie, že debata sa bude točiť okolo dôležitej témy, ktorú nemá pod kontrolou. Aby prežil, musí však pre úrovne nad sebou (ktoré ho neraz k tej analytike primäli) živiť dojem, že sa o vec nielen zaujíma, ale jej aj rozumie.

Dôsledky pre vašu prácu: Dôsledky sú podobné, ako keď sa máte vymotať z miestnosti plnej veci po tme. Postupuje len pomalými krokmi pozdĺž známych obrysov, všetko najprv dôsledne ohmatá, aby sme si boli istí, že si na niečom nenabijeme hubu. Dostávať budete teda iba elementárne zadania, všetko bude treba najprv vyskúšať pilotne v malom (= bez efektu, ktorý si niekto všimol). Že trénovať model najprv na 1000 ľuďoch a potom až na 100.000 nedáva zmysel mu nevysvetlíte a teda väčšina projektov umrie už po pilote. Nebude nikdy bojovať za lepší software alebo výkonnejší stroj na výpočty, “skúsme to najprv s tým, čo máme. Keď sa osvedčíme, potom si môžeme vypýtať viac peňazí.” Je príliš mäkký, lebo vás nevie riadiť podľa obsahu (keďže mu nerozumie) a tak sa vás bude snažiť previesť tak-nejak stredným prúdom. Ráznych rozhodnutí ani kvalitnej spätnej väzby sa od neho nedočkáte. Nečakajte nejakú víziu kam to chcete dotiahnuť, skôr budete často hasiči tém, ktoré mu budú padať zhora (a ktoré on nevie posúdiť a priorizovať).  Keďže si je vo vašej oblasti neistý/á, všetko si nechá vysvetliť od Adama (občas aj opakovane, lebo mu to v hlave premazalo niečo iné). Zrejme vás nikdy nenechá prezentovať výsledky vašej práce, aby náhodou pred vedením nebolo vidno, že ani z ďaleka nerozumie tomu tak, ako vy.

Rada, čo s tým: Ak vám nevadí (alebo priam vyhovuje), že vás tento druh manažérov odizoluje od kontaktu s vedením spoločnosti  tak sa dá v tomto nastavení prežiť pomerne komfortne. Budete  ho/ju však musieť kontinuálne vzdelávať (niekedy opakovane na tie isté témy). Nečakajte nejaký kariérny rast alebo expertný rozvoj, maximálne vám nechá priestor sa samovzdelávať. Ako prestupná stanica, to nie je teda úplne nevydržateľné, ale primitívne, dookola opakujúce sa  úlohy a profesionálna stagnácia vás postupne dobehnú. Ak ste s takýmto manažérom prežili viac ako 3 roky, rozhliadnite sa, kam sa zatiaľ posunuli vaši rovesníci. Či vám náhodou neuteká vlak.

3] Keď sme my v 95tom …

Boss_type_3Charakteristika: Ide o manažéra, ktorý kedysi pracoval ako analytik. Samozrejme v dobách, keď pod dátovými analýzami sa myslelo OLAP a hlavne reporting z SQL dát. K prediktívnym modelom, Monte Carlo simuláciám alebo neurónovým sieťam si príliš nepričuchol/-la. Neprecitol/-la teda, že analytika sa dnes robí úplne inak. Navyše jeho/jej schopnosti sú skôr spomienkový optimizmus, ktorý sa neraz pretavuje do viet typu “Keď sme to my v 95tom skúšali, tak nám fungovalo toto“. V istom zmysle je táto poloha nebezpečnejšia ako prvé 2 menované typy.  Ak vás totiž niekto presviedča o niečom, čo neplatí, vždy je horšie, keď si myslí, že má pravdu, ako keď si nie je istý, či ju má. Navyše tento typ manažéra chce byť do všetkého detailne zapojený, lebo si pamätá, že to bolo vzrušujúce odhaľovať nové súvislosti (možno mu to občas chýba). V skutočnosti si však neuvedomuje, že s tými mladými “už nehrá tú istú ligu”.

Dôsledky pre vašu prácu: Asi najväčším rizikom tohto typu manažérov je mikromanažment. Tým, že žijú v domnienke, že oblasti rozumejú, a majú nostalgické spomienky na časy, keď ešte niečo reálne robili s dátami, chopia sa každej príležitosti detailne samých seba “zapojiť do projektu”. To občas môže zájsť až tak ďaleko, že sa “nenútene” podujmú pomôcť a zobrať časť projektu na svoje plecia. (čomu sa treba oblúkom vyhnúť, keď už kvôli ničomu inému, tak aspoň pre dodržanie termínu projektu).  Keď už hovoríme o tých termínoch, druhým podstatným rizikom spolupráce s takýmto manažérom sú nereálne optimistické termíny. Veď, keď sme to my robili v 95tom tak to trvalo … Z dlhodobého hľadiska najväčším rizikom je, že bude spomaľovať (alebo “odbornými” argumentmi torpédovať) implementáciu najnovších trendov, aby stíhal s vami držať krok. Možno to nebude ani robiť vedome, ale ak si dáte dva kroky späť, po niekoľkých rokoch zistíte, že ste sa viac menej točili v kruhu.

Rada, čo s tým: Pre niektorých ľudí môže byť takéto zamestnanie pohodlné a nechajú sa uchlácholiť tým, že predsa to mohlo dopadnúť horšie (viď prvý a druhý typ manažéra). Ak ste na konci kariéry alebo patríte medzi tých, čo preferujú tradičné pred inovatívnym, tak si proste užite pohodlný život. Ak však stojí väčšina pracovného života ešte pred vami, potrebujete si vybojovať priestor pre odborný rast. A to aspoň tempom, akým porastie trh, aby sa z vás nestala “zbytočná haraburda na trhu práce”. Odporúčam preto si s takýmto manažérom sadnúť a cielene si vypýtať autonómiu: časť pracovného času (napr. 1 deň v týždni) venovať skúšaniu nových trendov (, ktoré on(a) od vás inak nepožaduje). Ak s tým nebude súhlasiť, je na dobrej ceste pretaviť sa postupne do typu 1]  a v duchu rady pre tento typ (viď vyššie) by mala byť aj vaša odpoveď na tento jeho prerod.

4] Jules Verne

Jules_VerneCharakteristika: Aby ste nenadobudli mylný dojem, že manažér je problémový len, keď vie o veci menej ako vy, pozor, existuje aj opačný prípad. Ja osobne z duše nenávidím princíp, kde z najlepšieho chirurga neskôr spravia riaditeľa nemocnice, s argumentom, že si ho ostatní vážia a rešpektujú. Žiaľ, aj v analytike sa stáva, že najšikovnejší  (alebo najexpertnejší) analytik sa stane teamleadrom, či vedúcim oddelenia. Neraz sa tak deje preto, že úrovne riadenia nad ním sú niektorý z prvých troch typov a teda potrebujú, aby niekto zastrešil aj odbornú stránku veci. Jules Verne je typ manažéra, ktorý sám kedysi bol Data Scientistom alebo aspoň sofistikovaným data minerom. Po tom, čo prestane oficiálne byť zodpovedný za priamy výkon, ale za riadenie iných analytikov, sa spravidla udeje jedna z nasledovných vecí: 1) buď zlenivie a pochopí, že k písaniu query alebo kódu už sa nechce vrátiť  (čo má za následok postupnú stratu citu pre samotnú prácu analytika) alebo 2) sa chopí šance konečne robiť ten typ cool analýz, čo mu vrchnosť pred tým nedovolila. Nezriedka sa obe tieto premeny zlejú do nekritického prijímania “hype noviniek” v odvetví. Veď aj on chce na pive s iným data manažérmi povedať, že tú-či-inú cool novinku už robíme aj my vo firme. Výsledkom býva, že cesta sa stáva pre neho cieľ. Vyskúšať to-či-ono je dôležitejšie ako dotiahnuť niečo jednoduchšie do dokonalosti. Lebo už necíti priamu zodpovednosť za čas venovaný jednotlivým krokom, on(a) už určuje stratégiu do budúcna.

Dôsledky pre vašu prácu: Zadania sa stávajú čoraz hmlistejšie, lebo “Nejak skús zapojiť neurónku a uvidíme, čo to prinesie.” Polo úspechy samozrejme okamžite idú do šuflíka, aby uvoľnili pristávaciu dráhu pre nové prístupy, ktoré treba vyskúšať. Výsledkom je častá zmena priority a postupná absencia pocitu reálneho efektu. Absenciu pridanej hodnoty si s odstupom času všimnú aj “tí hore” a tak pracovať v teame Julesa Verna znamená aj zvýšené riziko, že nejaká organizačná zmena zmetie bez akéhokoľvek varovania celý team z povrchu zemského (teda org chartového). Zároveň tento druh manažérov tlačí svojich ľudí skôr do polohy generalistov ako špecialistov, čo nie každému musí vyhovovať. V CVčku to vyzerá pôsobivo, ale keď pri pohovore do ďalšej práce narazíte na niekoho, kto to naozaj robil (a nielen skúšal, ako váš team), tak sa škaredo vykúpete vo vlastnej štave.

Rada, čo s tým: Ak ste JUNIOR v tejto oblasti, tak paradoxne je pre vás asi výhodnejšie pár rokov zostať. Získať široký (a plytký) rozhľad na začiatku kariéry nie je nutne zlá voľba. Neberte si však príliš vysokú hypotéku, aby ste nevykrvácali, keď jedno pekné ráno váš team zrazu prestane existovať. Ak ste SENIOR, konfrontujte ho s vetroplašstvom, ktoré predvádza. Dajte mu spätnú väzbu, že projekty chcete aj doťahovať a že jedna nová myšlienka týždenne zrejme postačí. Ak vás nepochopí alebo vysmeje, zájdite za jeho nadriadeným popíšte situáciu a povedzte, že buď ON(A) alebo VY. Obe odpovede budú pre vás tou správnou voľbou. Ak budete prvý, kto to urobí, asi len zachránite zvyšok teamu, ale vy prípadný odchod (možno aj s odstupným, aby sa vás rýchlo zbavili) ľutovať nebudete.

Aj vám sa objavil niektorý z týchto 4 typov na pracovisku. Zažili ste ešte nejaký ďalší typ dysfunkčného Data manažéra? Podeľte sa o svoje dojmy na info@mocnedata.sk. Držím palce, aby sa vám tento typ ľudí vyhýbal. A ak ich náhodou predsa stretnete, skúste sa riadiť radami z tohto blogu. Bon voyage!

Úloha z pohovoru: V ktorej krajine ste?

Pohovory na dátové pozície sú opradené zaujímavými mýtusmi. Niektoré zo zaujímavých aspektov už sme zhrnuli v jednom z blogov. V každom prípade najštavňatejšie časti výberových konaní sú práve analytické úlohy. Preto som sa rozhodol ponúknúť vám jednu novú zaujímavú, na ktorú som natrafil a ktorú sme zaradili do repertoáru pre naše výberové konanie. Ak vás úloha zaujme, môžete mi poslať svoj návrh riešenia na info@mocnedata.sk. Najpresvedčivejšie riešenie odmením zaujímavou vecnou cenou. Tak poďme na to:

Zadanie Úlohy

Ako dátový analytik, pracujúci pre firmu pôsobiacu vo všetkých krajinách sveta, ste dostali zanalyzovať dáta z poznávacích značiek (ŠPZ) áut. Dostali ste kompletnú vzorku o veľkosti 100 tisíc áut, o ktorej viete, že je reprezentatívnou vzorkou z danej krajiny. Problémom však je, že neviete z ktorej krajiny. Ako by ste len na základe 100tisíc značiek prišli na to, z akej krajiny vlastne pochádza?

Pravidlá riešenia

Dáta ste dostali v elektornickom zozname, takže neviete ako značky naozaj vyzerajú. Máte len textové reťazce týchto značiek. Nemáte možnosť googliť, aké formáty ŠPZ majú jedlnoité krajiny, teda riešenie nie je založené na tom, koľko akých typov znakov má tá či oná krajina v značke. Ako by ste napriek tomu uhádli pre ktorú krajinu sú dané značky?

Kam zaslať riešenie

Ak máte nejaký nápad, ako vyriešiť túto úlohu, neváhajte mi ho nápísať na info@mocnedata.sk. Ako som už spomínal vyššie, najlepšie riešenie odmením cenou. Teším sa na Vaše nápady!

Ak sa nechcete zapojiť do súťaže a len vás zaujíma správna odpoveď, nájdete ju TU.

Ak vás téme zaujíma, tu nájdete viac takýchto úloh, na ktorých sa môžete otestovať. Či už vás čaká v blízkej dobe pohovor alebo nie, pozrite si aj trendy v analytike dát na tento rok.

Kedy naozaj prídu samojazdné autá (na Slovensko)?

Vždy keď idem na Slovensku taxíkom, pýtam sa taxikárov, koľko si myslia, že sa budú môcť ešte týmto povolaním živiť. Väčšina z nich je zaskočených touto otázkou a hneď sa spätne pýtajú, ako to myslím. Keď objasním, že narážam na samojazdiace autá, s výraznou úľavou mi povedia, že “My sme na Slovensku a to potrvá najmenej 10-15 rokov, kým to k nám dorazí.” Ja im hovorím, že si myslím, že tak max 4 až 5 rokov. A to ma na západe pokladajú za pesimistu v tejto otázke. Ako blízko teda naozaj sme?

Tento blog je súčasť série článkov 15 kľúčových zmien 2018, ktorá hovorí o trendoch alebo prekvapeniach, ktoré sa pravdepodobne stanú v najbližších mesiacoch v oblasti dát a technológií. Ak pracujete v niektorej z týchto oblastí, prečítajte si okrem tohto blogu aj ostatné trendy na 2018

O samojazdiaciach (nazývaných aj autonómnych) autách sa toho veľa popísalo. Väčšinou však išlo o izolované projekty alebo marketingové chvastanie sa niektorej z automobiliek. Faktom je, že na Slovensku sa s autonómnymi vozidlami zatiaľ nestretávame. To zrejme spôsobuje aj pocit, že v tejto veci sa nič až tak dramatické nedeje. To však nie je celkom pravda …

Aby naša diskusia o tejto téme mala patričnú úroveň, bolo by vhodné hneď zo začiatku vysvetliť, že autonómne autá majú 5 rozličných stupňov samostatnosti. Poďme si ich teda postupne predstaviť:

Autonómnosť, alebo aj svojvôľu auta pri šoférovaní, sa pokúsili popísať mnohí, ale nakoniec sa ujala definícia, ktorú prinieslo Americké Ministerstvo pre Dopravu, prostredníctvom svojej dcérskej organizácie National Highway Traffic Safety Administration (NHTSA). Prvé „pravítko“ pre meranie autonómnosti auta bolo vydané NHTSA v roku 2013, neskôr bolo ešte jemne prepracované (pre nadšencov, tu je celý 30 stranový dokument).  Hoci samotné pravítko popisuje 5 stupňov, pre korektnosť diskusie treba povedať, že do nariadenia sa zapracoval aj nultý stupeň, ktorý predstavuje prevádzku auta čisto ľudským vodičom. Teda tak ako ju poznáme z každodenného šoférovania.  Tejto úrovni sa však, z pochopiteľných dôvodov, v tomto článku venovať nebudeme. (ak vás zaujíma ako zlými šoférmi v skutočnosti sme, môžete dať krátku odbočku sem)

1.Stupeň: Asistencia vodičovi. [Driver Assitance]

Keďže k plnej automatizácií vedie až 5 krokov, naše očakávania od prvej úrovne by mali byť relatívne skromné. Autá v prvom stupni autonómnosti ešte nič neriadia, iba odporúčajú vodičovi ako konať a na jeho pokyn môžu vykonať konkrétny úkon. Vždy však vykonávajú len typizovaný úkon (napríklad zaparkovať medzi pozdĺžne stojace autá), ktorý majú jasne pomenovaný a keď nie sú pre jeho vykonanie splnené všetky priaznivé podmienky (napr, medzera medzi autami je príliš tesná), auto musí odmietnuť úkon a vrátiť riadenie naspäť ľudskému vodičovi. Najčastejšie nástroje 1. stupňa (adaptívny tempomat, stabilizátor v jazdnom pruhu, …) sú už dnes súčasťou takmer každého nového auta. Tento aspekt je dôležitý, pre našu diskusiu, ako rýchlo dokážu nastúpiť autonómne vozidlá po ukončení testovania.

2.Stupeň: Čiastočná automatizácia [Partial Automation]

Pri druhej úrovni autonómnosti už ide trochu do tuhého. Palubný počítač totiž preberá už plnú kontrolu nad kombináciou viacerých prvkov riadenia súčasne. Zakiaľ v prvom stupni ste mohli dať pokyn autu, aby zaparkovalo do medzery a ono samo točilo volantom, plyn a brzdu ste stále museli obsluhovať vy. V druhom stupni už systém môže súčasne obsluhovať aj volant aj pedále, ale opäť iba na pokyn vodiča a iba do momentu, kým si to vodič praje. Za vedenie vozidla tak ešte stále zodpovedá človek, rovnako ako aj za vyhodnotenie celkovej dopravnej situácie. Preto kombinácia plynu a volantu auta môžu používať iba v situácií, keď je dosť času, aby auto mohlo bezpečne odovzdať vedenie vozidla vodičovi. Najčastejšími aplikáciami 2. stupňa sú preto jazda po diaľnici alebo v pomaly popoidúcej kolóne. Tento stupeň automatizácie je už dnes bežne dostupný v autách vyššej triedy a vo väčšine áut luxusných značiek ako Audi, BMW alebo Mercedes-Benz.

3.Stupeň: Podmienená automatizácia [Conditional Automation]

Tretí stupeň autonómnosti by mnohí bežní ľudia prehlásili už za plne autonómnu jazdu. Auto si totiž samo vyhodnocuje, kto v križovatke má prednosť, a či ten chlapec bežiaci po chodníku vbehne pravdepodobne do cesty alebo nie. V tomto stupni totiž auto už preberá zodpovednosť aj za monitorovanie prostredia a celkovú dopravnú situáciu. Stále však existujú situácie, kedy sa prudko mení povaha premávky (napríklad niekto sa rúti na vás v protismere a nie je kam sa uhnúť), ktoré auto nemá právo rozhodnúť. Autonómne vozidlo musí vodiča oboznámiť, prečo žiada jeho zapojenie do šoférovania a čo sa deje. Následne sa uvedie auto do módu nula, teda automat neovláda ani volant ani plyn. V odborných kruhoch sa tento mód volá “Eyes-off, brain on”, teda nemusíte sa dívať, ale musíte byť v strehu. Auto zároveň stále vôbec nemôže šoférovať samo v niektorých podmienkach (napríklad čiastočne nabúrané, jazda mimo vyznačené cesty, …).

4.Stupeň: Vysoký stupeň automatizácie [High Automation]

Po hutnej trojke, poviete si, čo ešte môžu skrývať ďalšie dve úrovne? Nuž štvrtá úroveň sníma z človeka aj povinnosť riadiť krízové situácie. Auto už sa rozhodne samo či v protismere rútiace sa auto bude pre posádku bezpečnejšie čelne naraziť alebo realizovať uhybný manéver do bočného zrázu za krajnicou. V tomto štádiu automatizácie už vodič nenesie zodpovednosť za riadenie vozidla a teda vo svojej podstate auto nemusí mať ani vodiča. Ako to, že to teda nie je posledný stupeň automatizácie? Nuž regulátor hovorí, že auto 4ho stupňa môže šoférovať len v rámci štandardných podmienok cestnej premávky. Ak nastanú podmienky, že senzory vozidla nie sú schopné vnímať dopravnú situáciu, auto musí zastať na kraji cesty a odmietnuť pokračovanie v jazde. Ak sa nachádza v takej situácii v aute vodič, môže prevziať riadenie, ak ide o auto bez vodiča, budú musieť pasažieri počkať na náhradné vozidla alebo aspoň “do vyriešenia problému”, pre ktorý auto zastalo. Medzi špeciálne módy, ktoré nebudú môcť jazdiť úplne samé, budú patriť napríklad aj autá s prednostným právom jazdy (sanitky,  policajné autá, …), ktoré musia niekedy úmyselne porušovať predpisy platné pre iných účastníkov premávky,

5.Stupeň: Plná automatizácia [Full Automation]

Ak ste čítali jednotlivé stupne postupne spolu so mnou, asi vám príde, že piaty stupeň je takmer zbytočný. Ide totiž o stav, kde samojazdné auto dokáže jazdiť aj mimo značené cesty (napríklad po prašných alebo lesných cestách) a dokáže sa šoférovať samo (aspoň v provizórnom móde), aj keď je nabúrané a nedokáže plne používať všetky senzory. (Jeden z princípov hovorí, že sa nechá “ťahať” iným autonómnym vozidlom, ktoré aj samo odnaviguje, kam potrebuje odtiahnuť.  Aj keď v teoretickej rovine ide o zaujímavý koncept, v praxi sa k implementácii 5ho stupňa pristúpi asi len pri veľmi malom počte vozidiel. Je však dôležité povedať, že pre masové rozšírenie samojazdných áut piaty stupeň nie je ani potrebný. Úplne by sme si vystačili s funkčným štvrtým stupňom.

Pre anglicky hovoriacich celkom pekne zhŕňa jednotlivé úrovne aj nasledovná infografika:

Autonomous-driving-levels_summary

Vo svetle týchto podrobností je potrebné náš dojem, koľko autonómnych vozidiel okolo nás jazdí, trochu poupraviť. Je to už šesť rokov dozadu, čo služobný Mercedes môjho šéfa dokázal na diaľnici sám držať odstup od vozidiel, sám sledoval stopu pruhov na ceste a keď ste v navigácii zadali, kam chcete ísť, sám sa radil automaticky do správneho pruhu na odbočenie. Keďže šéf bol unavený, poprosil ma, či by som to neodšoféroval naspäť. A poviem vám, bol to veľmi zvláštny pocit. Auto si išlo samo, cítil som sa ako dospelý, ktorý musí formálne robiť pedagogický dozor dieťaťu pár dni pred 18-tými narodeninami.  Samozrejme som sa snažil spočiatku dôkladne kontrolovať “rozhodnutia” palubného počítaču, ale po niekoľkých minútach som pochopil, že (podobne ako v prípade spomínaného skoro-dospelého teenagera) je to v podstate zbytočná obsesia. Po asi 100km som dospel do skľučujúceho pocitu. Nebolo do čoho brdnúť,  túžil som, že by mi niekto podal videohru alebo knižku do ruky.  Inokedy celkom pohodlné miesto vodiča sa mi zdalo odrazu akési stiesňujúce. Ničotný pocit uprostred, ani ryba ani rak. Ani pustiť oči z cesty (stále zodpovedám za prípadnú haváriu), ani z trucu prepnúť na manuál. Takto nejako vyzerá stupeň 2 autonómneho vozidla.

Tak kedy teda u nás?

2018 kalendárSkúsme sa však vrátiť naspäť k pôvodnej otázke: Kedy budú u nás jazdiť autonómne vozidlá? Táto otázka má dve roviny: technologickú a právnu. Z technologického hľadiska je postačujúce, aby sa firmy dopracovali k certifikovanému riešeniu stupňa 4. Nemalá časť automobilov už dnes má montované systémy na stupeň 2. To však znamená, že už musí mať všetky senzory pre to, aby mohla jazdiť aj stupňom 4, zostáva nahradiť len ľudskú hlavu. Nezabúdajte totiž, že stupne 3 a 4 už “dopĺňajú” nad rámec druhého stupňa “len” vyhodnotenie, čo je optimálna situácia. V reči počítačov, autá už majú potrebný hardware na autonómne riadenie (čo presne musí mať rozoberáme v tomto doplnkovom blogu), zostáva doplniť softvér. A ten sa dá dohrať aj do áut, ktoré neboli pôvodne vyrobené ako autonómne. Teda, ako náhle sa podarí nejakej automobilke získať certifikát na software úrovne 4, dokážu vám prerobiť existujúce auto na úroveň 4. Nebude teda treba masovo poslať do šrotu existujúce auta a slávnostne si kúpiť nové, autonómne. (tento argument mnohí používajú na podporu presvedčenia, že to bude trvať desaťročia, kým sa staré autá vymenia.) Jasné nehovorím o Škode 120L ani o Daewoo Tico, ale autá uvedené na trh za posledných 3-5 rokov už majú dané senzory alebo sú pripravené na ich domontovanie.

Samozrejme, na to, aby nejaká firma získala certifikát stupňa 4 bude musieť preukázať dozorujúcim orgánom, že auto zvládne rozsiahle testy v reálnej premávke. Taká autoškola pre palubný počítač. Narozdiel od ľudského vodičského testu (uvedomili ste si, že jazdíme v autoškole niečo menej ako 800 km, kým nám dajú vodičák?), autonómne autá musia najazdiť stovky miliónov kilometrov. Koľko presne, aby bolo dokázané, že spôsobujú menej nehôd ako ľudia, som rozpísal tu v doplnkovom blogu. Akonáhle však získajú certifikát, software môže byť masovo inštalovaný prakticky okamžite. U áut ako Tesla dokonca aj na diaľku, bez servisnej návštevy. Podľa informácií z branže sa viaceré spoločnosti nachádzajú v už v desiatkach miliónov najazdených kilometrov a pridávajú ich exponenciálnym tempom. Je teda pravdepodobné, že prví pionieri prekročia požadované hranice na prelome rokov 2018 a 2019. Potom už to pôjde riadne z kopca. Prečo teda väčšina verejnosti má pocit, že samojazdiace autá u nás tak skoro nebudú?

Idylku “Veď to je ešte sci-fi, nás sa to predsa netýka, …” podporuje aj pomerne zarážajúci fakt, že popredné priečky vo vývoji autonómnych vozidiel neobsadili samotné tradičné automobilky. V rebríčku počtu uznaných patentov na samochodné autá sú aj niektoré prekvapivé mená. Skúste si tipnúť, ktorá značka je najďalej, správnu odpoveď nájdete tu. Tým, že Slovensko je automobilovou veľmocou (stále vyrábame najviac áut na obyvateľa spomedzi všetkých krajín na svete), mnohí Slováci majú pocit, že keby to bolo tak horúce, tak to predsa musí byť znateľné už aj vo fabrikách, do ktorých každé ráno chodí pospolitý slovenský ľud (a desiatky Srbov, Bulharov a iných národností). Nuž a tu je zakopaný aj dôvod, prečo by naši politici mali spozornieť a urobiť aj nejaký ten krôčik vpred. Ak totiž autonómne vozidlá začnú chrliť značky, ktoré sa na Slovensku nevyrábajú, s našou automobilovou pozíciou to pôjde, slušne povedané, do temna hrubého čreva tou kratšou cestou.  Preto kroky ako súdny zákaz Uberu (ktorý bude zrejme jeden z prvých veľko používateľov autonómnych vozidiel) alebo i číra absencia diskusie o tom, ako by mali vyzerať pravidlá premávky so samojazdiacimi autami.

Toho posledného bodu sa týka aj druhá rovina samojazdiacich áut, právny aspekt. Podľa aktuálnych zákonov, motorové vozidlo stále vedie vodič a vodičom musí byť svojprávna, (až na niektoré výnimky) dospelá fyzická osoba, ktorá navyše úspešne absolvovala vodičský kurz v autoškole.  Teda aj keď bude mať nejaká firma platný medzinárodný certifikát na stupeň 4 alebo nebodaj 5, stále mu to nemusí znamenať, že autá budú môcť jazdiť bez vodiča. Ak sa Slovenská vláda rozhodne, pokojne môže takéto autá z našich ciest vykázať . Samozrejme odpoveďou môže byť, že niekto z cestujúcich sa prehlási za vodiča a sadne si dopredu (aby nešoféroval z kufra ako Michal Kováč mladší). Musí mať však platný vodičák a stále ponesie plnú zodpovednosť za prípadnú dopravnú nehodu. Druhou možnosťou bude, že sa polícia rozhodne uplatniť na autonómne vozidlá objektívnu zodpovednosť (ktorá už funguje dnes) a bude brať na paškál vlastníka vozidla, bez ohľadu na to, kto bol v danom vozidle sediaci. To by v dnešnom právnom systéme jemne zvýhodňovalo firmy (právnické osoby), ktoré by ľahšie mohli takéto riziko jednoducho poistiť, ale z prípadných smrteľných nehôd by sa vyviniť samozrejme nešlo. Je pomerne smutné, že o tejto téme sa zatiaľ na Slovensku zatiaľ nezačalo ani diskutovať. Slovensko je totiž tranzitnou krajinou pre pomerne veľa nákladnej, cestnej dopravy. Práve kamióny a nákladné autá budú rýchlo nahradené, lebo vodiči predstavujú zbytočný rizikový  ľudský faktor a vysokú nákladovú položku celého podnikania týchto firiem.

Ak by sme však predsa zostali (opäť raz) Absurdistanom a autonómne autá nepovolil, či dokonca aktívne zakazovali, svoje plány už s autonómnymi autami má aj Európska únia. Takže úplný zákaz nám asi nehrozí, ale faktom zostáva, že ak by sa autonómne vozidlá objavili u nás len vďaka legislatíve EU, tak by to mohlo trvať o 3-4 roky dlhšie, ako keď si prijmeme vlastnú legislatívu dobrovoľne. Takže zostáva dúfať, že sa nájde niekto osvietený na ministerstve dopravy alebo vnútra (neverím, čo píšem), kto túto tému pohne ďalej.

EXTRA: Autonómne autá rozobrané na detail

Koľko musí počítač chodiť do autoškoly?  — Ako bezpečné sú jednotlivé značky samo jazdiacich áut? — Prečo nástup áut bude tak rýchly? — Čo musí mať autonómne auto navyše oproti bežnému autu?

Toto je doplnkový blog k téme Autonómnych áut, pre ľudí, ktorí majú aj hlbší záujem o túto tému. Vtesnať všetky fakty do jedného blogu, by bolo pre “menej nadchnutých ” zrejme úmorné, tak som detailnejšie fakty posunul do tohto doplnkového blogu. Výnimočne som sa rozhodol odomknúť doplnkový materiál aj pre bežného návštevníka. Ostatné doplnkové blogy sú zamknuté iba pre členov Mocnedata,sk komunity. Dobrou správou však je, že členom komunity sa môže stať bezplatne každý, za menej ako 2 minúty svojho času.

Prečo tak rýchlo?

Pôvodný blog nám vysvetlil jednotlivé štádia (stupne) autonómnosti áut a pridal odhad, kedy je pravdepodobné, že sa objavia prvé autonómne autá aspoň stupňa 4. Keďže však aktuálne po cestách jazdia iba autá stupňa dva, niektorí si môžu klásť otázku, ako je možné, že z 2. na 4. sa podarí preskočiť tak rýchlo? Človek by predsa očakával, že ak čochvíľa majú jazdiť autá stupňa 4., už by predsa mali bežne chodiť po svete vozidlá 3. stupňa automatizácie.

google-autonomous-car-prototypeNech táto úvaha znie akokoľvek logicky, nie je v skutočnosti pravdivá. Ak sa opätovne začítate, do popisu stupňov autonómnosti, zistíte, že stupeň 3 je v podstate dosť neprakticky. Auto totiž jazdí samo, až kým nenastane situácia, ktorú nevie vyriešiť. V takom prípade, upovedomí vodiča, že musí prevziať riadenie vozidla a auto-pilot sa vypne. Ak človek nezareaguje, správa sa to podobne, ako keď dnes čítate SMSku alebo nejak inak nevenujete pozornosť riadeniu, teda často tragicky. Pre človeka na mieste vodiča by to bola medvedia služba, lebo auto by nepožadovalo jeho permanentnú pozornosť, ale ak by sa niečo zomlelo, stále by za situáciu zodpovedal človek. V odborných kruhoch sa tento jav popisu aj ako “Eyes-off, Brain On” (nesledujem, ale som čulý zareagovať). V praxi by takýto postup staval vodiča do nevýhody alebo bol ešte oveľa vyčerpávajúcejší ako bežné šoférovanie, každá interakcie človeka by bola len “v problémovej” situácií na ceste.

Z tohto dôvodu sa väčšina firiem vyjadrila, že nebudú vyvíjať modely úrovne 3, lebo by po nich nebol skutočný dopyt a vyvolali by len vlnu nevôle medzi užívateľmi. Po tajme teda (takmer) všetky spoločnosti pracujú priamo na úrovni 4 a vyššie. To, že po svete ešte nebehajú sériovo vyrábané autá Stupňa 4. teda nemá žiaden vplyv na príchod verzií stupňa 4. Mimochodom, ak vás zaujíma, ako sa jednotlivým automobilkám darí v patentovaní autonómnych áut, tu nájdete odpoveď.

Ako dlhá je autoškola pre počítač?

V blogu sme rozoberali, že bežný študent autoškoly, než dostane vodičský preukaz, najazdí menej ako 1000 km. Koľko je teda táto hranica pre počítačový algoritmus? Ako to už býva, pri počítačových algoritmoch naše nároky (občas aj trochu pokrytecky) oveľa vyššie nároky. Podľa výskumu RAND corporation, vedeného Nidhi Kalra, Susan M. Paddock, by na preukázanie rovnakej nehodovosti ako dosahujú ľudia bolo potrebné, aby autonómne vozidlo v testovaní odjazdilo aspoň približne 30 miliónov míľ. Ak by sme si však dali za cieľ obhájiť iba rovnaký (alebo nižší) počet zranených, postačilo by  auto odjazdilo aspoň 800.000 míľ. Pre porovnanie uvediem, že keď aktívny vodič odjazdí 25 000 km (= 16000 míľ) ročne, tak rovnako prísny vodičák by dostal po 50 rokoch autoškoly, teda zrejme v posledných rokoch svojho života. Pričom počas celých 50 rokov by bol v skúšobnej dobe, teda ak by spôsobil nejakú nehodu, vodičák by ani nedostal. Graf z danej štúdie dokumentujúci tieto čísla pripájam nižšie:

Autonomous driving SAFETY km needed

Samozrejme, bolo by asi zbytočne lacné žiadať, aby autonómne autá boli “len” tak dobré ako ľudia. V skutočnosti práve znížená nehodovosť je jedným zo zásadných argumentov pre zavedenie autonómnych vozidiel. Vyššie uvedený graf teda zároveň dokumentuje, koľko míľ by muselo autonómne auto najazdiť v testoch, aby preukázalo zníženie nehodovosti na polovicu alebo štvrtinu ľudskej chybovosti. Pre preukázateľné zníženie úmrtnosti na o -60% percent by muselo auto absolvovať podľa danej štúdiu miliardu míľ, ak by sme chceli ísť na -90% ľudskej úmrtnosti, muselo by auto odtrénovať až 20 miliárd kilometrov. (Osobne som si nie istý, či autori správne posúdili efekt toho, že ak budú jazdiť autonómne vozidlá v premávke s inými autonómnymi vozidlami, tak počet kilometrov na preukázanie nehodovosti bude nižší, lebo stroje sú k sebe, žiaľ ohľadu plnejšie ako sme k sebe my ľudia.

Ak zoberiete do úvahy, že priemerná rýchlosť (mix obce a mimo obce) je niekde okolo 70km/h, ak by firma použila 10.000 áut jazdiacich paralelne a testujúcich nonstop, takýto test by si stále vyžadoval 1909 dní, teda 5 aj štvrť roka.  Ak si aj odmyslíme samotnú cenu vozidiel a analytickej práce na vyhodnotenie testov, len samotné palivo na takýto test by stálo miliadru EUR. Nakoniec v počte kilometrov bude zohrávať rolu aj to, na ktorej strane cesty má autonómne auto jazdiť. Prečo je to dôležité, vysvetľujem tu.

Drobná dátová komplikácia

Ako popisuje jeden z odsekov nižšie v tomto blogu, prevádzka autonómného auta bude generovať veľký objem dát. Nie síce tak enormné ako lietadlá, ale predsa dosť veľké, aby boli problémom sami o sebe. Podľa odhadov EU môže jeden autonómny plug-in hybrid generovať až 25 GB dát za každú hodiny prevádzky. Spočiatku sa dáta budú zrejme ukladať do nejakej dočasnej pamäte priamo v aute, ale pre účely auditu a zlepšovania riadiacich programov samojazdné dáta budú nemalú časť tohto objemu určite posielať aj do centrálnych serverov. Ak si predsatvíte, že len VolksWagen vyrobí 1 milión nových áut ročne, infraštruktúra výrobcu bude musieť byť schopná uchovať záznamy pre desiatky miliónov áut, čo pri 2 hodinách priemernej jazdy auta denne predstavuje 500 000 TB dát. Aj keby sa prenášala len 5% zo všetkých zaznamenaných údajov, stále sa bavíme o presení vzduchom, uchovaní a zanalyovaní 25 000 TB dát každý jeden deň. To, čo znie ako “vedľajší efekt”, v skutočnosti bude výzva sama o sebe.

Čo musí mať autonómne auto navyše oproti bežnému autu?

V pôvodnom blogu sme nemali príliš priestoru detailne rozobrať, čo vlastne musí autonómne vozidlo mať nad rámec bežného auta. Táto otázka je však kľúčová pre pochopenie, prečo sa príchod autonómnych vozidiel tak nezadržateľne blíži. Dovoľte mi dať teda tejto veci zadosť práve v tomto doplnkovom blogu. Nad rámec bežného auta je teda pre autonómnu jazdu potrebné mať nasledovné:

Prvotným predpokladom je, že auto bude schopné replikovať naše zmysly. Teda potrebuje senzory, aby videlo (aspoň toľko), čo vidí človek. Keďže však ľudský zrak sníma všeličo iné (okrem iného aj sexi stopárku pri ceste), na miesto izolovania zrakových vnemov výhrade pre šoférovanie priamo zo simulovaného zraku, rozhodli sa autonómne vozidlá zabezpečiť si niekoľko rôznych systémov nahrádzajúcich zrak. (napr. radar pre vzdialenosti iných áut, kamery pre snímanie značiek, kamery pre snímanie blízkeho okolia auta (napríklad chodci, prekážky pri cúvaní, …)).

Na rozdiel od človeka, stroju nestačí vidieť, lebo stroj musí videné ešte stotožniť s nejakým reálnym objektom. Ak na ceste leží objekt kvádrového zjavu, človek okamžite vidí, či je to prázdna krabica alebo kus žuly a vi sa podľa toho či riskovať prudký výhybný manéver alebo objekt proste ignorovať. Rovnako musí rozoznať, že tá lesklá časť vozovky je v skutočnosti vodná hladina výtlku. Okrem senzorov na videnie, tak potrebuje autonómne riadenie aj software na rozpoznanie objektov na a vedľa cesty.

Okrem toho samozrejme musí auto vedieť kde je a kam ide, takže súčasťou systému musí byť veľmi presná lokalizácia. Byť o pol metra niekde inde ako som si myslel, že som, môže znamenať, že zišli z cesty. klasické GPS z navigácie tu teda neobstojí. Navyše musí mať palubný počítač k dispozícií aj mapové podklady a vedieť zareagovať aj v situácií, keď optické videnie signalizuje, že nie sú aktuálne. (napríklad jeden pruh cesty sa pred chvíľou prepadol kvôli erózie pôdy, hoci na mape je cesta krásne dvojprúdová).

Málokomu by napadlo, že ak má auto riadiť samé, musí byť už vo svojej primitívnej podstate ovládateľné strojom, teda točenie volantom alebo brzdenie musí byť manuálne vykonateľné strojom. Stroj musí zároveň byť shopný vivinúť aj rôznu intenzitu tlaku na plynový, či brzdný pedál. Keďže vozidál stupňa 4. stále budú pripúšťať existenciu situácií, kde musí to isté riadenie prevziať človek, auto stále musí fungovať aj po ľudsky (človek musí mať nejakú formu ako urobiť to isté, čo by dokáže stroj) a dokonca vymedziť, kedy ľudský protipohyb voči strojovému preberá kontrolu a kedy naopak nie. (Ak sa auto rúti na stenu z betónu, auto by nemalo dovoliť vodičovi pridávať plyn, aj už je na hranici brzdnej dráhy, inokedy však môže ísť o výhybný manéver.)

Keďže autonómne riadenie nie je súbor natvrdo naprogramovaných vzorcov správania, ale musí byť schopné vyhodnotiť aj situáciu sk torou sa doposiaľ nestretlo, musí obsahovať palubná jednotka rozhodovací modul, zrejme na báze neurónovej siete. Navyše tento rozhodovací modul, musí byť priebežne verifikovaný (z externého prostredia), by sa nenaučil niektoré zlozvyky. Na tento účel sa budú zrejme výsledky rozhodovania priebežne odosielať do nejakého centrálneho strediska, ktoré bude v reálnom čase hľadať nedokonalosti systému a aktívne ich opravovať vo všetkých ostatných autácu tej istej značky.

Keď už sa rozhodovací modul rozhodne, čo v danej situácii robiť, musí existovať nejaký fyzikálny model, ktorý pretlmočí rozhodnutie do súboru pokynov pre samotné ovládanie auta (podraď o jeden stupeň, vyhoď smerovku, vykloň sa do protismeru a prudko pridaj, aby si stihol predísť pomalšie auto pred Tebou). Úlohou tohto modelu bude zvoliť vždy čo najvhodnejšiu kombináciu možných úkonov.

Vykonávanie niektorých vyššie uvedených úkonov si vyžaduje prítomnosť osobitného hardwaru (samostatný procesor, pamätový čip na ukladanie dát), ktorý navyše musí zvládať bezpečnosť tak, aby nebol priamo napadnuteľný (alebo aspoň toto riziko výrazne potáčal). Toto je dôvod prečo si mnohí myslia, že príchod autonómnych áut je daleko, lebo väčšina dnešných áut takýmto hardware nedisponujú. V skutočnosti však ide o veci pomerne malých rozmerov, na ktorých domontovanie v karosériách dnešných áut je dostatok priestoru. Teda, ak bude treba, aby tam takéto zariadenia boli, miesto pre ne už exsituje, stačí ich domontovať.

Zdanlivo triviálne pôsobí aj požiadavka, že auto bude musieť mať svoj vlastný operačný systém. Už menej humorne pôsobá predstava, že by sa tejto role ujal niektorý, v PC z bežne používaných operačných systémov. (napríklad modrá WIN obrazovka počas autonómnej jazdy). Teda je zrejmé, že operačný systém pre auto bude musieť byť budovaný úplne inak a navyše bude musieť “zniesť” operačné systémy iných zariadení, ktoré s nim budú komunikovať (smart semafóry, iné autá, …).

V neposlednom rade musí existovať ďalšia vrstva systému, ktorá dáva pozor na súhru všetkých vyššie menovaných elementov. Tá napríklad musí byť schopná rozoznať, že signály, ktoré posiela senzor sú “čudné” a teda je možné, če je špinavý alebo poškodený a neuviesť tak celé auto do tragického omylu. To je zároveň jednotka, ktorá ohlási človeku, kedy auto nie je schopné viesť auto a musí buď zastaviť alebo odovzdať riadenie človeku.

Sumár všetkých vecí ponúka aj nasledovná infografika:

 ELEMENTY autonómneho auta

Ako bezpečné už sú prototypy jednotlivých značiek?

Iste si kladiete otázku, od koho si teda kúpiť autonómne auto. Aj keď množstvo výskumu (a stým súvisiacich patentov) určite je dôležité kritérium, určite by “bodlo vedieť” aj to, ako sa darí jednotlivým prototypom. V dnešno monitorovanom svete samozrejme exsitujú informácie aj o tejto stránke pokroku. Na základe štatistík štátu California (kde sa väčšina autonómnych áut vyvíja) teda FT zozbierala štatistiky, ako často muselo autonómne vozidlo v testovaní vzdať sa riadenia o požiadať o intervenciu človeka (tento počet samozrejme obsahuje v sebe už aj nehody, lebo to boli situácie, keď ani ľudský zásah nehode nezabránil). Keďže každý team najazdil odlišný počet km so svojimi prototypmi, výsledky je potrebné realitizovať voči nejakej spoločnej báze (napr. na 1 km jazdy). Čísla sú to naozaj zaujímavé:

Autonomous driving RESULTS

Okrem iného štatistika dokumentuje, že navrch majú tie teamy, ktoré robia najväčší počet kilometrvo testov, lebo -podobne ako u ľudí – čím viac skúseností, tým viac naučených pravidiel ako reagovať aj na menej bežné javy. Najnižší počet incidentov, kde  bolo treba zásah človeka má Google (cez svoju platformu Waymo), iba 1 zásah za približne 5000 míľ. Tesla aj Bosch, ktorí vlastnia veľa patentov v tejto oblasti zjavne však nemajú ešte nabehaných toľko KM a teda požiadavky na zásah človeka sa objavujú aj častejšie ako každú tretiu míľu. (čo by zjavne zatiaľ asi neobstálo).  Z bežných značiek ešte výborné čísla dosahuje BMW alebo Ford, aj keď u nemeckého výrobcu je možné, že testy prebiehajú vo veľkej miere aj v Európe, takže nie je zrejmé, či ich Kalifornská časť je reprezentatívnym obrázkom celkového výkonu.

A budú vôbec ľudia chcieť cestovať autonómnymi autami?

Autonomous-driving-trustKeďže povedomie o príchode autonómných áut je u nás na Slovensku, žiaľ, pomerne slabé., občas dostávam aj otázku: A kto vlastne bude chcieť tými samojazdnými autami cestovať? Dôverujú vôbec ľudia tomuto vynálezu? Solídny výskum na Slovensku zatiaľ nebol realizovaný (alebo minimálne zverejnený), ale čo to napovie postoj iných krajín. Pre mňa zaujímavé  je, ako rozličné sú postoje naprieč kontinentami. Európa je zatiaľ chladnejšia k tejto téme ale treba povedať, že Európa má zase jednu z najnižších nehodovostí áut na svete, takže argument záchrany ľudských životov tu nie je až tak plastický (alebo je pre neho latka postavená veľmi vysoko).  Štúdia pochádza od spoločnosti CISCO a bola realizovaná už v roku 2013, približne v čase, keď Tesla predstavila Model S:

Krajiny ako India, Čína a Brazília sa vyslovene pachtia za implementáciou autonómnych áut. V skutočnosti to však môže predstavovať (najmä v odľahlejších častiach Brazílie a Indie) väčší problém ako v iných tradičných krajinách. V Nemecku idea samojazdiacich áut nadchýňa iba každého tretieho človeka. Celosvetoto však podpora už prekročila 50% a teda je predpoklad, že s príchodom áut stupňa 4, vznikne rýchlo aj početný dopyt.

Ostatné doplnkové blogy pre členov Mocnedata.sk komunity:

Najčastejšie chyby v emailoch – Ako ich nájsť a opraviť

Čo by mal vedieť Dátový analytik? [veľký prieskum]

Špeciálny nástroj k meninovým kampaniam