Čo by mal vedieť Dátový analytik? [veľký prieskum]

Počas leta 2017 sa rozhodol portál Kaggle, ktorý je známy propagovaním dátovej analytiky a organizovaním dátových súťaží, zrealizovať rozsiahly prieskum medzi odborníkmi v Data Science a dátovej analytike. Celkovo sa zúčastnilo daného prieskumu viac ako 16000 expertov, ktorí odpovedali na otázky ohľadne toho, čo reálne vo svojej práci používajú, ako si našli prácu, koľko zarábajú ale aj to, ako sa posunúť ďalej. Keďže som mal tu česť sa zúčastniť tohto odborného panelu, môžem vám teraz exkluzívne na www.mocnedata.sk sprostredkovať niektoré zaujímavé výsledky tohto prieskumu. Registrovaní členovia komunity MocneData si môžu stiahnuť celé výsledky prieskumu v tomto doplnkovom blogu. Pre otvorenie budete potrebovať heslo k uzamknutým blogom, ktoré ste dostali pri registrácii do komunity.

***** Ak ešte stále nie ste registrovaným členom komunity, za 2 minúty a úplne bezplatne sa zaregistrujete TU. *****

Aké vekové skupiny pracujú v data miningu

O tom, že práca dátového analytika je pomerne mladá profesia sme už hovorili v predchádzajúcom blogu.  Aby sme tomu však dodali úplný kontext, pozrime sa na vekové rozdelenie tejto profesie podľa odpovedí expertov z daného odvetvia. Z grafu je vidno, že medián veku Dátového analytika je približne 30 rokov, pričom “vekový chvost” sa ťahá až do 50+ ročníkov:

KAGGLE prieskum vek analytika

Ako dlho musím študovať, aby som sa uplatnil v tejto brandži?

Pri najímaní ľudí do dátových pozícií sa vedú siaho-siahle polemiky o tom, či postačuje základné vysokoškolské vzdelanie alebo by ste mali pri budovaní Data Science teamov siahať po ľudoch s doktorátmi z data analytiky. Dáta ukazujú, že väčšina teamov si vystačí bez PhD držiteľov, aj keď v skutočnosti to môže byť klasický chicken-egg problém, keď ľudí s doktorátmi v tejto oblasti je tak málo, že aj keby ste najali všetkých ľudí s PhD z tejto oblasti, tak by stále boli v menšine oproti ostatným dátovým analytikom. Nuž pohár môže byť aj poloplný aj poloprázdny, aktuálne výsledky však ukazujú, že ak sa chcete teraz zamestnať v oblasti datových analýz, len každý 4tý zamestnávateľ očakáva/ocení III. stupňové vysokoškolské vzdelanie v dátovej analytike:

KAGGLE prieskum titul

Aké metódy/algoritmy sú najčastejšie potrebné

Z môjho pohľadu veľmi zaujímavou spätnou väzbou bolo vidieť, aké metódy dátovej analytiky najčastejšie v pokročilej analytike používajú analytické teamy po celom svete. Pri vyberaní ľudí do nášho teamu sa totiž často stretávam s tým, že kandidáti básnia o tom, ako by chceli pracovať na deep learningu (neurónových sieťach). Skutočným chlebom a soľou denno-dennej analytickej práce dátových teamov sú však (zatiaľ) ešte stále Machine learningové modely. Musím povedať, že výsledky tohto zisťovania pragmaticky poukazujú na to, že dobre zvládnutá logistická regresia je stále cennou zbraňou v biznis aplikáciách data miningu.

Ak patrte medzi začínajúcich dátových analytikov, tak tento graf môžete brať ako návod, čo si naštudovať ako prvé (s čím sa najčastejšie stretnete). Rád by som upozornil aj na to, že ak si sčítate odpovede expertov v prieskume, tak priemerný dátový analytik musí ovládať minimálne 3 rôzne metódy predikcie:

KAGGLE prieskum pouzivane metody

Aký “šrobovák” na to potrebujem?

Pomerne zaujímavo vyznieva aj odpoveď, aký nástroj najčastejšie pri svojej práci Dátoví analytici používajú. Že sa oplatí zohnať si nejakého hada, sme už spolu rozoberali na tomto portáli. Takže prvenstvo Pythonu je len opätovným potvrdením, že tento trend treba brať vážne, ak chcete ďalej pracovať v dátovej analytike aj do budúcna. Z uvedeného grafu by som však chcel vypichnúť iné 2 podstatné veci. Všimnite si, že SQL je potrebné stále vo viac ako 53% prípadov. Keď sme testovali kandidátov prácu v Teamviewer Data Science teame na ich technické zručnosti, podozrivo veľa z nich malo vážne medzery v tradičnom SQL. Ako by pri celom hype okolo RNN a CNN zabúdali na to, že väčšinu dát, ktoré budú spracovávať, sú štruktúrovanej povahy a bude ich potrebné vydolovať z nejakej relačnej databázy.

Druhým podstatným javom, ktorý by nemal uniknúť vašej pozornosti, je, že v prvej desiatke najpoužívanejších nástrojov nenájdete žiaden typický proprietárny systém ako SAS, SPSS alebo nim podobné. Ak ste sa teda v minulosti spoliehali primárne na znalosť týchto softwarov, bolo by vhodné si doplniť zbierku aj o znalosti niektorých z tu uvedených Top 15.

KAGGLE prieskum nastroje

Aké dáta budem spracovávať?

Na záver nášho krátkeho exkurzu do zákutí práce dátových analytikov by som rád pridal zaujímavý pohľad, ktorý hovorí o tom, s akými druhmi dát budete pri práci dátového analytika prichádzať do styku. Asi nikoho neprekvapí, že tabuľke stále dominujú štruktúrované relačné dáta z klasických SQL zdrojov (čo podčiarkuje potrebu SQL). Čo je však zreteľu hodné, že analyzovanie textu je už potrebné pri viac ako 50% prípadov pracovných pozícii. Tu vidím asi najväčší disconnect medzi tým, kam sa odborná diskusia uberá na Slovensku a v zahraničí. Ak si zájdete na nejakú lokálnu odbornú konferenciu o analytike, príspevkov o systematickom analyzovaní textu, prípadne best practice v tejto oblasti je ako šafránu. Apelujem preto na všetkých organizátorov týchto eventov, mali by sme sa posunúť bližšie k usecasom s text miningom, ak nechceme zostať na periférií rozvoja.

data typy

Pár slov na záver

Myslím, že výsledky tohto prieskumu môžu byť cenné nielen pre jednotlivé univerzity, ktoré majú vychovávať pre náš pracovný trh dátových analytikov, ale aj pre personálne agentúry, či manažérov analytických teamov, ktorí hľadajú ľudí pre analytické teamy. Trendy, ktoré sa v tomto prieskume popisujú boli dôvodmi, prečo som sa rozhodol skúsiť šťastie v zahraničí. Myslím, že je to cenné zrkadlo aj každému z nás, ktorí v odvetví data miningu pracuje alebo plánuje pracovať. Štúdia jasne pomenúva, ako má profil žiadaného dátového analytika vyzerať a tak si každý vieme pozrieť, aký gap do tohto profilu ešte stále máme. Ak teda patríte do jednej z týchto skupín, odporúčam Vám pozrieť si aj detailné dáta z tohto prieskumu.

Osamelosť dátového analytika

Viac peňazí. Nové výzvy. Nezhody s aktuálnym šéfom. Túžba pracovať na väčších dátach. Alebo celosvetový mier. Ani jeden z nich nie je hlavným dôvodom pre zmenu práce dátového analytika. Čo ním teda skutočne je?

Nielen americké súťaže krásy, aj pracovné pohovory majú svoje „prajem si celosvetový mier“ repliky. Sú to vyjadrenia kandidátov o tom, prečo sa rozhodli zmeniť práce. Za svoju kariéru už som mal na pohovoroch viac ako 200 ľudí a tak nebola núdza ani o bizarnosti typu „otec vás pozdravuje, že Allianz je stále dobrá firma a dúfa, že ma prijmete do zamestnania“. Keďže však tento krát robím prvé pracovné pohovory v zahraničí, hovoril som si, že možno spoznám nové, lokálne “svetové miery“. Moje prekvapenie však bolo o to väčšie.

Osamelosť v menovateli

Keď sa to objavilo na prvom pohovore, hovoril som si, že je mi to ľúto. Keď však druhý a potom tretí aj štvrtý kandidát vyrukoval s tým istým dôvodom odchodu zo súčasnej práce, spozornel som. Začal som rozmýšľať, či som sa presekal do nejakého podivného šípového kráľovstva, kde všetkých postihol ten istý osud. Nech som to obracal z akéhokoľvek uhlu, stále mi to nešlo do hlavy. Tým spoločným menovateľom všetkých kandidátov z daného dňa totiž bola osamelosť. Nie partnerská ani kamarátska. Bola to pracovná, analytická osamelosť.

Ako sa príbeh vinie …

Vyštudovali ste technický smer, či aspoň IT odnož niektorého z ekonomických smerov. Zbožňujete rébusy a kvízy (mimochodom pozrite si ten náš), milovali ste Pytagoriádu a teší vás, keď objavíte nejakú novú súvislosť. Rozhliadnete sa preto po trhu práce, kde by ste mohli tieto svoje „vlohy“ konštruktívne použiť. Idete na niekoľko pohovorov a tam sa dozviete, že spoločnosť má vážne dátové dilemy a tak budú na vás kladené vysoké nároky. Potešíte sa. Presne to chcete, aby z vás niekto vyžmýkal pot a niečo nové ste sa naučili.

Spočiatku je to naozaj zábava, objavujte nové dáta, ktorým sa nikto pred vami (a po vás, ale to ešte neviete) nevenoval. Náročné analýzy sú v skutočnosti len prezlečenými, triviálnymi dátovými úlohami, často spadajúce do kategórie reportingu. Ale práca je zábavná. Váš šéf síce často nerozumie vašej práci a nevedel by vám vo výpočte nájsť chybu, ale je zväčša milý. Čas plynie, máte za sebou kvartál, rok dva … Bože ako to letí.

K druhý Vianociam si prajete od Ježiška nového šéfa, nový projekt alebo aspoň novú verziu software, s ktorým robíte. Nech sa aspoň niečo posunie vpred vo vašom živote. Skúsite zmeniť prácu: start-up, veľká korporácia, rodinná firma. Chvíľkové nadšenie … a potom jojo efekt frustrácie ako pri redukčnej diéte. V záchvate vnútorného boja sa prihlásite na odbornú konferenciu, veď načerpať inšpirácie sa dá aj od ostatných. Stretnete tam veľa dvojníkov, ktorým v očiach tiež postupne vyhasína iskra nadšenia.

samota

Osamelosť dátových analytikov

S drobnými obmenami, takto nejak vyzerali všetky štyri príbehy. Ani jedného z kandidátov nenapadlo sa pýtať na plat, či firemné benefity. Ani jeden z nich neriešil kariérne možnosti. Jediné čo ich zaujímalo je ČO a POD KOHO vedením budem robiť? „V aktuálnej práci som jediný, kto robí data science. Nik iný tam tomu nerozumie, nemám sa s kým poradiť. Viem iba to, čo som si sám vygooglil po stackoverflow.com a podobných fórach. Cítim sa osamelo.“

Je to naozaj zaujímavé, ale keď sa nad tým zamýšľam, nachádzam vo svojom okolí veľa podobných prípadov. Povolanie analytikov totiž prechádza takou zvláštnou vlnou. Po ľuďoch analyzujúcich dáta je obrovský dopyt. Keďže však Data science je veľmi mladá odnož analytiky, ešte nedorástlo mnoho manažérov, ktorí sami vyššiu dátovú analytiku robili. Analytické pozície tak často spadajú pod manažérov, ktorý tejto oblasti nerozumejú. Mladí, začínajúci analytici sú tak odsúdení na cestu bonsaja: Nikto neočakáva, že by si mal niekam vyrásť, občas Ťa polejú, ale ináč si len karikatúra skutočného stromu. O úskaliach vzdelávania v analytike sme už písali v blogu Dobre, nejak začnete … A čo potom? , avšak spolu s týmito príbehmi sa mi tento obraz opäť vrátil intenzívnejšie.

3 krát ten istý refrén

Okrem toho, že zjavne nejde o ojedinelé prípady analytickej osamelosti, ešte smutnejšie je, že osamelosť analytikov je vlastne mrzká súhra troch faktorov. Tým prvým je, že data scientistov je stále veľmi málo. A teda len veľmi zriedkavo sa zíde v tej istej firme viac ľudí s týmto popisom práce. Controlling, reporting, dátový správca, to všetko sú aspoň „párové“ pozície. Sofistikovanejšia analytika je však zväčša osamelá. Dôsledkom tohto prvého faktoru je, že Data scientisti nezažívajú teamovú spolupatričnosť, nemajú s kým konzultovať svoje domnienky či neistotu.

Druhým faktorom osamelosti sa stala absencia manažérskeho vedenia. Sofistikovanejší analytici často spadajú do teamov, ktoré s dátami robia len okrajovo. Prípadne s dátami pracujú, ale robia len reporting nad štruktúrovanými databázami. Tento faktor teda spôsobuje, že Data scientisti nedostávajú feedback na svoju prácu, musia sa učiť len na vlastných chybách (ktoré si navyše ešte aj sami po sebe musia nájsť). Niektorí sa trápia samo-vzdelávaním, ale málokto má sebadisciplínu vydržať v tom roky. Väčšina hodí uterák do ringu skôr či neskôr.

K vyššie menovaným sa pridáva aj osamelosť voči externému know-how. Bez urážky, ale ak chcete zažiť takú konferenciu, na ktorej vám niečo dá naozaj každá prednáška, zrejme si ju sami budete musieť zorganizovať. Nežartujem, verte mi, viem o čom hovorím. Táto osamelosť bola podnetom k zúfalým snahám dať dokopy aspoň nejakú komunikáciu v Data science oblasti. Vznikli tak Meet-upy, ktoré sú v mnohých krajinách jedinou náhradou za absentujúce expertné konferencie.

meetup

Ako z kruhu von ?

Hoci tomu rozprava doposiaľ nenasvedčuje, príbehy štyroch „osamelých“ sú vlastne happy endy. Aj keďpredstavujú smutnú sondu do duše súčasného dátového analytika, sú zároveň ukážkou toho, ako von z trojitého zovretia osamelosti. Na základe ich rozprávania a vlastných skúseností s touto osamelosťou, odporúčam nasledovné 3 kroky ako von z tejto osamelosti:

Krok 1: Samodiagnostika. Skutočné úspešná bude zmena, iba, keď si všetci zúčastnení od začiatku priznajú, že táto zmena je nevyhnutná a neodvrátiteľná. Položte si preto tri nasledovné otázky: 1] Mám šéfa, ktorý rozumie mojej oblasti tak, že by ma vedel v mojej neprítomnosti krízovo zastúpiť ? 2] Je v našej firme ešte niekto iný, koho by som sa vedel(a) spýtať, či postupujem správne, keď sám(a) neviem ako na to? 3] Mal(a) som za posledného polroka šancu na vlastnej koži vyskúšať aspoň 2 nové postupy analýzy dát, ktoré som nikdy pred tým nerobil(a) ? Ak aspoň na jednu z otázok je odpoveď „Nie“, mali by ste rozmýšľať nad svojou budúcnosťou.

Krok 2: Nádych pred ponorom. Ak na základe diagnostiky dozrelo vo vás rozhodnutie, že sa budete musieť posunúť vpred, nežeňte sa na profesiu, či iné portály. Kým sa rozhodnete hodiť sa kolom krku novej príležitosti, pripravte sa na tento skok. Ak by ste sa hneď pustili do hľadania novej práce, s veľkou pravdepodobnosťou by ste v nich neuspeli. Zozbierajte preto trochu sebadisciplíny. Urobte si niekoľko online vzdelávacích kurzov, prelúskajte demo videá na YouTube z vašej oblasti. Hlavne však donúťte sa reálne si vyskúšať na „nečisto“ nové postupy. Skúste napríklad začať tu.

spiralaKrok 3: Hľadajte skutočného data manažéra v skutočnom data science teame. Naozaj a na dobro sa dá vymaniť z trojzovretia analytickej osamelosti, len keď ustanovíte rovnováhu vo všetkých troch vyššie menovaných oblastiach. Preto treba hľadať prácu, v ktorej budete súčasťou širšieho teamu, ktorý bude vedený človekom s vlastnými analytickými skúsenosťami a bude pracovať na dostatočnom množstve zaujímavých projektov. Nenechajte sa opantať oslnivými vyhliadkami len v jednom z troch kritérií. Práca v start-upoch zvyčajne vyzerá ako cool, ale nezriedka ju sprevádza neskúsený vlastník-manažér, ktorý mal „len“ skvelý nápad, alebo príliš úzke zameranie, či „nakolenizmus“. Hľadanie odporúčam začať buď zo smeru zaujímavého obsahu a verifikovať, kvalitu manažmentu týchto firiem. Alebo začať od kvalitného manažéra, ktorého poznáte a verifikovať, či jeho team pracuje na niečom, čo by vás posunulo ďalej. Pri hľadaní kvalitných manažérov sa nebojte vstúpiť aj po druhý krát do tej istej rieky. Veď ako sa hovorí v lietadle: „Poriadne sa rozhliadnite, lebo najbližší núdzový východ môže byť kľudne aj za vami.“

Na záver mi dovoľte dodať, že osamelosť analytika je zrejme cyklický jav, ktorý tu nebude večne. Ako sa postupne rozbehne Data science odvetvie, teamy budú rásť a postupne dozrie aj generácia manažérov, ktorí sa z dátových expertov posunú do manažérskych pozícii. V našich geografických šírkach však toto bude minimálne 5-7 rokov, teda obdobie ktoré sa nedá úplne „prečkať v kúte“. Preto ak ste sa našli v príznakoch vyššie uvedenej osamelosti,  určite sa nechláchoľte, že to proste prejde. Jedným dychom však zároveň dodávam, že určite existujú skupiny aj ľudí, ktorým tento stav vyhovuje. Robiť si stále to svoje dookola, bezpečie stabilného a dobre plateného jobu, v ktorom môj šéf nevie dosť na to, aby sa mi „montoval“ do práce alebo ma vyhodil. To je pre niektorých nepochybne lákavá ponuka. Takže určite neburcujem k masovému sťahovaniu analytikov. Chcem však, aby ste zvážili, kam sa celé odvetvie posunie, kým vy zostanete tam, kde ste. A čo to bude znamenať pre vaše šance na lepšie zamestnanie potom, až vlna Data Science naplno dorazí aj do našich končín. Či už sa rozhodnete tak či onak, prajem vám, aby vás netrápila analytická osamelosť.

Prekvapivé zmeny vo Fraud manažmente

Odhaľovanie podvodov patrilo vždy medzi kráľovské disciplíny dátovej analytiky. Totiž už od momentu, keď sa začalo pracovať s digitálnymi stopami, nabralo odhaľovanie novú epochu. Samozrejme detegovanie podvodov tu bolo ešte pred nástupom digitálnej doby, také poisťovne sa museli zaoberať „podivnými“ zhodami náhod už v čase, keď sa hlásili poistné udalosti čisto na papier. Zlomovým momentom pre odhaľovanie podvodov však bola premena vstupov do elektronickej podoby. Hlavnou úlohou pri riešení podozrivých prípadov je totiž preskúmať vstupy (resp. okolnosti) danej situácie. Kým to musel robiť človek, kontroly na podvody boli skôr námatkové. Ľudská sila totiž detailne dokázala preskúmať len vybranú vzorku tisícov prípadov. Akonáhle sa však vstupy ocitli v digitálnej podobe, prvé „preosiatie“ všetkých prípadov mohol urobiť počítač na miesto človeka a to zvýšilo počet celkovo preverených prípadov. Človek sa následne venoval iba tým prípadom, ktoré stroj po primárnom preskúmaní vyhodnotil ako  pravdepodobnejšie na podvod.

Typické formy a odvetvia podvodov

Celá podstata odhaľovania podvodov by bola pokojne na samostatný blog, kto vie, možno sa niekedy v budúcnosti podujme autor na historický exkurz cez túto tému. Tón v tomto ohľade udávali hlavne finančné spoločnosti, lebo s virtuálnymi vecami ako sú peniaze, sa hold ľahšie podvádza a falšuje. Postupne tak vznikali modely na podozrivé platby kartou, nie úplne úprimných úverových záujemcov, či umelé uplatňovanie si šekov, kupónov, poistných nárokov  alebo výhod vernostného programu. Ak ste teda robili vo fraude, zväčša ste sa pretĺkali s niektorým z finančných odvetví.

Podvrhy však mali po nežnej revolúcii aj jednu veľmi hmatateľnú podobu. Možno nie tak nebezpečnú ako falošné platby kreditkou, ale predsa častú. Napoviem, že heslom tohto podvodu bolo „Viac prúžkov, viac adidas.“

Viac prúžkov, viac …

Áno, fake oblečenia, kabely a iné spotrebiteľské tovary boli vyše desaťročie symbolom podvrhu, s ktorým sme sa bežné stretávali. Na rozdiel od finančných podvodov, ktoré verejnosť poburovali, nákup „akože značkového“ tovaru bol vnímaný normálne, neraz dokonca ako „skvelá kúpa“. Do dokonalosti tento jav dotiahli tureckí predavači „prudko lacných značkových hodiniek“, ktorý svoj predajný argument vystavali ako „This is a real fake, not from China“

Tak ako roky zástavu boja proti podvodom niesli finančný sektor a falošný spotrebný tovar, v poslednej dobe sa fraud detection presunul do veľmi zaujímavých, ba až priam prekvapivých odvetví. Ak teda patríte medzi anti                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                     -frauďákov, toto sú odvetvia, v ktorých sa môžete pozrieť po novej práci:

Pre nás ostatných zostáva len na zamyslenie, ako boj proti podvodom ovplyvní umelá inteligencia. Avšak pozor, s jej účasťou treba rátať nielen na strane odhaľovania podvodov, ale aj na opačnej strane rieky. Tak ako digitálne spracovanie overovania podvodov totiž zväčšilo počet prípadov, ktoré je možné preveriť, rovnako digitálne technológie môžu byť použité na vytvorenie tak vysokého počtu podvodov, že môžu zahltiť a paralyzovať odhaľovacie mechanizmy. Lebo ak si spomeniete, vo väčšine filmov o brilantných bankových lúpežiach to celý čas vyzeralo, že vylúpiť sa ide niečo úplne iné, ako čo sa nakoniec vylúpilo. Darmo, dymová clona dávno už nie je technikou len prepadové komanda oslobodzujúceho rukojemníkov. Ale o tom fakt až niekedy inokedy …

Narodeninový kvíz na Mocnedata.sk

Znie to neuveriteľne, ale tento týždeň je to už rok, čo uzrel svetlo sveta projekt Mocnedata.sk. Projekt, ktorý si predsavzal vybudovať stály tok informácií o dátovej analytike, umelej inteligencii a klientskych dátach. Priznám sa, začínal som s malou dušičkou, lebo som vedel, že prijímam záväzok tvoriť dlhodobo a pravidelne obsah. Kým som blogoval pre SME alebo TREND, bola to skôr občasná záležitosť. Pri spúšťaní Mocnedata.sk som prijal tvrdé rozhodnutie, že nebudem investovať do marketingu tohto portálu a komunitu členov portálu vybudujem síce pomalšie , ale o to stabilnejšie, len na základe organického rastu.

Preto ma veľmi teší, že sa s Vami môžem na prvé narodeniny podeliť o informáciu, že Mocnedata.sk si našli svoje publikum a na jeho stránky sa týždenne vyberie viac ako 1000 ľudí. Pre uvedenie do kontextu je to asi 1/2 všetkých čitateľov Forbes na Slovensku. Keďže čítanosť jednotlivých článkov detailne analyzujem, teší ma, že postupne vznikla skupina skalných čitateľov, ktorí si prečítajú stabilne takmer každý nový blog na portáli. Keď som spúšťal projekt mocnedata.sk vedel som, že najťažšie bude udržať frekvenciu písania blogov. Portál bez nového zaujímavého obsahu je totiž priamo odsúdený na zabudnutie. Zo všetkého najviac ma preto teší, že sa mi počas prvého roku darilo držať tempo približne 2 nových blogov za týždeň, čo je približne 100 blogov ročne. Keby mi niekto povedal pred rokom, že napíšem za prvý rok fungovania Mocnedata.sk sto blogov, asi by som ho vysmial. Pre vývaženosť hodnotenia by som rád povedal, že existujú aj dve veci, ktoré sa mi zatiaľ oproti pôvodnym predpokladom nepodarili: a)  dúfal som, že by sa mohla rozdúchať lepšie diskusia k blogom, čo sa mi doposiaľ nepodarilo; b) neviem, či ste postrehli, ale mocné data majú aj svoju anglickú mutáciu na www.themightydata.com a jej plnenie článkami doposiaľ zaostáva za svojou slovenskou sestrou.

Výročie však nie je len o bilancovaní, ale zároveň možnosť obdarovať verných čitateľov mocnedata.sk komunity. Aby to bolo však pre vás zároveň aj zaujímavé, pripravil som Narodeninový kvíz o témach, ktoré sa za prvý rok na tomto portáli preberali. Prvý traja čitatelia, ktorí na email info@mocnedata.sk pošlú správne odpovede na tento kvíz (vo formáte 1a 2a … 12a), získavajú od portálu darček v podobe poukážky na BigData školenie. Držím vám palce!

QUIZ

Narodeninový kvíz o Mocnedata.sk

1.Keď sa Steve Jobs vrátil do Apple, tak znížil počet predávaných produktov na:

        a] 1 produkt            b] 2 produkty              c]  4 produkty                    d]   6 produktov                              [nápoveda TU]

2. Pre BigData projekt v Tour de France sa prvotný signál o pohybe jazdcov zbiera:

a] pomocou mobilnej siete   b] pomocou vysielačiek sprievodných vozidiel     c] pomocou helikoptéry     d] pomocou špeciálneho kamiónu      [nápoveda TU]

3. WhatsApp je svetový fenomén, pretože je to najpoužívanejšia messenger aplikácia v:

a] 87 krajinách         b]  97 krajinách               c] 107 krajinách                    d]  117 krajinách                 [nápoveda TU]

4. Televízne vysielanie z Olympiád zaznamenalo výrazný prepad sledovanosti najmä kvôli:

a] Olympiády boli v odlišnom časovom pásme ako väčšina divákov     b] veľa reklamných prestávok počas prenosov    c]  celkovo klesá záujem o Olympiády   d]  diváci si chcú pozrieť len krátke highlity   [nápoveda TU]

5. Ktorá zo značiek je aktuálne najďalej v patentovaní  samojazdiacich áut:

a]    Bosch           b]  Audi               c] BMW         d]  Ford                                   [nápoveda TU]

6. Problémom pri výbere marketingových šéfov je, že až 46% nových marketingových šéfov

a] si nesadne so CEO spoločnosti    b] pracuje v marketingu prvý krát    c] si uzurpuje právomoci aj iných    d] chce riešiť marketingovú komunikáciu    [nápoveda TU]

7. Česká firma GoodAI, ktorá patrí medzi lídrov vo vývoji umelej inteligencie pre roboty, si vybrala prístup, kde robotov učí na základe

a] genetických algoritmov      b] príbehov s ponaučením    c] mentora a stále ťažších cvičení   d]  simulovania emócií v robotovi   [nápoveda TU]

8. Medzi odporúčania expertov sociálnych sietí v Socialnomics NEpatrí:

a] presuňte emaily do messengerov,     b]  naverbujte čo najviac fanúšikov     c] Neriaďte sa PPC stránkou reklamy    d] sociálne siete umocňujú produktové rozdiely   [nápoveda TU]

9. Podľa dostupných údajov do roku 2020 už dosiahne na Slovensku počet aktívnych elektromerov posielajúcich kontinuálne dáta o spotrebe číslo

a] 600.000    b]  650.000   c] 750.000   d] 900.000      [nápoveda TU]

10.  Podľa analýzy mocnedata.sk má v priemere každý druhý Slovák vo svojom šesťčíslí mobilného telefónneho čísla aspoň jednu cifru:

a] 5      b]  1       c] 9       d]   2         [nápoveda TU]

11.  Odhaduje sa, že Tatranská vysokohorská chata denne spotrebuje v priemere:

a]  115 kg potravín       b]  135 kg potravín    c]  195 kg potravín    d] viac ako 250kg potravín         [nápoveda TU]

12. Podľa dostupných údajov z Kaggle portálu, spomedzi mužov cestujúcich 2. triednou na Titanicu prežila

a] 38%        b]   28%      c]   18%     d]  8%     [nápoveda TU]

Teším sa na Vaše správne odpovede a zároveň by som vás chcel poprosiť, aby ste pri príležitostí prvých narodenín portálu dali svoju spätnú väzbu, čo sa vám páči na portáli alebo čo vám tu naopak chýba.

Správne odpovede a vyhodnotenie kvízu [doplnené 4.11.2017]

Ďakujem všetkým, ktorí sa zapojili do lúštenia narodeninového kvízu. Ako väčšina riešiteľov pochopila na svojej vlastnej koži, otázky vyzerali jednoduchšie ako v skutočnosti boli a na dvoch, či troch otázkach sa veľa riešiteľov nechalo zlákať na nesprávne odpovede. Takže najprv správne odpovede na otázky po poradí:

1C , 2B , 3C , 4D , 5A, 6D, 7C, 8B, 9A, 10D, 11C, 12D

Veľa ľudí sa mýlilo na otázke číslo 2. Totiž viaceré z vymenovaných možností sa podieľajú na prenose signálu, ale tým prvým želiezkom v reťazi sú práve sprievodné vozidlá, čiže odpoveď B. Rovnako niektorých pomýlila otázka 5, pretože predpokladali, že správna odpoveď má byť niektorá z automobilových značiek. Nech je to akokoľvek prekvapivé, tak najďalej vo vývoji patentov pre samo-jazdiace autá je práve Bosch, ktorý sám auta nevyrába. Pôvodný blog špekuluje aj o tom, že možno jeho technológie budú licencovať niektoré z iných automobieliek, ktoré zaspali pri štarte vývoja autonómnych vozidiel a teda už by teraz nemali šancu vyvinúť svoje vlastné verzie softwarov. Takže tu správna odpoveď je A.

Najväčším kameňom úrazu bola otázka 8, ktorú takmer nik nemal správne na prvý krát. priznávam, že táto otázka bola trochu chyták v tom, že bola formulovaná ako “čo NEpatrí medzi odporúčania”, hoci samotný blog na túto tému vymenúval práve, čo patrí medzi odporúčania. Z kontextu blogu sa však dalo dočítať, že autori pôvodnej publikácie dávajú za pravdu tým, ktorí varujú pred nebezpečím kumulácie čo najväčšieho počtu fanúšikov (z radu klientov) na profiloch sociálnych sietí. Keďže zároveň všetky ostatné možnosti boli priamo v článku uvedené ako odporúčania, jedinou správnou odpoveďou na otázku čislo 8 teda bola možnosť B.

Pre vyhodnotenie som samozrejme mohol použiť len správne odpovede. Preto ak dorazila nesprávna odpoveď, upozornil som autora, že v niektorej z otázok má chybu. Dátum a čas zaradenia do vyhodnotenia bol tak až okamih, keď poslal úplne riešenie (bez ohľadu na koľký pokus to bolo). Cenu v podobe poukazu na Datamining vzdelávací kurz od portálu Mocné dáta získali tí riešitelia, ktorí doručili správne odpovede čo najskôr po uverejnení daného blogu. Hoci pôvodne som prisľúbil odmeniť len prvých 3 najrýchlejších riešiteľov, rozdiel medzi 3 a 4 miestom bol len pár minút, čo mohlo pokojne spôsobiť aj rýchlosť daného mailového serveru, z ktorého sa odpoveď odosielal, rozhodol som sa spraviť tretie miesto deleným a celkovo tak poukážka na daný kurz putovala pre nasledovných 4 členov našej www.mocnedata.sk komunity:

F. Babič

V. Hanušniak

M. Lichtnecker

N. Kuzmová

Výhercom srdečne gratulujem a verím, že darovaný kurz im rozšíri obzory pre analyzovanie dát novými spôsobmi! Zároveň mi dovoľte z tohto miesta poďakovať za veľké množstvo poďakovaní, povzbudení a spätnej väzby, ktorej sa mi dostalo pri príležitostí 1. narodenín www.mocnedata.sk portálu.  Ako sa hovorí v jazyku Shakespearovom “Stay as you are. You are great audience!

9. kolo Dátových hádaniek – Dáta o škole

September 2017 bol prvým mesiacom v SR histórii, keď školský rok neotváral minister školstva. Bolo to tak z prozaických dôvodov, (takmer) žiadneho sme nemali. A hoci po obsadení postu novou ministerkou školstva sa opäť rozpútala vášnivá diskusia o tom, čo všetko v školstve zmeniť, jedno je jasné. O využívaní dátových analýz ku prospechu žiakov, rodičov a učiteľov sa hovorí pramálo.

žiaci

Rozhodol som sa preto trochu popichnúť našu komunitu Mocnedata.sk riešiteľov a vyhlásiť 9. kolo Dátových hádaniek na tému :

Predstavte si, že všetky základné a stredné školy majú zavedenú digitálnu triednu knihu a digitálny klasifikačný hárok a každá škola prevádzku portál, kde má rodič a žiak k dispozícii  k nahliadnutiu elektronickú žiačku knižku ako aj elektronickú verziu dochádzky, “klasáku” a triednej knihy.

Aký zaujímavý parameter/ukazovateľ by ste navrhli analyzovať?

Do svojho riešenia môžete uviesť ľubovoľný počet parametrov, do súťaže sa vám však počítať bude len najlepší z nich. Pri každom nápade sa bude prihliadať na invenčnosť daného nápadu, jeho prínos pre zlepšenie žiakov alebo učiteľov a kvalitu popisu daného nápadu. V prípade rovnosti bodov sa zohľadní celkový počet podaných nápadov tomto kole. Dve najlepšie riešenia vyhrajú poukážku na vzdelávacie kurzy v oblasti dátovej analytiky a BigData. Zároveň Prvých 10 riešiteľov si odnesie postupne 11, 10, 9 až 2 body do ACP rebríčka  riešiteľov dátových hádaniek. Každý zúčastnený riešiteľ získa za účasť v tomto kole aspoň 1 bod do daného rebríčka.

Svoje riešenia, prosím, zašlite emailom najneskôr do 23.10.2017 na adresu info@mocnedata.sk.

Bez okolkov priznáva, že tejto téme som sa venoval v minulosti už vo svojich blogoch, takže môžete trochu pogúgliť a pokojne sa inšpirovať. Nezabúdajte však, že jedným z kritérií je aj invenčnosť nápadu a tak opísať tie, čo majú šancu vidieť aj ostatní, asi nie je zrovna cesta na stupeň víťazov. Ak sa chystáte zapojiť do súťaže prvýkrát, pozrite si riešenia predchádzajúcich kôl alebo si prečítajte zbierku dátových hádaniek na pohovory.

Vzhľadom na tému očakávam do niektorých silný výkon (pozdravujem, Feri) a od niektorých konečne zapojenia sa (veď ty vieš, o kom hovorím). Nachvás múza nápadová sprevádza. Teším sa na Vaše riešenia!