PREKVAPENIE: Mocné dáta otvárajú NOVÚ ÉRU

📢 Už roky sme s Dávid Tvrdoň hľadali AI podcast, ktorý by sa venoval téme umelej inteligencie s dôrazom na strednú Európu. Poctivo sme hľadali niečo, čo by nebolo len suchým prehľadom noviniek typu “AI model X teraz ohlásil, že vie Y”, ale fakt niečo čo ide hlbšie – prečo sa niečo deje, aký to má význam pre nás a naše komunity. Výsledok asi tušíte. Taký podcast sme jednoducho nenašli. Takže sme si povedali: “Keď nikto iný, tak teda my!” Dali sme dokopy náš brainpower (a výber vtipných príhod zo života) a vznikol prvý AI podcast v regióne CEE, ktorý ti dá viac ako len novinky – dá Ti súvislosti, ktoré ťa donútia premýšľať. Lebo AI si už dnes mení svet okolo nás, no často to ľudia ani nevedia. Takže áno, CEE AI podcast? Máš ho tu, kámo. 😎

🤔 Prečo sme podacast nazvali práve “mAIndset“? Nuž, naša misia je pomerne priamočiara: “Shape What You Know and Think About AI.” Nechceme len, aby si mal(a) prehľad, ale aby si AI fakt rozumel(a) – od etiky, cez dopady na trh práce, až po aplikácie, ktoré využiješ v bežnom živote. Ale aby sme boli relevantní, k tomu potrebujeme aj vás. Žiadne ticho! Zahlasujte, o čom by ste chceli epizódu, čo vás na AI fakt zaujíma a nepočuli ste o tom zatiaľ debatu. Sme otvorení všetkým témam, od deepfake-ov, cez autonómne autá, až po to, kedy už bude AI robiť domáce úlohy za deti. 🤓 Link na odporúčanie tém je nájdete tu:
https://poll.ly/lifUgkaHpwrX9128yJlW
A kľudne nám dajte aj divoké návrhy – sme dospelí a nebojíme sa kontroverzných nápadov. Ďalšie epizódy budeme cielen natačať prednostne na témy s najväčším počtom hlasov.

Mocnedata, samozrejme pokračujú ďalej, stále budem publikovať nové články a blog posty na tejto platforme a to ako v SJ tak v anglickej mutácií (www.TheMightyData.com ). Zároveň však budú dvorným doplnkovým médiom pre mAIndset podcast.

🤷‍♂️ Teraz tá večná otázka – prečo podcast v Angličtine? Lebo sme si robili malý prieskum (OK, Filip robil aj veľký Excel k tomu) a zistili sme, že väčšina ľudí, čo sleduje AI, už teraz počúva zahraničné podcasty v angličtine. V CEE skrátka doteraz žiadny SK/CZ jazykový AI podcast nebol, takže sme chceli prísť s niečím, čo osloví čo najširšiu skupinu. Ale! Máme uši otvorené. Ak by bol záujem o SK verziu, určite to zvážime. Dajte nám vedieť na ideas@maindsetpodcast.com
fakt nás zaujíma, či by ste chceli lokalizované epizódy alebo mix. 👀 Zatiaľ to testujeme takto, ale všetko je na stole!

🎙️ A teraz – drumroll, please 🥁 – prvá epizóda! Nesie názov “What You Are Not Ready For In 2025”, čo by sme vo voľnom preklade nazvali: “AI témy, ktoré ťa zrejme vystrašia, ale skôr či neskôr si na ne budeš musieť zvyknúť.” Hovoríme o predpovediach na rok 2025, ktoré sa pravdepodobne neobjavili v bežných správach, no sú sakra dôležité. Žiadne trápne “AI písalo básničky” – ide o to, ako AI zmení firmy, vzťahy, prácu a život vôkol nás. Každú epizódu mAIndset podcastu si pustíš tu ako video , prípadne tu ako audio podcast. Vyskúšaj a daj vedieť, ako Ti chutilo.

⛑️Aby tento podcast žil, potrebujeme aj tvoju pomoc. Zapni odoberanie podcastu (na YouTube, Spotify alebo Apple Podcastoch), ale najmä to prosím pošli kamoške alebo kamošovi, ktorých AI alebo technické novinky zaujímajú. Takže šup na “Share” a “Send” gombíky. Bez dobrého publika to nejde, ale s vami to uršite odpálime na mesiac.

🚀 LET’S GO!

Google chce preraziť klzkou cestou EaaS

Karty v biznise v podpore cloudových riešeniach Umelej Inteligencie (AI) sa zdajú byť rozdané, s Amazonom (a ich AWS) a Microsoftom (Azure) ďaleko popredu oproti Google cloud riešeniam v tejto oblasti. (Ich trhové podiely tu.) Google však nechce definitívne zložiť zbrane. A ako to už býva, ak chce „dobiehajúci“ zaútočiť na lídrov, musí hľadať aj nekonvenčné prístupy útoku, lebo hlavné brány bývajú dobre strážené. (Pamätáte ako sa Frodo dostal do Mordoru?)

Google preto prišiel s novým prístupom na poli boja o firmy, ktoré sa snažia vyvíjať svoje AI riešenia. Ponúka im možnosť preveriť, či ich riešenia sú v súlade s AI etikou. A to priamo, samoobslužne pri vývoji v Google cloud prostredí. Otvára tak novú oblasť služieb EaaS, Ethics-as-a-Service, čiže akúsi Etiku na kľúč.

Prečo Google?

Možno si položíte otázku: Akú má Google motiváciu (a kredibilitu) na ponúkanie poradenstva v oblasti etiky umelej inteligencie. Nuž, k poznaniu, že Etika AI riešení je prekérne dôležitá, sa dopracoval, žiaľ, na základe vlastných potknutí. Tento technický gigant musel stiahnuť svoje služby rozpoznania objektov z fotiek, keď sa v minulosti odhalilo, že táto služba označila niekoľko fotiek s černošskými protagonistami za opice. Google rovnako čelili v minulosti rozsiahlym protestom svojich zamestnancov, za projekt Maven, keď firma realizovala zákazku ministerstva obrany USA na podporu vojnových dronov (ktoré vyústili do záväzku manažmentu firmy, že sa o zákazky tohto druhu, kde ich technológie môžu napomáhať vojenským operáciám, nebude už uchádzať.)

Ak ste sa však snažili niekomu radiť v citlivej téme, tak už asi viete, že tento druh poradenstva je dvojsečná zbraň. Ak totiž robíte nejakú formu auditu, ak sa veci nevyvŕbia dobre, auditovaný subjekt môže zamávať pred súdom Vašim certifikátom. A zrazu Vaša pozícia v (zdanlivo cudzom) probléme už nie je úplne neutrálna. Aj Google sa preto v oblasti EaaS snaží našľapovať veľmi opatrne. Badateľné je to aj z rozsahu služieb, ktoré vlastne môžete v rámci AI etickej pomoci of nich získať.

Priamo dostupné sú všetky tréningy, ktoré na AI Etiku Google vyvinul práve pre svojich zamestnancov (po vyššie spomínaných kauzách). Okrem toho ponúka automatickú diagnostiku, či vaše AI riešenia nie sú evidentne zraniteľné voči rasovej, rodovej (a geo) diskriminácii. Ponúka aj audit toho, či účel spracovania dát, predikovaná premenná alebo rozsah vstupov vašej AI sú primerané, či potenciálne spoločensky neakceptovateľné.

Aby sme boli korektní, v snahe o podobné služby nie je Google úplne ojedinelý, o audit vyváženosti dátovo spracujúcich riešení sa pokúsila aj IBM, ktorá dokonca do svojho software zaviedla „Check this“ tlačidlo. Keďže však IBM neponúka základné business cloud service riešenia, ich snaha je (ešte viac) niche ako u Google (, ktorý predsa má aj zaujímavú množinu klientov, používajúcich Google cloud služby aj pred tým,  než vôbec o AI komponentoch o rozmýšľali.)

Nie len vláda?

O tom, že v posudzovaní Etiky umelej inteligencie bude potrebné nejakú autoritu, hovoria mnohé rebríčky aktuálnych trendov umelej inteligencie, napríklad rozobrané aj tu. Táto téma je dokonca samostatným prúdom prednášok na každej AI konferencie (ktoré sa stihli ešte pred Koronou uskutočniť). Mňa osobne zaujíma v tomto ohľade aj úloha Apple a Androidu (aha ho, Google znovu) pri riadení toho, čo AI môže robiť v mobilných telefónoch, o tom však detailne v samostatnom blogu. Európske krajiny naznačili (prostredníctvom GDPR), že si predstavujú reguláciu dátovej analytiky skôr pomocou verejných (než súkromných) audítorov. Žiadna verejná inštitúcia však nebude mať kapacitu „venovať“ sa každému drobnému riešeniu menších a stredných firiem. Ja osobne, preto vznik súkromných „certifikačných“ autorít vítam. Aj keď treba povedať, že tento druh podnikania je pre skupinu Alphabet, do ktorej Google patrí, pomerne vratký. Stačí totiž, aby nejaká sesterská firma Google mala nejaký AI etický škandál, a trh sa môže rýchlo opýtať „Pardon, vo svetle aktuálnych problémov, prečo by Google mal byť ten, kto posudzuje etickosť našich projektov?“ Ale to už je riziko podnikania, keď robíte poradenstvo. A možno nám to dáva nádej, že Google bude o to viac dbať na etickosť svojich riešení. Trend, ktorý ani z ďaleka nemožno napríklad očakávať pri Facebooku či mnohých iných.


		

Necháte si poradiť od mobilu v sexe? A v obliekaní?

Môže vám mobil radiť, čo si ráno obliecť? A chceli by ste, aby posudzoval Váš zdravotný stav? Prijali by ste radu na „one-stand“ sexuálneho partnera z baru, v ktorom sa práve bavíte? To všetko totiž mobily dokážu. Pýtate sa, kto im to dovolil? Nuž presne o tom je tento blog.

Vývoj umelej inteligencie napreduje míľovými krokmi, a to hlavne v oblastiach, kde sa umelá inteligencia používa na konkrétny, úzko vymedzený cieľ. (Naučiť umelú inteligenciu kombinovať viac vecí sa javí o veľa ťažšie.) Dôvodom je, že nutným predpokladom na spoľahlivé odporúčanie sú dáta o danom jave. Masívne rozšírenie smartfónov v populácii, spolu s faktom, že je len málo činností, pri ktorých by neboli prítomné, robí z mobilných zariadení skvelých „zberačov“ (trénovacích) dát.

Navyše aplikácie v mobilných telefónoch už dávno nie sú vyvíjané samotnými výrobcami telefónov. Zástup súkromných tvorcov aplikácií, ktorí zavesia svoju appku do App-store (odkiaľ si ju ktokoľvek môže stiahnuť), je základným princípom ekosystémov Apple, Androidu či Windows.

A odtiaľ už je len drobný krôčik k tomu, že váš telefón môže predikovať, čokoľvek, čo si niekto zmyslí. Stačí mať vývojárske konto (a vedieť programovať patričný programovací jazyk) a vypýtať si súhlas na zbieranie konkrétnych dát od vás používateľov. Ideálne niekde uprostred malých písmeniek Podmienok používania aplikácie.

Takto jednoducho?

Ale je to naozaj takto jednoduché? Nuž naozaj môže. S jedným „ak“. Ak sa nikto do toho nebude starať. V panike zalovíte v pamäti, kto by vás mohol v tomto ohľade chrániť? Napísať Úradu na ochranu osobných údajov? Alebo Európskej komisii? Počkajte, odkiaľ vlastne pochádza výrobca tej aplikácie? Pod koho jurisdikciu vlastne spadá? kto mu môže klepnúť po prstoch?

Problémom súčasnej situácie je, že „lampárni“, kde sa sťažovať je pomerne dosť. Ale ak vám naozaj ide o to, aby sa prestalo páchať zlo/škoda na ďalších používateľoch tejto aplikácie, asi si nebudete platiť právnikov v cudzej krajine, aby požiadali o predbežné opatrenia. Hneď ako rozdýchate úvodné rozhorčenie a vec si  trochu premyslíte, napadne vám možnosť odstrihnúť kábel priamo u zdroja: požiadať o stiahnutie aplikácie priamo u prevádzkovateľa app-storu.

A tu práve začína druhá kapitola nášho problému. V prípade Apple (a do istej miery aj Android ekosystému), aplikácie prechádzajú prvotným hodnotením ešte pred tým, než sa vôbec stanú dostupné v app-store. Teda, ak ste si mohli aplikáciu vôbec stiahnuť, už prešla kontrolou od prevádzkovateľa obchodu s aplikáciami. Pozícia Applu (a jemu podobných) je v tomto ohľade skľučujúca: Buď musí priznať, že primárne preverenie nebolo dôsledné alebo obviniť tvorcov appky, že im nedali plné informácie. O tom, ako komplikované to druhé je, a to aj v prípade, keď porušenie pravidiel pre vývojárov je pomerne zjavné, dokumentuje (nie s AI súvisiaci) aktuálny prípad herného štúdia Epic (podrobne to rozobrali Ondro s Davidom v tomto KLIKu). Ako sa z tohto problému vymotať už o chvíľu. Ešte pred tým, však krátky odskok k tomu, prečo by sa v tejto oblasti mali udiať zásadne zmeny.

Prečo je to dôležité?

Okrem toho, že by mohli mobily zasahovať do vášho súkromia pokútnymi predpoveďami (prípadne skrytými motívmi, ktoré ste zo širokého popisu účelu ani nevybadali), je tu ešte jeden dôležitejší faktor. Kto ponesie zodpovednosť za mylné predpovede a odporúčania. Tým sa dostávame na klzkú plochu Etiky v umelej inteligencii, ktorú sme nedávno detailnejšie rozoberali tu (alebo TU). Možno vám totiž prípade banálne sa sťažovať na ten nevhodný sveter, čo vám mobil odporučil minulý týždeň do práce, ale zbytočné nerieknutie z rakoviny (ktoré máte podľa telefónu na 80%), už asi nenecháte „len tak plávať“. Tým skôr po sérií vyšetrení a týždňoch strachu, ktoré ste si museli preskákať.

Situácia je o to komplikovanejšia, že v prostredí desktop počítačov, ktoré sú predchodcami mobilných aplikácií, si užívateľ niesol (takmer) plnú zodpovednosť za to, čo si stiahol do svojho počítača. Navyše AI riešenia začali húfne vznikať až v dobe, keď už mobily preberali žezlo od desktopov. A tak nevznikli žiadne regulačné úrady, na kontrolu AI software mimo mobilov, o ktoré by sme sa mohli pri regulácií tých mobilných AI riešení oprieť. Jedno vetou: na tento druh regulácie sú verejné inštitúcie bezzubé (ešte viac ako prevádzkovatelia App-storov.)

Ako z toho teda vyviaznuť

Všetko doposiaľ povedané smeruje k tomu, že k regulácii toho, čo (a ako dobre) umelá inteligencia predikuje na mobiloch, budú musieť pristúpiť primárne prevádzkovatelia ekosystémov smartfónov. To sa však omnoho ľahšie povie ako zrealizuje. Skúsme sa preto pozrieť na to, aké reálne možnosti títo prevádzkovatelia majú.

AI riešenia, primárne ako partnerstvá. Neviem, či ste si všimli, ale pre niektoré typy aplikácií si Apple, Google (aj Microsoft) vyhradili vo svojich ekosystémoch výhradné postavenie. Tento druh služieb je buď priamo poskytovaný len vlastnými funkciami prevádzkovateľa (napr. Apple/Google Pay) alebo aspoň výrazne vymedzený tým, že výrobca telefónu predinštaluje vlastnú aplikáciu pre daný druh činnosti (web browser, úložisko fotiek, …). Teoreticky by tak mohli vznikať ako riešenia umelej inteligencia iba ako takéto dôležité aplikácie. Ak si ťukáte do čela, že by to bolo nereálne, tak len pripomeniem, že keď Apple uvádzalo nové funkcie (ako čítačka otlačkov prsta, či akcelerometer), takmer vždy bol prístup na tieto funkcie zamknutý len pomocou vývojárskych SDK knižníc. Inými slovami, nemohli ste si čítať otlačky prstov mirdix-firdix ako chcete (napríklad na vytvorenie vlastnej databázy odtlačkov prstov z celého sveta). Podobný postup sa predpokladal aj pri uvedení bionic chipov v Iphone 9. Takýto prístup by však určite priniesol spomalenia vo vývoji AI, keďže Apple (či Google) dokážu reálne participovať len na určitom počte projektov súčasne. (Či by spomalenie AI nebolo vlastne benefitom, je zaujímavá téma z iného súdka)

Rozšíriť vetting team o AI sekciu. Časť firmy, ktorá sa zaoberá (prvotným) schvaľovaním aplikácií v ekosystéme sa volá Vetting Team. Ak si to predstavujete ako pár ľudí, ktorí sa kde tu pozrú na nejakú App-ku, rád by som vás vyviedol z omylu. V Apple Store sa aktuálne nachádza 1.8 milióna aplikácii, v Google Play Store je to dokonca až 2.6 milióna. A to sa bavíme iba o tých schválených. Podľa údajov Apple cez výberovo sito neprejde 40% percent, bavíme sa o miliónoch aplikácii ročne, ktoré treba posúdiť, čiže niekoľko tisíc nových každý deň. To všetko v 81 jazykoch, lebo appky sa tvoria všade po svete. K tomu pridám, že Apple si stanovilo pravidlo, že chce schvaľovať 50% aplikácií do 48 hodín. Takže len pre aktuálny set-up bez preverovania AI už sa musí tomuto procesu venovať viac ako 300 hodnotiteľov pre každý z app-storov, z ktorých každý musí overiť cca 50 aplikácií (a ich aktualizácií) za deň! Pritom posudzovania AI podstaty je o mnoho zložitejšie a vyžadovalo by si celé teamy na posúdenie jednotlivých riešení. S vidinou toho, že AI sa postupne stane súčasťou väčšiny aplikácií, natíska sa otázka, či je takéto navýšenie počtu AI hodnotiteľov udržateľné.

Starí dobrí kontraktori. Základnou poučkou procesného riadenia je: „Ak je proces pre Teba ťažko riaditeľný interne, nájdi externého dodávateľa, na ktorého môžeš bremeno prehodiť.“ V zmysle tejto mantry, by mohli prevádzkovatelia ekosystémov najať na kontrolovanie AI časti aplikácií externé teamy. Toto Pilátske riešenie však tiež nie je jednoducho realizovateľné. Od faktu, že Apple (a jemu podobný), nechcú aby niekto iní rozhodoval, ktoré aplikácie bude ponúkať, cez fakt, že držať armádu kvalitných hodnotiteľov bude vždy pre externú firmu ťažšie ako pre Apple (predsa je omnoho viac ľudí, ktorí chcú pracovať pre Apple ako no-name firmu na hodnotenie AI aplikácií). Výhodou tohto prístupu je, že takéto centrum by mohlo ponúkať služby viacerým app-storom, teda lepšie vyťažiť kolísanie potrebných kapacít. Na druhej strane toto je presne aspekt, ktorý by sa nepáčil samotným App-storom (ich dodávateľ by videl, aké aplikácie sa pripravujú u nich a u konkurencie). Aj keď to je presne to, čo by mohlo celý proces urýchliť, lebo výrobcovia často predkladajú tú istú aplikáciu do viacerých app-storov súčasne. Istý potenciál by tu teda bol, ale … Súdiac z toho, že výrobcovia nepreniesli ani hodnotenie bežných aplikácií na externé firmy, necháva šípiť, že to nebude asi plán A ani pre AI hodnotenia.

Vyprosiť si vládne riešenie. Ak je to také komplikované pre samotných prevádzkovateľov, nebolo by lepšie, aby sa tejto povinnosti proste zbavili? Na koho plecia? Nuž čo tak nejaký štátny certifikačný úrad (ako je tomu pre medicínske Appky)? To, čo príde nám Európanom ako dobrý nápad, by asi hľadalo ťažko podporu v Amerických centrálach týchto gigantov.  Tie sa totiž vždy snažia samoregulovať. Vznik takého úrodu si viem živo predstaviť v Rusku, Číne a do istej miery v Nemecku, či Francúzsku. Ale Americké korporácie určite nepôjdu s prosíkom za vládnym regulátorom. Aj keď nápad, že my zodpovedáme za softwarovú časť, na správnosť AI časti aplikácie si zožeňte certifikát of AI autority, znie ľúbivo. Tak kto vie, možno predsa.

Ak ste si po prečítaní vyššie uvedených možností nevedeli vybrať favorita, asi ma to prekvapí. Aktuálny diskurz v tejto téme hovorí, že vybrať si ho nevedia ako prevádzkovatelia ekosystémov. A to značí len jedno. V dohľadnej dobe nebude to, čo mobil dokáže (a smie) predikovať vo vašom živote regulovať nikto. Teda úplne presne, nikto okrem vás. Takže nám nezostáva iné, len si vytvoriť určitú prirodzenú skepsu voči všetkým aplikáciám, ktoré sľubujú „odporúčania, predikcie alebo rozpoznávanie vecí“, čítať si v malých písmenkách, aké údaje si od nás zoberú (čo aspoň bude čiastočne Apple regulovať v novom iOS), alebo … proste neočakávať, že by mobil mohol predikovať váš sexuálny mobil, či to, akou chorobou trpíte. Aspoň na teraz nie, kým to nie je dostatočne bezpečné.

[Aktualizované] AŽ TO UVIDÍ MATOVIČ, BUDE … ROZČAROVANÝ

Písal sa večer v pondelok, 6. apríla 2020. Premiér ohlásil na tlačovke, že v záujme prevencie šírenia vírusu cez rodinné stretnutia počas Veľkej Noci, uzavrie sa prechod naprieč okresmi. Opatrenie bude kontrolovať Polícia s Armádou. Reštrikcia vstupuje do platnosti od stredajšej polnoci, teda za necelých 30 hodín od vyhlásenia. Aké to bude mať skutočné efekty na epidémiu?

Čo-to už naznačilo utorňajšie popoludnie, či streda ráno. Avšak po úvodnom “hick-upe”, ďalšie dni vyzerali na uliciach opticky, ako keby opatrenia fungovali. Ak by sme teda zobrali do úvahy celé obdobie od utorka  do utorka: Bolo toto opatrenie hodné celospoločenského poryvu, ktorý to vyvolalo?

EDIT: Pri písaní tohto blogu som si zažil niečo, čo je nočná mora každého dátového analytika. Dáta, z ktorých ste vychádzali, sa zmenia v čase.  Prvá verzia tohto blogu (vrátane kompletných záverov analýzy) bola napísaná z dát, ktoré (podľa všetkého) o pár dní APPLE revidoval. Hrozilo, že niektoré z tvrdení blogu by nemuseli zodpovedať aktualizovaným dátam. Preto som promptne stiahol závery blogu a rozhodol sa počkať na A] ustálenie dát od APPLE, ale hlavne B] zverejnenie kontrolných dát zo strany Google, ktoré reportujú podobné veličiny. 

Pôvodné závery hovorili o tom, že zamknutie okresov neprinieslo žiadnu zmenu v používaní verejnej dopravy, ale spôsobilo náhly impulz presunov pred začiatkom opatrenia a žiadnu zmenu v pešej alebo šoférovacej aktivite už priamo počas samotných Veľkonočných sviatkov. Po krížovej kontrole a aktualizácii dát,  dnešná verzia blogu stále potvrzduje náhly impulz presunov pred samotnými opatreniami, rovnako potvrdzuje len drobné zmeny v tranzite alebo pešom pohybe, avšak presnejšie kvantifikuje mieru presunov autom počas Veľkej noci. Ak ste náhodou čítali len prvotnú verziu blogu pred zamrazením záverov, prosím prečítajte si ho teraz ešte raz, aby ste si aktualizovali svoje závery o efekte VN opatrenia. 

NAŠA INFORMAČNÁ POISTKA

Igor Matovič si už odpoveď na to, ako efektívne bolo jeho opatrenie na “zmrazenie okresov”, mohol prečítať z dát mobilných operátorov, ktoré mu nový zákon priklepol k nahliadnutiu. Nám tu odpoveď zatiaľ neprezradil. Je to nanajvýš zvláštne, ale nebudeme tu špekulovať, prečo je tomu tak. Našťastie nezostávame v tme a nemusíme čakať na to, či nám závery tohto opatrenia vláda prezradí. Máme dobrú informačnú poistku.

Veľké, nadnárodné digitálne spoločnosti sa rozhodli poskytnúť krajinám a výskumným teamom dáta o tom, ako sa mení mobilita ľudí počas COVID obdobia. O dátach od Googlu sme si na Mocnedata už hovorili, keď sme hodnotili ako karanténu (ešte pred Veľkou Nocou) dodržiavajú jednotlivé regióny. Dáta z Veľkej Noci boli z tohto zdroja dostupné až o viac ako týždeň neskôr, prvé boli dáta práve od APPLE. K dnešnému dňu však už obe dátové služby aspoň čiastočne zverejnili svoje čísla aj pre týždeň Veľkej Noci. Pozrime sa teda, čo odkrývajú o mobilite Slovákov počas Veľkej Noci 2020.

AKO ČÍTAŤ APPLE DÁTA

Aby spoločné nahliadnutie do grafu malo zmysel, dovoľte mi krátku vsuvku o tom, čo vlastne dáta popisujú. Apple sa rozhodol sprístupniť dáta o pohybe klientov používajúcich ich zariadenia (a Apple Maps), pohybujúcich sa 3 spôsobmi A] driving = človek sa pohybuje v (osobnom) aute, či už ako šofér alebo pasažier; B] Transit = človek sa pohybuje v nejakom hromadnom dopravnom prostriedku (autobus alebo vlak) a C] Walking = človek sa presúva peši medzi jednotlivými miestami. Aby bolo možné porovnať mieru obmedzenia počas Korona karantény, podobne ako iné datasety, Apple používa hodnoty spred krízy ako základné benchmarky denného pohybu. Zaujímavé veci sa potom dejú v SR od polovice Marca, keď boli u nás zavedené opatrenia. Obrázok pre Slovensko vyzerá takto [aktualizované 17.4.2020]:

Na základ skorigovaných Apple dát (a niektorých ďalších ukazovateľov) vznikol aj vôbec prvý článok, ktorý som na tému vyhodnotenia “okresového opatrenia” v mediálnom prostredí postrehol.

AKO ČÍTAŤ GOOGLE DÁTA

Ak si nepamätáte detaily Google COVID dát, odporúčam vám v krátkosti sa vrátiť, k tomuto blogu, kde je rozsah týchto dát zrozumiteľne vysvetlený. Len pripomeniem, že na rozdiel od Apple, vo svojom datasete sa Google zameriava na kategórie ľudských činností, ktoré môžu byť dôležité (resp. rizikové) pre šírenie vírusu v spoločnosti. V dnešnej analýze použijeme primárne 3 z týchto 6 kategórií. Príklad takéhoto Google reportu pre Slovensko vyzerá nasledovne:

GOOGLE_easter_2020_SLOVAKIA

ČO SA TEDA STALO CEZ VEĽKÚ NOC?

Ihneď po zverejnení prvej verzie tohto blogu sa na mňa zosypalo množstvo protichodných názorov o tom, či dáta možno tak interpretovať a aké všetky silné či “slabé miesta” taká úvaha má. Po prečítaní dlhého zoznamu výhrad a pochvál som pochopil, že tie časti hodnotenia “zamrazených okresov”, na ktoré rámec dostupných tvrdých dát zatiaľ nevie dať úplnú odpoveď, sa okamžite stávajú predmetom “viery”. Teda takých či onakých postojov a emócií. A tak v konečnom dôsledku veľa ľudí verí (iba) tomu, čomu chce uveriť. Ja som sa pokúsil pozrieť ako vec vyzerá, ak je pohár je poloprázdny alebo poloplný. Finálny záver nechávam čitateľov si urobiť podľa toho, ktorý z argumentov má pre vás väčšiu váhu.

Keďže Google dáta použijeme na verifikáciu Apple dát (nakoľko majú v SR detailnejšie pokrytie), prejdem najprv s Vami cez podstatu Google vstupov, z ktorých vyplývajú 4 podstatné závery:

GOOGLE_easter_2020_detail

A] Ak sa pozriete na graf o tranzite verejnou dopravou, je zrejmé, že väčšinu dní veľkonočného týždňa zostala miera cestovania relatívne stabilná a podobná úrovni pred opatreniami. Istou výnimkou je štvrtok, keď bolo vidieť väčšie cestovanie domov (zrejme aj ľudí z týždňových pracovných turnusov, ktoré bolo v rámci Matovičovho opatrenia povolené). Naopak piatok sa cestovalo najmenej zo všetkých zobrazených dní.  V sobotu už hodnoty opäť boli na dlhodobom priemere.

B] Pre ďalšiu diskusiu je dôležitý poznatok, že už v utorok (a postupne až do soboty) išlo do práce oveľa menej ľudí. Pričom cestovanie za prácou malo výnimku, takže každý kto chcel/musel do práce počas “veľkonočných opatrení” tak mohol kľudne učiniť. Napriek tomu sú výpadky ľudí na pracoviská značné. A vo štvrtok, keď bol ešte oficiálne pracovný deň, dosahujú viac ako -20% oproti pondelku v tom istom týždni. Keďže nemalá časť ľudí môže pracovať počas karantény na diaľku, výpadok ľudí cestujúcich za prácou jasne naznačuje, že mnoho ľudí si zobralo v daný týždeň aj dovolenku. Pokúsil som sa mieru tohto efektu odhadnúť práve z dát tohto ukazovateľa. Google dáta súčasne potvrdzujú, že zakiaľ napríklad v Česku bol Veľký piatok regulárny pracovný deň, u nás išlo do práce necelých 20% ľudí dochádzajúcich za prácou pred vypuknutím koronavírusu. Ako sa presvedčíte za chvíľu, tento fakt je dôležitý pre kalibráciu iného Apple ukazovateľa.

C] Aj tretí dôležitý poznatok sa odvíja od kategórie Workplaces. Ak sa detailne pozriete na dáta za jednotlivé dni, je evidentné, že v utorok nešlo na Slovensku do práce viac ľudí ako v pondelok. Teda akékoľvek zvýšenie presunov ľudí v utorok pred Veľkou Nocou nemôže byť pripísané pracovným, cestovným povinnostiam. Ľudia sa teda presúvali v utorok vo zvýšenej miere súkromne.

D] Tým posledným, zjavným záverom z Google dát je, že v utorok prebehlo nebývalo silné nakupovanie. Ak hovorím nebývalo, nemám na mysli nebývalé pre účely sociálnej izolácie, ono bolo nebývalé aj v porovnaní s predkrízovým obdobím. ÁNO, v utorok 7.4.2020 ľudia nakupovali o 20% viac ako boli zvyknutí ešte pre Koronavírusom a na nákup sa v ten istý deň vydalo o 60% viac populácie ako v bežný pracovný deň počas Korona obdobia. Len pripomínam, že v daný utorok to bolo ešte 3 pracovné dni do Veľkej Noci.

Čítanie z Apple dát najprv začnem tými závermi, ktoré zostali aj po korekcii dát rovnaké:

E] Tak ako v prvotnej verzii blogu, aj po revízii dát, je zrejmé, že miera presunu verejnou dopravou zostala počas sviatkov stabilná a “zamrazenie okresov” na ňu v praxi nemalo žiaden vplyv. Ak sa pozrieme na hodnoty jednotlivých dní z nasledovného grafu, niet o tom zásadných pochýb:

APPLE_easter_2020_TRANSIT

Koniec koncov toto tvrdenie je verifikované aj vyššie uvedeným bodom A] z Google dát (aj keď trochu väčším “zubom” zo štvrtka na piatok).

F] Pomerne jednoducho možno podobný záver vyvodiť aj o peších presunoch. Ich miera síce mierne variovala v jednotlivých dňoch Veľkonočného týždňa, ale v princípe sa pohybovala (s výnimkou Nedele) veľmi podobne ako v iných krajinách Európy, kde oslavovali Veľkú Noc v tomto termíne. Žiaden z dní však nezaznamenal tak silný výkyv, ako utorok 7.4.2020, keď prísne opatrenia ešte neboli v platnosti.

APPLE_easter_2020_WALKING

Už v prvej verzii blogu som uviedol hypotézu, že v pracovný deň sa tak zásadné zvýšenie pešieho pohybu dá zmysluplne vysvetliť len vlnou nakupovania (ktorá je jasne signalizovaná aj Googlom bode D]). Treba totiž povedať, že Apple vyhodnocuje presuny medzi konkrétnymi bodmi, ktorými nie je napríklad lúka uprostred voľnej prírody. Miera zvýšenie zároveň korešponduje s predpokladanou mierou skorších dovoleniek na daný deň, vypočítanej z bodu B] Google záverov. Oba zdroje nezávisle od seba teda potvrdzujú, že pomerne veľké množstvo ľudí sa predzásobilo už v utorok, viac ako 2 celé dni pred zavretím obchodov. Detailné údaje Googlu navyše potvrdzujú, že tento efekt síce bol prítomný vo všetkých krajoch SR, ale mal v jednotlivých kútoch SR rozličnú intenzitu. V Bratislave, Trnave a Nitre sa tak stalo v zásadne väčšej miere ako v Žilinskej župe alebo v Košickom VÚC. Aj keď priamy dôkaz o cestovaní naprieč regiónmi síce dáta Applu neposkytujú, tieto nepriame indikátory, ako aj zdokumentované dopravné zápchy v utorok 7.4.2020, sú jasným náhľadom do toho, čo sa zrejme v utorok dialo vo veľkom.

Pre našu diskusiu však zostáva podstatné, že prijaté Veľkonočné opatrenia nemali za následok výrazný pokles pešieho pohybu, ale ani jeho výrazný nárast (s výnimkou menšieho peaku o veľkosti cca +7% v Nedeľu) a po celé Veľkonočné obdobie sa správali podobne ako v iných Európskych krajinách, kde bolo tiež voľno, ale neboli tam zavedené také silné reštrikcie pohybu ako na Slovensku.

A ČO CESTOVANIE VLASTNÝM AUTOM?

 Len pre korektnosť diskusie by som chcel pripomenúť, že premiér navrhoval “okresové opatrenia” primárne s cieľom potlačiť rodinné stretávania a návštevy počas Veľkej Noci. V tomto je však diskusia trochu prekrútená.  Žiaden z verejne dostupných dátových zdrojov nedokáže rozlíšiť návštevu v rámci okresu alebo mimo okresu, to sa dá len z telekomunikačných dát, ktoré nie sú verejne dostupné. To však ani nie je dôležité, lebo zamedzenie prekračovania hraníc okresov nebolo cieľom opatrenia, ale prostriedkom na dosiahnutie opatrenia. Skutočným cieľom opatrení bolo znížiť počet (rodinných) stretnutí. Kľúčovým záverom analýzy tak zostáva, do akej miery VN opatrenia potlačili presuny autom, bez ohľadu na to, či v rámci okresu alebo mimo neho. Áno, dostalo sa mi niekoľko námietok, že veď autom sa mohli rodiny presúvať aj do prírody, čo sa považuje za “neškodný presun”. Ako uvidíte už o chvíľu, tejto hypotéze neprajú samotné dáta, v ktorých sa trendy peších prechádzok v prírode rozchádzajú s trendami používania auta. Inými slovami: Autá sa hýbali v iné dni ako boli ľudia na prechádzkach peši.  Keďže obchody a všetky služby boli zavreté, s prechádzkami autové presuny nelinkujú, zostávajú presuny medzi obydliami, ako najpravdepodobnejší variant. Samozrejme, aj výhrada, že mohli jazdiť len tak dookola, bez návštevy kohokoľvek (alebo z úplne iných mysterióznych dôvodov), je teoreticky možná. Ale úprimne, koľko mesačných výplat by ste na takúto možnosť vsadili?

G] Prvotné dáta od Apple naznačovali vysokú šoférsku aktivitu v utorok 7.4.2020 a len zanedbateľne malé efekty počas samotných sviatkov. Ak sa pozriete na skorigované dáta od Apple na prvý pohľad to vyzerá na široký, spokojný úsmev na Matovičovej tvári. Krivka miery využívania auta v jednotlivé dni posledných týždňov vyzerá nasledovne (Veľká Noc podsvietená):

APPLE_easter_2020_DRIVING_rawView

Ak by chcel niekto rýchlo skočiť do záverov, mal by jednoduché “opticky prehlásiť uvedené vládne opatrenia za neskonalý a evidentný úspech. Ak však máte ešte minútku, poďte sa spolu so mnou pozrieť na niekoľko dôležitých ” .. , ALE”. Pri čítaní daného grafu je potrebné dáta podrobiť ešte 3 dôležitým skrutíniám:

H] Účelom opatrení bolo znížiť celkový počet stretnutí. Ak niektoré dni (na začiatku a konci obdobia) počet presunov autom vzrástol oproti normálnemu dňu a v iné dni klesol , aký je celkový efekt v súčte?

I] Zavedením Matovičových opatrení sme sa snažili dosiahnuť zásadnú zmenu oproti situácií, keby takéto opatrenia neboli prijaté. Keďže nemáme údaje za Veľkú noc z iného kalendárneho roku, pre zrealizovanie porovnania sa potrebujeme pozrieť na to, aké bolo spontánne spomalenie v okolitých krajinách. Ak by totiž v podobných krajinách, ako je Slovensko, v ktorých takéto prísne opatrenia neboli zavedené, bolo aj tak vidno porovnateľné miery zníženia presunov autom, potom by bolo nebolo možné prisúdiť zníženia dosiahnuté na Slovensku práve daným opatreniam. Pretože aj bez takýchto radikálnych uzavretí okresov by došlo pravdepodobne k zníženiu aktivitu tak, ako k nemu došlo v daných porovnávaných krajinách. (Len pre ilustráciu zníženie pohybu cez Veľkú Noc má aj Švédsko, kde nie sú žiadne COVID obmedzenia)

J] Nezabúdajme, že v dané dni (najmä Veľký piatok) bolo všetko absolútne zavreté a takmer nik nemusel do práce. To sa samozrejme prejavuje aj na intenzite dopravy, pretože práve dochádzka do práce je pre mnohých hlavný automobilový presun v rámci pracovného dňa. Ako sa teda do zníženia aktivity Slovákov pretavili práve dané čerpané dovolenky počas Veľkej Noci?

Všetky tri výhrady som zhmotnil do nasledujúceho grafu, kde pokles šoférovania ( nula = bez zmeny správania), dávam do kontextu ostatných krajín Európy, kde oslavujú Veľkú noc v tomto termíne. Pridávam aj variant Európskeho priemeru a súčasného započítania efektu čerpaných dovoleniek (ešte v pracovné dni pred samotným Veľkým Piatkom a počas Veľkonočnej Soboty).

APPLE_easter_2020_DRIVING_calibration

Porovnaním miery zníženia šoférovania SVK s výsledkom dosiahnutým bez daných opatrení v porovnateľných krajinách (napr. Európa, či len V4 ktorá kopíruje EU krivku) sa dostávame k efektu, ktoré možno prisúdiť našim dodatočným opatreniam (ktoré iné štáty nemali). Ak navyše zohľadníme aj mieru zníženia presunov do práce kvôli čerpaniu dovoleniek dostávame ešte o niečo prísnejší pohľad. Mieru ich dodatočného efektu sumarizuje po jednotlivých dňoch prehľadne nasledovný graf:

 APPLE_easter_2020_DRIVING_impact_summary

Z obrázku je vidno, že aj keď niektoré dni boli efekty celkom zaujímavé, v celkovom zúčtovaní celého obdobia platnosti opatrenia sa so šoférovaním uskromnilo približne 8.6% populácie denne v pesimistickom variante alebo 13.4% populácie denne v optimistickom scenári. Skorigované dáta Apple teda potvrdzujú istú mieru zníženia presunov autami, v skutočnosti však v oveľa nižšej miere, ako by sa mohlo na prvý pohľad javiť. Otázku, či 8.6% až 13.4%né zníženie stretnutí bolo hodné toľkých nadčasov vojakov a policajtov, už nechám na každého z vás. Ja osobne sa neviem ubrániť pocitu, že až si toto detailne prezrie Igor Matovič, bude trochu … ROZČAROVANÝ. Nie je to málo muziky sa veľa potu, rozbrojov a emócií?

AKO SA KARANTÉNA DODRŽIAVA vo VAŠOM REGIÓNE?

Vhupli sme do toho spolu. Karanténne opatrenia dávajú zmysel primárne vtedy, keď sú plošné. A tak prídeme o Veľkú Noc takisto spolu. A spoločne budeme musieť aj z karantény vystúpiť. Aj keď existujú prípady krajín, kde opatrenia boli zavádzané a „vypínané“ rozlične v regiónoch. Vystúpiť z karantény nemožno „za zásluhy“ pri jej dodržiavaní, to samozrejme závisí aj od iných faktorov (ako miera rozšírenia v danom regióne, či rozloženie podnikov a obchodov). Ale môžeme sa aspoň pozrieť, ktoré regióny ako prispievajú k spoločnému cieľu. A o tom je tento blog

Pripomeniem, že plošné povolenie niektorých opatrení sme rozoberali v tomto blogu. Dnes však urobíme pomyslený zoom-in a povieme si, ako jednotlivé opatrenia rešpektujú VÚC kraje Slovenska. Možno vás to prekvapí, ale prehľad sa o tom dá urobiť aj bez nazretia do vládou zbieraných dát od telekomunikačných operátorov. Ale o tom až na koniec, poďme  teraz k tomu najzaujímavejšiemu.

KTO TO ODMERAL

Ak ste nachvíľu zaváhali, či náhodou nepracujem s nejakým únikom dát poskytnutých operátormi vláde podľa nového zákona, tak buďte bez obáv. Bez potreby siahať na telekomunikačné dáta, existuje aj voľne dostupný zdroj týchto informácií, ktoré zverejnil Google. Na svojej stránke, venovanej monitoringu COVID opatrení, totiž Google verejne na stiahnutie dáta o každej jednej krajine, dokonca jej regiónoch. Dáta pochádzajú zo sledovania mobilných zariadení schopných pohybu, pričom porovnáva ich aktivitu počas COVID opatrení s priemermi pred vypuknutím krízy. Report za Bratislavský kraj napríklad vyzerá takto

Ešte než sa pustíme do zostavenia rebríčka „uvedomelosti“ regiónov SR, musíme si povedať, že Google meria celkovú zmenu v mobilite v 6 samostatných kategoriách. V nižšie uvedených grafoch je vždy stredová deliaca čiara celoslovenským priemerom a čím tmavšia farba tým svedomitejší je daný región v dodržiavaní daného kritéria, čím bledší, tým horšie je priemerné dodržiavanie tohto typy opatrenia.

GOOGLE_gastro_0405Návšteva Gastro zariadení & drobných prevádzok a obchodov. Do tohto kritéria započítava Google návštevy barov, reštaurácií ,rekreačných zariadení, alea j prevádzky dorbných služieb (ako napríklad holičstva), či drobných predajní (napr. Chovprodukt, či Železiarstvo). Zaujímavé, že v tomto sa väčšina SR regiónov drží na rovnakej hodnote, len v Trenčianskom kraji je trochu menej disciplíny v tomto ohľade.

.

Nákupy v Potravinách, Drogériách a Lekárniach. Druhou Google sledovanou kategóriou sú nákupy v nevyhnutných obchodoch vymenovaných v názve. Pričom je dôležité povedať, že pre všetky kategórie sa aj tu porovnáva miera návštev pred krízou a teraz počas opatrení. Teda, ak niekto musel chodiť pre lieky chronicky chorého do lekárne pred vypuknutím krízy, miera „prehodnotenia“ (alebo zlúčenia) týchto návštev sa premieta do celkového efektu. Tu už badať medzi regiónmi SR väčšie rozdiely, pričom najviac stále chodia nakupovať v Žilinskom kraji, najmenej v Bratislavskom kraji.

Návšteva parkov a prírody. Toto kritérium mobility patrí trochu medzi diskutabilné, pretože háďže do jedného vreca aj potenciálne nebezpečné strety (napr. preplnený park) s návštevou lesa, ktorá môže byť takme neškodná. Keďže však typy jednotlivej zelene sa nedajú nejak strešne zhŕnuť do jediného ukazovateľa, prižmúrme nad tým okom a berme do úvahy to, že ľudia sa nejak do tých parkov a lesov musia aj dostať, čo môže byť do istej miery rizikové. V tejto obalsti sa opäť regióny SR správajú odlišne. Prešovčania sa tvrdo obmedzili aj v týchto aktivitách, zakiaľ naopak Trnavské VÚC dokonca zdvihlo svoju návštevnosť v parkoch o takmer polovicu oproti predkrízovému stavu.

Presun verejnou dopravou. Google samozrejme nemá šancu vedieť úplne presne, či ste išli do práce vlakom alebo súkromným autom, ale dokaže odčítať, či ste sa zdržiavali pred a po presune na zástavkách alebo staniciach. Z toho dokáže skompilovať približnú mieru zníženia používania verejnej dopravy. Opäť sa dostávame k pomerne odlišným vzorcom správania v regiónoch našej krajiny. Zakiaľ Prešovské VÚC, Bratiskavský a Žilinský kraj obmedzili cestovanie dopravou výraznejšie, v Nitrianskom kraji tento aspekt zostal voľnejší.

Práca na štandardnom pracovisku. Keďže Google pre vytvorenie tohto porovnania disponuje dlhodobými údajmi, vie, kam chodíte do práce. Dokáže teda teraz porovnať, aká miera zamestnancov sa denne presúva na to pôvodné pracovisko a koľko z nich zostáva doma počas pracovnej doby. Rozdiely sú tu o niečo menej vypuklé ako pri iných kritériách, ale stále najviac doma zostali obyvatelia Žilinskej a Trenčianskej župy. Naopak najviac sa stále do práce dochádza v Banskobystrickom kraji.

Residential. Priznám sa, že o tejto kategórií samotný Google pridáva pomerne málo popisov, tak nie je jasné, čo všetko sem spadá. Z rôznych iných analýz som sa však dovtípil, že by malo ísť o presuny, kde štartom aj cieľom je rezidenčný typ budovy. Môže teda ísť o návštevy, ale rovnako aj o presuny medzi viacerými bytmi, domami, či odchod na chalupu. Zaujímavé je, že v tomto kritériu ako jedinom sú všetky kraje v pluse a navyše majú veľmi podobnú hodnotu.

AND THE WINNER/LOSER IS?

Aby sme nezostali nič dĺžni nadpisu článku, poďme sa pozrieť na to, ako dopadli jednotlivé regióny v celkovom hodnotení. Samotný Google nezverejňuje nejakú strešnú metriku, ktorou by sa dali priamo krajiny alebo regióny medzi sebou porovnávať (koniec koncov o to ani Googlu pri zverejňovaní týchto dát nejde, snaží sa primárne podporiť epidemiologické teamy vstupnými dátami). My sme si však takýto strešný ukazovateľ spoločne vytvorili (jeho konštrukcia popísaná nižšie) a vyšlo nám, že …

Najlepším krajom pre dodržiavanie karantény je Prešovský kraj. Nasledujú ho Žilinský a Bratislavský. V pomyselnom strede spektra sa ocitajú kraje Nitriansky, Trenčiansky a Bystrický. Takmer na chvoste sa nachádza Košické VÚC a suverénne najhorší je región Trnavský. (Žeby sa premiér držal okrídleného podľa seba súdim teba? 😊 ) Keďže kritérium pohybu v prírode môže byť kontroverzné, tak som sa pokúsil vypočítať celkový efekt aj bez tohto komponentu. Trochu to zamiešalo stredom tabuľky, ale víťaz a looser rebríčka však zostali rovnakí. Ktovie, či vláda naberie odvahu podľa podobného kritéria sprísniť, či naopak uvoľniť reštrikčné opatrenia odlišne v regiónoch. Alebo zostaneme pri trpiteľskom a rovnostárskom „keď mne zdochla krava, tak nech aj susedovi“. Špeciálne keď s trnavskými „kravami“ to nevyzerá až tak dobre.

NA KOĽKO PERCENT SME VYPLI KRAJINU

Vo vzťahu k Matovičovmu návrhu na black-out sa rozpútala polemika o tom, nakoľko sme ako krajina vypnutí. Samozrejme, vypnutie krajiny má aj mnoho iných aspektov, ktoré Google odmerať nedokáže (napríklad že neordinuje zubár, ktorý má ordináciu na mieste, ktorá sa nedá podľa GPS jednoznačne identifikovať). Skúsme však byť na chvíľu trochu veľkorysí a od toho abstrahovať. Zoberme faktory detegované Googlom a pre realistickosť porovnania urobme vážený priemer s najväčším dôrazom na dopravu (20% váha), základné nákupy (25%) a využívanie gastro a iných služieb (25%), (ktoré sú pre nákazu najdôležitejšie, a menšou váhou pre ostatné kategórie (pracovisko = 15%, pohyb po parkoch a prírode = 10% a presun medzi obydliami = 5% váha). Takto agregovaný parameter nám napovie, že …

krajinu sme vypli už na 59%. Ak by sme upustili od trochu kontroverznej metriky chodenia do parkov a prírody (ktoré samo o sebe nemusí byť v rozpore s karanténou, pokiaľ tam ideme individuálne), tak sa číslo vyšplhá dokonca na 66%. Napriek tomu, že nám tu vojsko neroznáša potraviny a stále nemáme stanné právo, vypli sme krajinu už na 60% a viac percent. Fascinujúce. A zároveň poučné. Osobne som zvedavý, ako sa toto číslo zmení (vzhľadom na dodatočné reštrikcie) práve počas Veľkej noci, k čomu sa na mocnedata.sk určite ešte vrátime.

SME NAOZAJ UNIKÁTNI (?)

Tým, že Google zverejňuje tieto data pre všetky krajiny, je možné urobiť nielen hitparádu “svedomitosti” jednotlivých regiónov, ale možné prirovnať Slovensko aj k ostatným krajinám. Mnohé naznačuje, že Slovensko je na popredných priečkach v intenzite opatrení ale aj v disciplinovanosti v ich dodržiavaní. Vďaka tomu sa medzi expertmi šepká, že by sme mohli byť unikátni v tom, ako hrozbu koronavírus riadime. Je to však naozaj tak?

Ak zoberieme vyššie spomínaný vážený priemer 6 komponentov správania, ktoré Google reportuje, a aplikujeme ho rovnako aj na ostatné krajiny, dopracujeme sa k zaujímavým porovnaniam. Pri tej istej metodike výpočtu (ktorá u nás hlási lock-down na 59%) naši Českí bratia utlmili svoju krajinu len o 33%. A to hlavne preto, že stále väčšia časť českej spoločnosti nepracuje z domu a chodí na svoje pracovisko, ale hlavne Česi sa takmer vôbec nezdali nakupovania v potravinách (len o 13% menej ako v predkrízovom režime).

Aj Takí Nemci, kde dnes už platia takmer identické opatrenia ako dnes (a obchody v Nedeľu boli už zatvorené aj pred Korona krízou), vypli svoju krajinu len na 29%. Rovnako ako Česi, neprestali nakupovať v potravinách, stále chodia viac ako Slováci do reštaurácií a drobných prevádzok služieb a nariadenú karanténu trávia často v parkoch. (Čo viedlo Berlínsku políciu k tomu, že zaviedla špeciálny sadzobník pokút za zdržiavanie sa vonku.) Napriek laxnému prístupu svojho premiéra, obyvatelia UK sa sociálne izolovali na 55%. Svoje obstojné číslo však dosiahli najmä výrazným obmedzením dopravy, pričom nakupovať do potravín opäť chodia oveľa viac ako Slováci. Na rozdiel od Nemcov sa však netúľajú po parkoch. Možno nájdem ešte čas urobiť celo-Európske porovnanie (alebo ma niekto predbehne), ale z uvedených čísiel je vidno, že Slováci to poňali naozaj disciplinovane. Až unikátne disciplínovane.

AKO ĎALEKO SA DÁ ZÁJSŤ

Ak by ste chceli získať predstavu, na koľko percent vlastne ide maximálne vypnúť krajinu, tak sa môžeme pozrieť na krajiny, ktoré zaviedli explicitný zákaz vychádzania, asi najvyššiu formu potlačenia spoločenského stretávania. Taliansko sa v čase najstriktnejších opatrení dostalo na číslo 79%. Madrid sa v čase najtvrdších opatrení dopracoval na 78%. Bľabotanie o vypnutí na 90% by nás zrejme spravilo zaručene svetovým unikátom , ale našťastie sa javí ako nereálne. A len pre uvedenie do kontextu aj tak vysoké percentá vypnutia krajiny, ako dosiahlo Španielsko či Taliansko, boli dosiahnuté hlavne obmedzením verejnej dopravy. Totiž aj v tých najextrémnejších prípadoch muselo do práce 31% ľudí. Pod 30% to zrejme ani pri vojenskom modeli nejde, ak ľudia nemajú umierať hladom, nemocnice nemajú zostať bez lekárov a ulice bez hasičov a policajtov.

Práve ste dočítali jeden zo série blogov o Korona víruse. Ak vás to zaujalo, skúste si prečítať ešte aj:

10 minutový RÝCHLOKURZ GENIALITY o epidemiológii

ZOBERIE KORONA PRÁCU aj MNE?

AKO UROBIŤ IZP MODEL UŽITOČNÝM? (aneb AKO SI VÔBEC DOVOĽUJEM KRITIZOVAŤ IZP)

Ako sa SVET ZMENÍ keď konečne VYJDEME VON Z KARANTÉNY

Dovetok pre transparentnosť

Pre ľudí viac lipnúcich na detailoch ešte pridávam, vysvetlenie, že A] dáta pre SVK a jej regióny som bral za relevantné od 12.3.2020, keď sa začali sprísňovať opatrenia. B] Pre kategórie Residential a kategóriu Parks som bral do úvahy vážený priemer za obdobie po 12.3., lebo tieto hodnoty pomerne kolíšu v čase. Pre ostatné kategórie som bral hodnoty priamo uvedené Googlom, lebo majú veľmi stabilný priebeh v čase. C] Niekto by mohol namietať, že hodnoty nakupovania reportované priamo Googlom predstavujú len extrémy počas víkendov a počas „pracovných dní“ sú priemery nižšie. To je síce pravda, ale pre celkové porovnanie regiónov to nie je smerodajné, lebo peak a bežné dni majú obdobný priebeh naprieč regiónmi a Google nezverejňuje konkrétne hodnoty za každý deň. Takže bezpečnejšie ako sa pokúsiť odhadnúť hodnoty z grafu, je použiť peaky priamo reportované Googlom. D] Dáta sú čerpané iba zo zariadení s Google účtom (teda nezahŕňajú do vzorky veľký počet Iphone, iWatch a iných mobilov bez Androidu a bez Google účtu. Samozrejme, nie je vylúčené, že aj na iOS telefóne budete mať Google účet, ale je to násobne menej pravdepodobné ako pri telefónoch s Androidom. Je viacerými výskumami dokázané, že iOS komunita je navyše (najmä ekonomicky) výrazne odlišná od Android priemeru, takže po zamiešaní iOS zariadení do vzorky, môžu byť celkové čísla za krajinu odlišné. Ale berme to ako najlepšie priblíženie realite, ktoré je voľne dostupné. E] porovnania boli realizované z Google reportu zo dňa 5.4.2020.

NECHOĎTE pracovať do GOOGLU, skúste RADŠEJ …

Ak to so svojou kariérou dátového analytika myslí človek vážne, prirodzene ho začne priťahovať myšlienka pracovať pre jedno z odvetví, kde je rast dát najrýchlejší. Tam sa totiž „pečie“ koláč budúcnosti. Presne preto boli „magnetické“ najprv telekomunikačné firmy a banky v 90tych rokoch, po roku 2000 E-commerce a za posledné desaťročie najmä sociálne siete. Viete však čo je “v trúbe“ na to najbližšie obdobie?

Mnohí by možno odpovedali, že najlepšie miesto pre vybláznenie sa „dátového analytika“ musí byť predsa Google. Veď, ruku na srdce, čo vlastne o nás Google nevie? (odpoveď TU, 16min:40sek ) Nuž, možno by vás prekvapilo, že keby sme zobrali jednotlivé služby Google samostatne jednu po druhej, tak existujú firmy, ktoré majú oveľa viac dát ako tieto produkty Google. Začínate krútiť hlavou? Možno čas poopraviť si mienku.

Fenomén Búrka

Ak chcete správnu odpoveď uhádnuť sami, tak tu sú pre vás ešte dve indície (otca Furasa z veže): 1) Skupinové aktivity generujú vždy viac dát ako obsah generovaný jednotlivcom; 2) Dáta o pohybe (video) poskytujú oveľa viac premenných ako statické obrázky, zvukové stopy alebo len čistové textové údaje. Ak si trúfate uhádnuť, čo za odvetvie to je, tak sa nachvíľu tu zastavte v čítaní (ďalší odsek odkrýva správnu odpoveď). My ostatní ideme priamo na to.

Digitálnymi hrami aktuálne máva fenomén Fortnite. Táto hra má aktuálne približne 200 miliónov pravidelných používateľov (MAU = monthly active users) a v každej sekunde sa ju hráfortnite_logo približne 8.5 milióna hráčov súčasne po celej planéte. Keďže ide o multi-player hru, jej tvorcovia (štúdio EpicGames) musia dôkladne ukladať, čo každý z hráčov urobil. Pretože práve vzájomné interakcie hráčov sú to, čo rozhoduje o tom, či Vaša  postava prežila alebo ste z hry vypadli. Vo Fortnite totiž (pod rúškom prichádzajúcej kataklizmickej búrky) sa neustále zužuje herný priestor a tak prichádza k nevyhnuteľným stretom jednotlivých postáv (hráčov) a potvrdeniu, že Darwin sa predsalen nemýlil.

Práve potreba dokumentácie pohybu všetkých postáv a ich vzájomných interakcií robí z hry neskutočného chŕliča dát. Predstavte si to ako (dátové zakódovanie) videa pohybu 8.5 milióna ľudí súčasne. Fascinujúce, nie? Podľa informácií Amazon Web Services (AWS), ktorí spravujú dátové úložiská pre túto hru, objem dát dosahuje hodnotu 95 PetaBytov (a stále rastie). To je veľkosť porovnateľná s Google Indexom na vyhľadávanie všetkých dostupných stránok internetu. Napadlo by vám, že hra môže byť väčšia ako Google. Áno, vyhľadávanie je len jedna zo služieb Google, ale Fortnite je rovnako len jedna z desiatok tisíc digitálnych hier. (Aj keď uznávam, momentálne asi najväčšia)

Nové magnetické odvetvie

Online hry sú naozaj fenomén. Len v Spojených Štátoch Amerických rástli v 2018 tržby v hernom priemysle úctyhodným tempom 18% za rok (podľa údajov asociácie Entertainment Software Association (ESA) ). Vďaka tomuto rastu patrí herný priemysel medzi jedny z najrýchlejšie rastúcich odvetví vôbec a len v USA zamestnáva viac ako 200 tisíc ľudí. Ako dokáže toto odvetvie tak rýchlo napredovať?

Po niekoľko desaťročí sa herný priemysel správal podobne ako filmárske štúdia. Veľký počet navzájom (nepriamo) súťažiacich filmových teamov vychrlilo na trh stovky filmov s nádejou, že niektoré z nich budú hitmi. Väčšina sotva zarobila na výrobné náklady (a honoráre pre hercov). Ale zopár z nich boli zásahy do čierneho, ktoré zarobili stovky miliónov dolárov a tak pokryli diery „po prepadákoch“. Áno, aj herné štúdia produkovali ročne stovky až tisíce hier rôznych žánrov. A potom sa modlili, aby si hry našli dostatočné publikum. Herný priemysel tak v tomto období bol odkázaný na vzostupy a pády, ich ekonomické výsledky pripomínali skôr húsenkovú dráhu, než stabilný rast, aký vidíme dnes. Ako to, že dnes vykazuje dlhodobo rast a navyše rast ekonomicky tak nadpriemerný?

Tou podstatnou ingredienciou, ktorá sa zmenila, sú práve dáta. Počítačové hry sú totiž dnes dizajnované tak, že pre výrobcu uchovávajú informácie o tom, ktoré časti hry boli pre používateľov atraktívne či nudné, príliš (až nezdolateľne) náročne alebo naopak nezáživne ľahké. Postupným sledovaním preferencií hráčov sa vývojári naučili nakalibrovať vývoj príbehu v hre tak, aby udržala hráčov pred obrazovkou čo najdlhšie. Tým dokázala zvýšiť celkové publikum hráčov. Z dúfania v hity sa stala cielená fabrika na úspešné hry. Tento jav zarovnal „kopce a doliny“ v úspechoch herných štúdií. (Teda minimálne tie doliny, kopce ako Fortnite sa stále kde tu objavia). To však nebol jediný efekt dát v hernom priemysle. V skutočnosti dáta priniesli tomuto odvetviu dva ešte podstatnejšie tromfy.

Ďalšie dva tromfy

Pôvodný biznis model sa snažil celú hodnotu hry skasírovať od potenciálneho hráča pri kúpe samotnej hry. To je však, ako keby ste museli zaplatiť za dom bez toho, že by ste sa v ňom detailne poprechádzali, prípadne strávili pár nocí. Tento prístup podnecoval softvérové pirátstvo, lebo na to, aby ste sa hru mohli hrať do životne vám stačilo dostať sa iba k jej cracknutej verzii. (Predstavte si, že by sa dom aj s pozemkom stáli doživotne vašimi iba tým, že by ste si od zámočníka nechali urobiť falošnú kópiu kľúču. Mnoho ľudí by tomuto zjavnému pokušeniu neodolalo. A tak to bolo aj s hrami).

Zbierané dáta o tom, ako napredujú hráči v jednotlivých častiach hry, však umožnili herným štúdiám do častí príbehu, kde uviazlo viac hráčov, umiestňovať „platené skratky“. Za pár eur vám hra ponúkla nápovedu, chýbajúce zdroje na ďalšie budovanie alebo nejaký predmet či schopnosť pre Vašu postavu. Zrazu sa celá šachová partia okolo speňaženia hry otočila: Bolo to v záujme hráča samotného zadovážiť si túto platenú pomoc. Je to, ako keď chcete pred letom do domu namontovať klímu. Prežijete aj bez nej, ale v horúcom lete Vás to bude stáť viac síl. Klimatizáciu si však už nemôžete pričarovať sfalšovaným kľúčom, tú už musíte riadne nechať nainštalovať a zaplatiť. Tento druhý dátový vplyv sa ukázal ako omnoho podstatnejší, lebo ako aktuálne štatistiky ukazujú, že až 43% z celkových príjmov hier bežiacich na mobiloch či tabletoch generujú práve rozšírenia a položky dokúpené priamo v aplikácií počas hrania.

Tretím tromfom, ktorý priniesli dáta do herného priemyslu, je tvorba a testovanie nového obsahu. Mať úspešnú hru ako Angry Birds, či niektorý z podobných hitov, znie ako požehnanie. Milióny ľudí sa hrajú vec, ktorú ste vy raz naprogramovali, a na účte vám doslova len cinkajú nové a nové peniaze.

ANGRY_BIRDS_dream_blastTakto ružovo to vyzerá však iba ak ste majiteľom firmy. Už menej optimistický odtieň to pre vás má, ak ste vývojárom, ktorý musí danú hru programovať. Podľa údajov zverejnených na konferencii NOAH LONDON 2019, obrovský dopyt desiatky miliónov hráčov hry Andry Birds Dream Blast  spôsobuje, že firma musí vytvoriť každý týždeň ďalších 40 nových levelov hry. Ak sa vám z toho netočia ešte panenky, tak vám to skúsim rozmeniť na drobné: Priemerný pracovný týždeň má 5 x 8 = 40 pracovných hodín. Developerský team tejto hry musí každú pracovnú hodinu vymyslieť, naprogramovať, otestovať a nasadiť nový level. Každú pracovnú hodinu! Iste môžete mať armádu programátorov, ktorí dokážu pracovať paralelne tak, aby stihli novú úroveň hry za danú hodinu vymyslieť a naprogramovať. Ale ako dokážete v rámci danej hodiny aj hru dôkladne otestovať, keď jedna hra daného levelu si môže vyžadovať niekoľko minút hry? Aj keby ste mali armádu 100 testerov, spolu s vývojom hry by si ju stihli zahrať do hodiny tak možno 500-600 krát, čo je pramálo na to, aby ste pochopili, ako budú vnímať hru milióny rozličných používateľov. A tak prišla opäť na rad úloha dát.

Keďže herné štúdia majú k dispozícií obrovské zásobníky dát o histórii hrania tejto hry (a iných podobných), vedia vyprofilovať typické profily hráčov, ktoré sa nachádzajú v celej enkláve fanúšikov hry. (Niekto hrá len pre pocit, že dokáže zdolať daný level, niekto sa neuspokojí kým nedosiahne čo najväčší počet bodov, niektorým vôbec nejde o ukončenie levelu, len sa zabávajú na rôznych nezdarných riešeniach hlavolamu, …) Pre každý typ fanúšika hry následne herné štúdio natrénuje neurónovú sieť (pomocou reinforcing learning), ktorá dokáže simulovať hranie práve daného typu užívateľa. Následne sa v cloud prostredí (ako AWS) vytvorí mnoho kópií virtuálnych hráčov (tisíce pre každý typ hráča), ktorým sa odovzdá novo nadizajnovaný level hry a spustí sa ich hranie. Firma tak získa obrovský počet spätných väzieb o tom, akú odozvu bude mať práve navrhnutý nový level hry pre jednotlivé skupiny hráčov. Čo je podstatné, že takéto digitálne dátové testovanie je prudko škálovateľné, keďže nie ste limitovaný tým, koľko rôznych typov hráčov máte alebo koľko rôznych levelov ste vytvorili.

Tak čo vy?

Tým sa sled dátových vplyvov na herný priemysel uzatvára do silnej, čoraz viac sa rozpínajúcej špirály. Je teda jedno, či túžite robiť dátovú analýzu hráčov, jednotlivých komponentov hry alebo vás viac fascinuje hľadanie vhodných škáročiek na in-app nákupy, či parametre nových úrovni hry. V hernom priemysle sa naozaj aktuálne črtá mnoho zaujímavých analytických príležitosti. Preto, ak pracujete v niektorom z dátovo už nudných sektorov (banky, utility, poisťovne, …) možno je čas rozhliadnuť sa aj po hernom sektore.  A vôbec nemusíte baliť kufre, veď len na Slovensku pôsobí viac ako 20 herných štúdií  a ročne u nás vychádza viac ako 70 nových hier. Firmy ako PIXEL FEDERATION si pomaly získavajú rešpekt aj ostatných odvetví a predstavujú dotyk s Európskou špičkou herného priemyslu. Ak by ste predsa boli ochotní zbaliť ten kufor, za hranica sú možnosti takmer neobmedzené. Tak čo? Idete sa radšej pohrať s dátami alebo s Googlom?