Koľko stromov PRESNE je v Bratislave?

Keď prenikli na svetlo sveta informácie, že Google plánuje odfotiť všetky ulice, aby ponúkol 3D mapu miest, zdalo sa mi to neuveriteľné. Prebrázdiť autami s kamerou státisíce miest znie ako nemysliteľný projekt. Rovnako nemysliteľné však kedysi bolo, že ľubovoľná mapa bude zadarmo na internete, takže naša generácia sa s týmto prelomom tak nejako, proste, vysporiadala.

Keď Google Streetview prišiel naozaj do používania, dostal tento počin ešte jednu obdivuhodnú dimenziu. Ulice a uličky sú zobrazené v tak detailne, že dokážete spočítať okná na domoch alebo zvončeky pri bráne. Naozaj odzbrojujúci objem informácii. Aspoň pre ľudí …

Všetky príbory na Slovensku

priboryJedna z mojich obľúbených úloh pri výbere ľudí do zamestnania znie nasledovne: “Keby ste mali nahradiť všetky príbory na Slovensku novým typom, koľko by ste ich museli vyrobiť?” Časový priestor na pohovore samozrejme nie je určený na to skutočne spočítať všetky kusy, ale skôr správne a dostatočne presne odhadnúť koľko príborov na Slovensku máme. (pozri si aj sadu ďalších  úloh z mojich pohovorov). Ako ukázal prvý pochod proti korupcii, na spočítanie príliš veľkého počtu vecí zatiaľ používame iba veľmi približné metódy. Pri účastníkoch demonštrácie či letných festivaloch, ako aj pri daných príboroch sa snažíme nájsť nejakú zmenšeninu reality (reprezentatívnu časť davu, typickú rodinu s príbormi, …) A potom výsledok „zmenšenej reality“ vynásobiť multiplikátorom a máme výsledok. S prichádzajúcimi technológiami však musím uznať, že riešenie, ktoré som v minulosti uchádzačom uznával ako správne, už budem musieť zavrhnúť…

Ak by som totiž položil podobnú otázku: “Koľko stromov je v Bratislave?“ , vyššie uvedená metóda by už vôbec nebola dobrým spôsobom ako vypočítať výsledok. Postup zmenšenej reality a multiplikátora totiž testuje analytické myslenie uchádzača len v klasickom štruktúrovanom myslení. Snaží sa vychádzať zo vzorky, nie z celku. Vo svete BigData však toto myslenie už nie je správne. V novej paradigme sa nemôžeme nechať zastrašiť „neľudským“ úsilím, ktoré by bolo treba vyvinúť na skutočné spočítanie všetkých stromov. V novej paradigme si musíme položiť ako prvú otázku: „Existuje nejaký spôsob ako by som naozaj spočítal všetky stromy?“ Tak ako to urobili v Bostone …

Bostone sa nielen hádže čaj do mora

Team BigData analytikov z MIT vytvoril aplikáciu, ktorá postupne prechádza Google Streetview zábery jednotlivých miest a odčítava z nich, akú časť záberu zaberajú stromy. Následne z týchto údajov vypočítavajú index zelene. Najprv pre každú ulicu osobitne, neskôr v súčte pre celé mesto. [registrovaní členovia mocnedata.sk si môžu v doplňujúcom materiáli k tomuto blogu pozrieť materiály k tomuto fascinujúcemu experimentu]. Sprvoti tak urobili len pre Boston (v ktorého blízkosti univerzita sídli), neskôr experiment rozšírili na množstvo európskych a svetových metropol.

Z uvedených údajov tak napríklad vidno, že Paríž patrí k jedným z najmenej zelených veľkomiest. Je na tom dokonca trikrát horšie ako Amsterdam. Bratislava sa, azda aj chvalabohu, do zoznamu testovaných miest zatiaľ nedostala.

TREE_index_paris

Aj keď už len samotný nápad spočítať podiel zelene v meste je sexi sám o sebe, z tohto príkladu nám vyplýva oveľa dôležitejší záver ako, či dať prednosť Amsterdamu pred Parížom. Žijeme v dobe, keď rozmýšľať cez prizmu vzorky, z ktorej odhadujem celok, už znamená byť v konkurenčnej nevýhode. Tam vonku už je určite niekto, komu napadlo to nechať strojom spočítať úplne presne na celku bez použitia vzorky. Myslím, že snaha oprieť sa o „približovátko“ pochádza z doby, keď spočítať  naozaj všetko bolo možné len ľudským úsilím. (pamätáte si na študentov, čo na križovatkách či mostoch nad diaľnicou počítali intenzitu dopravy?) V dnešnej dobe však neskutočne úmorné počítanie za nás dokáže prebrať technika. My sme však myslením stále akosi uviazli v snahe pre odhad čísla najprv nájsť zmenšený model reality.

Je to o zmene myslenia. A musím priznať, že tá zmena je oveľa ťažšia, ako by som pôvodne čakal. Tam niekde na pozadí nám stále najprv napadne „priemerný počet stromov na ulici, krát priemerný počet ulíc v meste, …“ Na budúci týždeň začínam prvé kolá výberu na BigData analytikov. Pri hodnotení ich odpovedí budem musieť na to dobre pamätať.

Tak čo? Poď s farbou von: Znie to nejak povedome aj Tebe?

Tento blog obsahuje doplňujúce informácie, ktoré sú prístupné iba registrovaným členom komunity. Členom komunity sa však môže stať ktokoľvek zadarmo priamo tu.  (prístupové heslá sa zasielajú zväčša do 24 hod od registrácie). Okrem zamknutých článkov majú členovia komunity prístup aj k dodatočným prezentáciám a videám.

Ďalšie blogy, ktoré by ťa mohli zaujímať:

Chatbot bude za chvíľu produktom Nemocníc a Pohrebákov

Ktorá značka je najďalej vo vývoji samojazdiach áut?

Koniec praveku pre hudobné festivaly

Čo sa doučiť z DataMiningu a analytiky?

Najčastejšie analytické chyby