Jednou z výhod práce s veľkými spoločnosťami je, že v ich dátach je možné realizovať zaujímavé sociálne bádanie a experimenty. Podobnú možnosť som mal nedávno, keď sme analyzovali dáta jednej slovenskej firmy, ktorá má viac ako 1 mil klientov. Išlo o analýzu telefónnych čisiel, z ktorej vyplynuli o Slovákoch pozoruhodné závery. Veď posúďte sami:
Slováci posadnutí mobilnými číslami?!
Na mušku sme si zobrali mobilné telefónne čísla klientov. Keďže išlo o fyzické osoby, v analýze vystupovali len súkromné čísla ľudí, služobné mobily (u ktorých zväčša býva spoločný základ čísla) sa v analýze nezohľadňovali. Z medzinárodného formátu mobilného čísla +421 xxx yyy yyy sme odrezali začiatok +421 xxx, ktorý na Slovensku predstavuje predvoľbu operátora (teda aspoň v minulosti predstavoval) a zamerali sme sa len na posledných 6 čísiel “yyy yyy”, ktoré si klient môže sám zvoliť pri dojednávaní zmluvy s mobilným operátorom. Položili sme si zdanlivo jednoduchú otázku otázku: Majú slováci nejaké preferencie a úchylky pri výbere mobilného čísla? Ak sa totiž nejaká kombinácia čísiel objavuje častejšie ako by sa štatisticky mala objaviť pri náhodnom výbere čísla, je zrejmé, že klienti si túto možnosť cielene vyberajú. V čom sme teda iní v mobiloch?
Hlavne nebyť nulou v spoločnosti. Aspoň na začiatku nie
Hoci nula medzi krvnými skupinami má veľmi vysoký spoločenský kredit (môže dať krv komukoľvek inému), medzi mobilnými číslami slovákov táto cifra nežne zásadný úspech a to najmä za začiatku čísla. Ak sa pozriete na graf toho, ako často sa jednotlivé cifry objavujú na prvom mieste v mobilných čísiel Slovákov, pochopíte, že máme fóbiu z NULY a SEDMIČKY na začiatku. Naopak najžiadanejší začiatok mobilného čísla pre Slováka je na jednu z cifier 1,2 alebo 3.
Komické pri tom je, že týchto dvoch cifier (7 a 0) sa zásadne bojíme len na prvom mieste mobilného čísla, keď sa pozrieme na ďalšie pozície v mobilnom čísle, tak medzi jednotlivým ciframi nie je až taký rozdiel. Pre slováka je pri výbere mobilného čísla dôležité hlavne dobre začať. A hoci so sedmičkou nie sme úplne spokojní ani v ďalších cifrách, naopak nula sa od 2. do 6. pozície stáva celkom populárnou cifrou.
Obľúbené číslo? Iné v každom veku
Pri zohľadnení všetkých 6 pozícii, kde sa jednotlivé cifry môžu objaviť, Slováci si najviac prajú mať vo svojom čísle aspoň jednu “2”ku. (do svojej číselnej kombinácie si ho vyberá 49% Slovákov, teda aspoň každý druhý z nás). V priemernej štvorčlennej domácnosti, ak dáte všetky mobily dokopy, mali by ste mať v ich číslach aspoň 2 krát číslo dva. Preto ak na najbližšie návšteve sa chcete blisnúť ako nádejný kúzelník, pobavte hostiteľov trikom, že uhádnete aspoň 2 cifry z ich mobilných čísiel.
Naopak najmenej populárnou cifrou pri výbere mobilného čísla je u slovákov číslo “9”. V mobilných číslach našich krejanov sa objavuje približne o jednu desatinu menej ako spomínaná, žiadaná 2ka. Uvedené preferencie slovákov však nie sú konzistentné naprieč generáciami. Keď sa pozrieme na obľúbené číslo podľa veku, tak každá z generácii má trochu iných favoritov:
Čo majú generácie spoločné je, že “fandia” pomerne rovnako číslam “2” a “3”. Pre adolescentov je však cool napríklad NULA, kdežto u ľudí stredného veku je nula najmenej obľúbené číslo. U starších ľudí je pomerne populárna ako číslica aj “5” (že by dôsledok legendárneho filmu číslo 5 žije ?), najmladší držitelia mobilov však nad týmto číslom len laxnemávnu rukou. Azda najzaujímavejším javom je, že všetky generácie vedno pramálo volia vysoké číslice 7, 8 a 9.
Mobilné číslo ako status. Ako sa hrnie Slovák za “peknými” číslami?
Možno si pamätáte, že v dobe keď sa rozbiehali mobilné telefóny, bola zhánka po zaujímavých mobilných číslach. Tato show-off tendencia plynula aj z toho, že pri zapájaní pevnej linky ste si číslo nemohli príliš vyberať, proste vám Slovenské Telekomunikácie (alebo ešte SPOJE) nejaké číslo pridelili a boli ste radi, že vôbec máte telefónnu prípojku. S príchodom mobilov, kde si klient zrazu mohol vybrať svoje číslo, sa tak rozpútal súboj o statusové číslo.
Možno aj práve preto je zrejmé, že pekné čísla išli na dračku a minuli sa oveľa skôr ako ostatné čísla. Slováci teda majú obsesiu v tom, ako ich mobilné číslo vyzerá. Veď pozrite, koľko slovákov chce …
Dokopy viac ako polovica registrovaných čísiel má aspoň jeden z pekných tvarov. Ak teda slovák vyberá pre seba mobilné číslo, hlavne nech sa ľahko pamätá (čo bola najčastejšia výhovorka pre túto slabosť od majiteľov statusových čísiel).
Dátumy medzi slovákmi nefrčia
Ak by si ľudia naozaj chceli dobre pamätať telefónne číslo, stačilo si vybrať svoj dátum narodenia. Šestmiestny tvar tomu silno drukuje, lebo väčšina ľudí vtesná svoj dátum narodenia (napr. 1981 3 6) do takejto kombinácie a úplne každý môže použiť začiatok svojho rodného čísla pred lomítkom (napr. 590819 / xxxx). Na prekvapenie tento trend sa však vôbec neujal, keď sme testovali početnosť jednotlivých dní narodenia v populácii, tak vôbec nekoreloval s množstvom takto zvolených čísiel. Iste, niekto by moho namietať, že dátum som si mohol voliť aj podľa výročia svadby alebo narodenín partnera/-ky, čo je tažk0 v dátach preukázať. Minimálne však čísla, ktoré začínajú letopočtami sú v medzi slovákmi výrazne pod priemerom.
Národ tajných agentov
Ak by sa početnosť tajných agentov hodnotila podľa tvaru ich telefónneho čísla, tak Slovensko je skutočná veľmoc na poli tajných služieb. Na 1000 slovákov totiž pripadá až 41 James Bondov, ktorí si do svojho mobilného čísla zakomponovali kombináciu “007”. (len pre ilustráciu je to asi 4x viac ako by bolo realitou, keby si ľudia vyberali čísla náhodne). Zaujímavé je, že hoci vo filme bolo viac Bond girls a len zopár predstaviteľov tajného agenta, na Slovensku láka tento špionážny jav pomerne podobné množsvo žien aj mužov. (Jamesom sa muži stávajú len o desatinu častejšie ako ženy M alebo Money Penny 🙂
Sme aj poverčiví
Napriek tomu, že chceme mať číslo čo najkrajšie, istej trojici sa vyhýbame. Diablovo číslo (666) chce mať v telefónnom čísle len niečo menej ako 0,09% ľudí. Obava z tejto démonickej kombinácie je zreteľná, aj keď sa pozrieme na to, ako jednotlivé trojice (111 až 888) sa často obajvujú na začiatku telefónneho čísla. Je zjavné, že kombinácia troch šestiek je najmenej početná a to napriek tomu, že číslo 6 samo o sebe je pri výbere mobilného čísla vo svojej podstate pomerne populárne medzi slovákmi:
[len pre vysvetlenie používanie kombinácii 000 a 999 bolo regulované operátormi, takže ich počty nezodpovedajú slobodnej voľbe, preto sú z prehľadu vynechané]
************** Tento článok je jedným z viac ako 50 blogov o tom, akú (občas aj zábavnú úlohu) môžu hrať dáta v našich životoch. Články sú občas zrejeňované na blogoch SME.SK alebo TREND.SK, ale väčšina nových článkov je publikovaná len tu na portáli Mocnedata.sk. Ak ak nechceš zmeškať niektorí z budúcich blogov využi bezplatnú registráciu do komunity MocneData. Registrovaní členovia komunity majú prístup aj k dodatočným článkom, videám a prezentáciam, ktoré sú dostupné len pre komunitu. Pre získanie všetkých výhod komunity stačí, keď necháte svoj email tu. ********
Tieto (trochu uletené) analýzy su vtipnou ukážkou analytického postupu, ktoré mu sa hovorí aj ANALÝZA METADÁT. V odborných kruhoch sa pojem metadát používa najmä pre označenie vedľajšej, nie nutne informačnej, hodnoty dát. Ide teda o takú vlastnosť dát, ktoré si nesú so sebou na pozadí. Napríklad meta dáta registračnej pokladnice nie sú to, aké položky si klient kúpil a koľko zaplatil, ale v ktorú hodinu sa v rámci kalendárneho dňa sa nákup uskutočnil, prípadne v akej krajine bola registrovaná platobná karta, ktorou klient zaplatil nákup.
Keďže cifry mobilného čísla by za normálnych okolností mali byť náhodne a nemali by sa za nimi skrývať nejaké dodatočné informácie, možno ich z hľadiska profilu klienta považovať za meta dáta (aj keď sa nájdu možno aj takí, čo sa budú o tento bod so mnou prieť ). Špeciálnej verzii METADÁT, ktorá je navyše užitočná pre analyzovanie správania, som dal názov Data underdogs (viac si o nich môžete prečítať v tomto staršom blogu). Meta dáta sú ďalšou z vetiev BORING DÁTA, o ktorých som písal pár blogov dozadu. Základnou podstatou analyzovania meta dát je porovnanie voči bežnému (náhodnemu) priebehu alebo výskytu. Totiž práve tam, kde sa meta dáta začnú príliš odchyľovať od bežného štatistického priebehu, začína rásť podozrenie na nejaký skrytý jav. Tak ako tomu bolo napríklad u Slovákov pri 007, či cifre 0 na začiatku čísla.
Ak sa vám článok páčil, alebo chcete niečo autorovi naopak (kľudne aj anonymne) vytknúť, pridajte svoj komentár tu.
Publikované dňa 26. 2. 2017.