Koľko ľudí NAOZAJ prišlo na protikorupčnú demonštráciu?

Začiatkom tohto týždňa otriasla spoločnosťou iniciatíva mladých ľudí, ktorí zorganizovali pochod proti korupcii. Pomerne nepochopiteľne sa aj na strane podporovateľov tejto myšlienky strhla diskusia o tom, koľko ľudí sa ho vlastne zúčastnilo, A tak SME krájali fotky na štvorčeky a počítali ľudí … Koľko ich však prišlo NAOZAJ?

PROTEST_fotka

Panebože, prečo?

Vo svojej práci sa pravidelne potýkam s tým, že kým západné krajiny uvažujú ako použiť dáta a elektronické systémy ako prvú voľbu pri riešení problémov, u nás sa spoliehame na brute-force riešenia (teda hrubú silu). Za tie roky, čo sa s týmto frustrujúcim fenoménom potýkam som mal časť rozmýšľať: PREČO u nás siahame po manuálnych riešeniach ako po porvej voľbe?

F0rovo povedan0, za prvú časť dôvodov nemôžeme úplne sami. Totiž veľkosť našej krajiny (či trhu) spôsobuje, že hruba silamanuálny proces je ešte považovaný za schodné riešenie. Reprezentatívna vzorka SR populácie má menej ako 1500 ľudí a to si veľa ľudí vie predstaviť, že sa dá porátať ešte papierom a ceruzou. Áno, chce to veľa čiarok a zopár opakovaných prepočítaní, ale v princípe sa to ešte dá. Keby sme žili v krajine, kde základom pre výpočet nie je 5 mil, ale 100 mil, tam už je v rádoch, ktoré nikoho nenapadne rátať ručne. (Preto napríklad jedno z prvých použití počítačov bolo pre americké sčítanie obyvateľstva).

Druhou skupinou dôvodov, prečo sa u nás darí manuálnym procesom je, že máme buď žiadnu alebo len povrchnú znalosť o pokročilých metodách spracovania dát. Na západe už sa bežne aplikujú sofistikované metódy analýzy zvuku, obazu, videa. U nás stále manažéri požadujú, aby ste im to “vysypali” do excelu, že oni sa na to pozrú. Pri tom, na väčšinu zložitých algoritmov už existujú ZADARMO programy na webe. Prečo teda nepoužívame tieto možnosti? V komunite mocnedata.sk je ak niekoľko ľudí, ktorí už podobne sofistikované tooly používajú, tých prosím, aby sa nad ďalšiu vetu povzniesli: Lebo väčsina z nás je lenivých si ich vyhľadať. Proste západne dianie v oblasti práce s dátami vospolok IGNORUJEME.

Čo napočítalo SME?

Málokedy sa naskytne v bežnom živote tak flagrantná ilustrácia vyššie uvedených princípov, ako sa tomu stalo v prípade utorňajšej demonštrácie v Bratislave. Je to učebnicový príklad toho, ako hrubá sila nahradila úvahu. Aby sme sa však postúpili od príčin k samotným dôsledkom, poďme si povedať genézu tohto problému: Utorňajšej demoštrácie sa zúčastnil prekapivo veľký počet ľudí a tak sa okamžite rozprúdila diskusia o tom, koľko presne ich bolo. Ako sa nakoniec ukázalo, zvolená “hrubá sila” bola v skutočnosti pomerne “tenká”. Denník SME sa dopočítal k 5500 (už samotné okrúhle číslo vzbudzuje dojem, že sa veľa zaokrúhľovalo pri počítaní). Mestskí policajti prišli s ešte “preciznejším” odhadom 5000. Ich “zelení” kolegovi odhadli účasť na 8 – 9 tisíc. Denník N sa ujal trochu systematickejším spôsobom tejto úlohy a napočítal 7070. Aj u tohto prístupu však bol trochu chvat na škodu. Na fotke, z ktorej vychádzali, je dav useknutý, a tak je zjavné, že aj tento odhad v skutočnosti “podstrelil” realitu. Pomocou jednej metód, nižšie uvedených v tomto blogu, sa dopočítate niekde k číslu 8 349. Obsesia nad samotnými číslami však len odpútava pozornosť nesprávnym smerom. Skutočným problémom je, že vôbec existuje polemika o tom koľko, nie ani tak samotné číslo. Zvyšok tohto blogu by som teda venujem tomu, ako vyriešiť túto situáciu inak ako hrubou silou.

Plytké zamyslenie nad Hlbkovým učením

V oblasti dátovej analytiky existuje sada Deep Learning (hlbkové učenie) algoritmov, ktoré dokážu rozpoznať objekty na fotke a následne ich spočítať. A dokážu to urobiť bez akejkoľvek pomoci človeka. Ak nie ste v tejto oblasti úplne doma, tu je jeden z mojich článkov, ktorý
počítanie davu z fotografievysvetľuje podstatu. Ak by ste počítali ľudí podľa tváre alebo dáždnikov, je tu možnosť ešte zadefinovať počítaču, určitý fragment (napríklad ľudskú hlavu) a stroj dokáže pomocou Machine Learningu vytvoriť klasifikátor. Ten následne dokáže tiež spočítať počet výskytov takýchto fragmentov (farebných machúľ) na fotografii. To je postup, ktorý (podľa všetkého) použili zrejme aj v Denníku N. Pri tom naozaj smutné na tom celom je, že nástroje na takúto analýzu fotky sú dostupné voľne na webe (napr. TU alebo aj TU). Ak sa teda média nechcú blamovať a chcú profesionálne informovať o počte demonštranov, majú dve možnosti: Buď siahnu po niektorom zo spoľahlivejších samopočítacích riešení (viď ďalej v blogu) ALEBO naozaj aspoň trochu rozšíria svoje obzory pomocou googlu. Páni, určite však nie vytiahnuť fixku na väčší formát fotografie, …

Profesionálni počítači davov

Ak si dáte dva kroky späť, tak v skutočnosti existujú aj oveľa spoľahlivejšie riešenia, ako určiť počet ľudí na danom mieste, ako počítať ich z fotky. Každý demonštrujúci na tomto pochode mal nepochybne pri sebe mobil. Mobilný telefón je neustále aktívne spojený s tak zvanými BTS stanicami (laicky povedané s vykrývacími vysielačmi). Mobilný operátor teda vie pomerne presne, koľkotriangulacia signalu “ovečiek” sa mu v daný moment nachádzalo v dosahu signálu jednotlivých BTS staníc. Keďže mobil sa paralelne (kvôli stabilite hovoru a dátoveho prenosu) prihlasuje do viacerých BTS staníc súčasne, ich trianguláciou sa dajú spoľahlivo odlíšiť ľudia, ktorí idú okolo autom od tých, čo stáli na námestí aspoň 30 min nepretržite. Na Slovensku už exisutujú služby ako MarketLocator.sk, ktoré agregujú tieto údaje za všetkých operátorov. Poskytovatelia tejto služby by tak mohli byť profesionálni skrutátori, teda “počítači davu“. Som zvedavý, či chalanov z MarketLocatoru to vyprovokuje ešte k nejakej účasti na tejto “koľko tam bolo ľudí” diskusii.

Organizátori, nenechajte to na náhodu

Tou najpodstatnejšou poznámkou v tejto diskusii však je fakt, že zbytočnému bagatelizovaniu zhromaždenia mohli predísť aj samotní organizátori. Ak chcem, aby bolo zrejmé, aká veľká masa občanov na námestí prehovorila, ako organizátor by som mal medzi svoje povinnosti zahrnúť nielen povolenie od mesta či pozvanie hudobných hostí na tribúnu. Ale aj nástroj pre echo z akcie do digitálneho svetu. Veď skutočný efekt demoštrácie je v jej mediálnom ohlase, nik z vlády si nepríde vypočuť na SNP, čo im chce dav povedať. Jedna vec je teda zvolať akciu cez Facebook (pasívna podpora, ktorá sa dá neskôr spochybňovať) a druhá preukázať, že 10 000 ľudí skandovalo “Do basy” pre niektorého z politikov.

iBeacons-usageTechnologických možností sa nechať dav “samospočítať sa” je už dnes mnoho. Od špeciálnej Appky pre danú akciu, cez Wifi hot-spoty, ktoré spočítajú počet telefónov v dosahu, až po iBeacony, či iné technologie rozoznávajúce blízkosť mobilného telefónu. Ak sa niektorí nadšenci pre budúce opakovania pochodov rozhodnú vytvoriť takýto samopočítací nástroj, je potrebné ale dobre vymyslieť, ako oddeliť solidaritu s podujatím na diaľku (napr. like na facebooku, alebo stiahnutie Appky), od prítomnosti na mieste (fyzický sken MAC adresy, UID alebo iného jednoznačného ID používateľa).

Keby zhromaždenie organizovala Jednota dôchodcov, asi by bolo nemiestne od nich očakávať, že vytvoria mobilnú Appku, wifi hot-spot alebo niektorý z iných identifikátorov. Ale pri aktivite mladých ľudí to nie je horibilná požiadavka. Veď keby len organizátori vyzvali prítomných, aby do 2 min poslali SMS na určité číslo, odhad účastníkov by bol presnejší ako pokrájané-SME-fotky. Možno ste postrehli, že prezident Kiska vyhlásil hackathon súťaž na aplikácie proti extrémizmu. Čo keby niekto z mladých ako ročníkovú prácu alebo hobby vytvoril konečne rozumnú apppku na samospočítanie davu ? Schválne prijme niekto túto výzvu? TUKE, FIIT STU, anybody?

machinelearning_3b

Do momentu, kým sa tak stane budeme musieť asi strpieť “fixkové pokusy” ako náhradu. Skúste sa však všetci zamyslieť nad procesmi okolo seba. Naozaj sa nedá oprieť o nejaké už zozbierané údaje alebo požadať dav aby nám ich crowd-sourcol? Alebo je to len naša lenivosť rozhliadnuť sa, spojená s tým, že žijeme v krajine, kde 1100 je veľkosť reprezentatívnej vzorky populácie?

—- Ak vás zaujal tento článok alebo ste fanúšikom práce s dátami, pridajte sa do našej bezplatnej MocneData komunity. Členovia komunity majú prístup k prezentáciám a zamknutým, neverejným blogom. Členom sa môžete stať za necelú minútu TU. —-

Riešenia 6. kola CRM hádaniek

Tento blog sumarizuje riešenia 6. súťažného kola CRM hádaniek. Ak si chcete ešte pred samotnými riešeniami pripomenúť zadania úloh, najdete ich TU.

Spoločný komentár k úloham 6.kola

Neviem, či to bolo ukážkovým príkladom alebo tým, že úlohy z mobilného operátora si väčšina ľudí vie lepšie predstaviť. V každom prípade 6. kolo zaznamenalo vyššiu účasť, ale hlavne rapídne stúpla kvalita riešení. (top 5 riešení malo rozostup len 13% z celkového počtu bodov, čo značí, že konkurencia sa pritvrdzuje) Mám z toho rozhodne radosť a to najmä preto, lebo pridali sa noví riešitelia a niektorí to hneď na prvý krát dotiahli “na bedňu”. Tak budem tŕpnuť pri zadávaní blížiaceho sa 7. kola, aby sa nám tento krehký trend potvrdil aj do budúcna.

Pri hodnotení riešení sa snažím simulovať, ako by dané úlohy uspeli priamo v nasadení do praxe. Plný počet bodov tak môže získať iba riešenie, ktoré pamätá na možné nástrahy, kedy daný postup aj nefunguje, nielen menuje aspekty, ktoré fungujú. Často sa tak stretávam s geniálnymi nápadmi (zopár ich budem za chvíľu citovať), ktoré však sú nedomyslené do konca. Keďže úlohy majú zvyčajne niekoľko aspektov, ktoré sa hodnotia, geniálna myšlienka, ktorá získa plný počet bodov v jednej oblasti, potom vykrváca na ostatných kritériách. Obe víťazné riešenia úloh 6. kola, tak vyhrali riešenia, ktoré boli skôr domyslené než geniálne.

Pri posudzovaní kvality riešení som nebol brať do úvahy tie časti riešenia, ktoré sa odvolávali na iné zdroje dát (zadanie znelo, že z interných dát operátora), aj keď autorom uznávam, že v reálnom živote by sa zrejme operátori o vyťažovanie takýchto dát usilovali. Ale, ak by som uznal externé registre, to by niekto mohol povedať, že bude sledovať ľudí, čo pridali inzerát na predaj aktuálnej nehnuteľnosti alebo iné skratky. A to by súťaž potom stratila na čare. Rovnako chcem pripomenúť, že operátor síce môže mať súvisiace meta dáta o SMSke (od koho komu, kedy poslaná , …) ale nemôže vyťažovať text tej SMSky. Teda segment “splácajúci hypotéku” sa operátorovi bude ťažko identifikovať len z SMS notifikácii banky.

A teraz už ku konkrétnym riešeniam úloh:

Riešenia k Úlohe 6.2 – Vyber mi ideálne bývanie

Ak by som z najlepších riešiteľov mohol poskladať team (a oni by sa boli ochotní navzájom počúvať), tak ich spoločné riešenie by bolo brutálne efektívne. Získalo by 92 bodov zo 100b! To je šialene dobré číslo, vzhľadom na to, že to ľudia riešia vo voľnom čase a “len za nezávažnú” 20 EUR odmenu. Pri úlohe bolo potrebné pokryť 5 oblastí, tak si ich poďme popísať detailnejšie:

1. oblasť: KTO Z KLIENTOV je vhodný kandidát na výber nehnuteľnosti

Väčšina z riešiteľov prišla z nápadmi, ako vyselektovať klientov hodných na kúpu novej nehnuteľnosti. Ústredný motív naprieč riešeniami hrala Bonita klienta, ktorú niektorí riešili len cez veľkosť (a skladbu) faktúr a niektorí cez typ telefónu, prípadne frekvenciu jeho zmeny. Niektorí správne pochopili, že bonitný 22 ročný študent ešte bývanie zrejme nehľadá, rovnako ako bonitný 70tnik tiež nie. Už menej z vás napadlo overiť si, či náhodou daný klient už nehnuteľnosť nehľadá (emaily od maklérov, browsovanie realitných portálov, či priam stránok realitných projektov).

Kameňom úrazu, ako už po niekoľký krát v CRM hádankach, sa stalo negatívne vymedzene. Teda pomenovanie skupín, ktoré určite neosloviť. Úmyselne som ho neuviedol v príklade 6.1 s dovolenkou (čo mi Hulo natrel vo svojom riešení :), aby som otestoval, koľkí z riešiteľov budú na to pamätať. Nemôžem len opäť zdôrazniť, že vylúčenie beznádejných prípadov je proste kľúčové a netreba naň zbúdať. Pre zisk plného počtu bolo treba pamätať, že niektorí sa možno nedávno sťahovali (zmena doručovacej adresy, inštalácia nového fixného internetu, …). Rovnako asi nedáva zmysel oslovovať tých, čo sú u vás sami neplatiči, prípadne ešte len študujú (pohyb po VŠ kampuse, …). Pre mňa osobne by boli out aj cudznici, či klienti, ktorí majú len predplatenú kartu s nízkym trafficom, prípadne tí, čo platia účet za mobil cez poštovú poukážku.

Najlepšie riešenie v tejto časti nakoniec predviedol HULO.

2. oblasť: AKÝ DRUH NEHNUTEĽNOSTI odporúčiť klientovi

Bol som príjemne prekvapený, že takmer každé riešenie obsahovalo úvahu o tom, aký je rodinný stav klienta a teda aké bývanie je viac či menej vhodné pre daný typ rodiny. Pomerne dosť ľudí sa pokúšalo odhadnúť vhodný druh nehnuteľnosti napríklad pomocou životného štýlu, či záujmov klientov (kutil, záhradka, …). Objavili sa snahy použiť na vhodnosť nehnuteľnosti typ práce (manuálna/duševná). Už menej ľudí si uvedomilo, že korešpondečná a prespávacia adresa vám povie pomerne presne, v akom bývaní teraz býva (operátori, ktorí poskytujú aj fixný internet majú pre každý adresný bod aj info o tom, čo za typ nehnuteľnosti na danej adrese stojí). Zaujímavé pokusy boli aj odhady pomocou vlastníctva auta, či naopak heavy MHD usage.

Najlepšie riešeni za 2. oblasť bolo z dielne Daniely K., ktorá vytvorila zaujímavý princíp (z rodiny a záujmov odhadnem, čo je pre Teba optimálna nehnuteľnosť a potom porovnám, ako ďaleko je tá tvoja aktuálna od tej optimálnej). Tento druh targetingu by bol v praxi zrejme veľmi presný, takže klobúk dole Daniela.

3. oblasť: KDE/V AKEJ LOKALITE danú nehnuteľnosť ponúknuť 

Keď už vieme, aký typ nehnuteľnosti a komu ideme ponúkať, je potrebné ešte určiť GEO zónu, kde takú nehnuteľnosť je najvhodnejšie zobraziť. V tejto sekcii mala väčšina riešiteľov jasno a výkony boli pomerne vyrovnané. Väčšina riešení sa opierala o denný a nočný režim klienta, vypočítanie niečoho ako DistanceToWork a DistanceToFriends_Family. Tie najkvalitnejšie riešenia však brali ohľad aj na blízkosť občianskej vybavenosti, prípadne priemerný čas dochádzania teraz a z novej lokality.

Najprecíznejšie riešenie tejto časti problému priniesol Fero B., ktorý okrem všetkého vyššie uvedeného doplnil ešte aj dva silné faktory (o jednom v 5. oblasti výnimočných doplnení nižšie, v tom druhom prípade išlo o monitoring miery pohybu klienta v danom meste/okrese, ktorý určuje prirodzený rádius pre klienta).

4. oblasť: Match medzi vhodnosťou bývania a možnosťami/preferenciami klienta

Nie až tak veľa riešiteľov si uvedomilo, že vyššie uvedené 3 oblasti môžu vygeneroavť desiatky až stovky nehnuteľností, ktoré spĺňajú všetky podmienky. Ako potom klientovi vybrať tú optimálnu v praxi? Riešiteľ si teda musí urobiť nejaký ranking pre každého klienta, podľa ktorého ponúkne tu najlepšiu možnosť z možných. Tí, ktorí sa o takýto match pokúšali, väčšinou sa snažili optimalizovať čas ranného dochádzania (občas bez toho, že by vedeli, či je to problém alebo nie), prípadne minimalizovať vzdialenosť od rodiny (spomeňte si ako blízko by k svojej matke chcel bývať Howar Wollowitz z Big Bang theory :).

Spoľahlivejšia cesta zrejme vedie cez match okolia na záujmy klienta (športové príležitosti, potreby danej rodiny, …) . Silnou ideou v riešení bol aj návrh, ktorý sa snažil optimalizovať výber lokality podľa dostupnosti parkovania pre tých s autami. Celkovo najkomplexnejšie túto oblasť zvládlo riešenia Kevina R.

5. oblasť: Osobité faktory riešenia, konkurečná výhoda oproti iným riešeniam

Jednu oblasť hodnotenia som si rezervoval pre príznaky, ktoré sú out-of-box a zásadne (zlepšujú a) odlišujú riešenie od ostatných. A o drahokamy naozaj nebola núdza. Pred niektorými som sňal pomyselný klobúk z hlavy, veď posúďte sami:

  • Odhaliť ľudí, ktorí nakupujú nehnuteľnosti na investíciu a teda môžu vlastniť (a prenajímať) viac nehnuteľnosti a stále mať záujem kupovať ďalšie
  • Kde daný klient vyrastal (je silný predpoklad, pre prefrenciu podobného set-upu aj pre svoju budúcu rodinu), z porovnania sídla rodičov
  • Kedy ráno vstáva (prvá aktivita mobilu)
  • Rodina identifikovaná podľa prvých SMS, callov na Nový rok
  • Sám volal maklérskym firmám, prípadne od nich má správy v emaile
  • Emaily od portálov, ktoré porovnávajú nehnuteľnosti
  • Ako často si volá taxík.
  • Čo robí v piatok večer ?
  • Ide o extroverta alebo introverta (ako bude znášať oblasti, kde je vysoká, nízka koncentrácia ľudí)
  • Kde máte ako operátor naťahanú optiku pre Tripple play, aby ste ho vedeli udržať ako klienta (je fakt, že väčšina operátorv by vás neposlala niekam, kde nemá pokrytie signálom, či prípojkami na internet)
  • Pre ľudí cestujúcich MHD, vzdialenosť od linky, ktorú bude potrebovať na presun do práce ráno

Najsilnejší drive na tieto zaujímavé doplnkové kritéria mal Martin G.

Po súčte bodov za jednotlivé oblasti ako celkoví najlepší riešitelia vyšli:

  1. miesto = Juraj B.
  2. miesto = Martin G.
  3. miesto = Matúš B.

ktorým týmto gratulujem k stupňu víťazov aj k darčeku od mocnedata.sk v podobe 20 EUR poukážky do martinusu.sk (úspešných riešiteľov budem kontaktovať emailom aj s náležitosťami k ich výhre)

 

massage

Riešenia k Úlohe 6.3 – ktorého z klientov by potešil poukaz na masáž?

Prví traja riešitelia mali každý iný počet bodov celkovo, takže nebolo potrebné použiť túto 3. úlohu ako rozstrelovú otázku. Poďme si však povdať aspoň jej riešenie. Mnohí riešitelia rozbehnutí (a možno aj vyčerpaní) z druhej úlohy sa snažili zvoliť pre tretiu úlohu analogické postupy: Definovať cieľovú skupinu a potom ju spresňovať ďalšími a ďalšími drobnými príznakmi. Z týchto tradičných riešiteľov boli najbližšie optimálnemu riešeniu Hulo alebo Fero B. Riešili Geo vzdialenosť klienta od poskytovateľa masáži, jeho záujem o zľavomaty, potrebu masáže cez šport alebo zdravotné problémy.

Úloha sa však dala uchopiť aj oveľa netradičnejšie. Všetci riešitelia svorne prehliadli v zadaní, že dané kupóny už využívané internými zamestnancami. Teda jedným z prístupov mohlo byť napríklad vyrobiť pravdepodobnostný model, na základe ktorého sa vhodné (vékové, …) skupiny označia podľa reálného dopytu medzi zamestnancami počas roku. Čiatočne sa tou cestou vybralo jedno z navrhnutých riešení Matúša B., ktorý povedal, nech obetujeme časť kupónov na náhodne rozdelenie medzi reprezentatívnú vzorku populácie a následne z tohto testu zacielime najsnubnejšie skupiny.

Ako zásadné sa opäť ukázalo negatívne vymedzenie, keď väčšine riešiteľov by nevadilo poslať poukaz priamo masérom živnostníkom alebo ľuďom po 65ke či pred 20kou. Proste správne odrezať beznádejne prípady je pekelne dôležité. Istá polemika sa viedla aj o tom, či tí, čo majú maséra (aktívne k nemu chodia) sú vhodní alebo nie pre tento druh benefitu. Ja skôr prikláňam na stranu, že NIE, ale úplne černobiele to zas nie je.

Našli sa aj ojedinelé prístupy, ktoré chceli použiť daný objem kupónov naozaj obchodne a dať im potenciálne nespokojným klientom, či bloggerom a influencerom, kvôli PR. Celkovo najsympatickejším riešením tejto doplnkovej úlohy bolo asi riešenie od Kristíny K.

Ďakujem všetkým riešiteľom zapojenie sa do 6.kola CRM rébusov! Ak ste nažhavení na ďalšie úlohy, tak kým príde 7.kolo, môžete sa držať v tempe riešením niektorej zo starších CRM úloh:

Zadanie 5. kola (+ jeho riešenia),

Zadanie 4.kola (+ jeho riešenia)

úlohy a riešenia 3.kola, 2.kola alebo 1.kola CRM hádaniek.

Zopár rád, ak vás čaká Segmentácia klientov

Tento blog je primárne určený pre účastníkov Biznis Analytika 2017  konferencie, ktorí si vďaka heslu z konferencie môžu tu priamo stiahnuť aj samotnú prezentáciu, ktorú som 29.3.2017 na tejto konferencii odprezentoval. Keďže vstup na konferenciu bol platený, pre zvyšných čitateľov Mocnedata.sk – po dohode s organizátorom – prinášam aspoň jej zjednodušený prepis.

Hoci segmentácie klientov naberajú postupne na popularite medzi slovenskými biznismi, stále väčšina podnikov funguje na bežnom produktovom princípe, ktorý pristupuje ku všetkým klientom v podstate rovnako. Zrealizovať kvalitnú segmentáciu totiž vôbec nie je jednoduché. V skutočnosti sa väčšina pokusov o segmentáciu končí niečím, čo vlastne plnohodnotnou segmentáciou ani nie je. Zopár nasledovných odsekov by som preto rád venoval tomu, aby ten váš segmentačný projekt mal lepšie vyhliadky na úspech.

Ešte než sa pustíme od popisu samotnej segmentácie musíme si najprvť ujasniť, čo je a čo naopak nie je segmentáciou. V slovenčine sa, trochu neštastne, totiž slovo segment používa pre akékoľvek rozdelenie klientov do menších skupín. Na to, aby však rozdelenie mohlo byť segmentáciou, musí spĺňať nasledovnú definíciu:

Segmentácia je rozdelenie celého portfólia klientov do ucelených podskupín s tým, že klienti v tej istej podskupine (segmente)

vykazujú rovnaké vlastnosti, preferencie alebo rovnaké správanie, a to všetko vo vzťahu k vašej hlavnej službe alebo tovaru.

Pri tom dôležitá je práve posledná časť vety. Veľa segmentácií rozdelí klientov do skupín, podľa spoločných vlastností, ale takých, ktoré nemajú žiadeň vzťah k produktu. Vznikajú tak segmenty ako “mestká populácia”, či “seniori” aj pre predaj zmrzliny, či panvíc. Je preto nevyhnutné, keď budete segmentáciu zostavovať, aby bola jej podstata prepojená na niektorú z vašich obchodných priorít (napr. väčší predaj produktov) a klienti boli zgrupení do skupín, ktoré sú podobné práve vo vzťahu k danému cielu (napr. rovnaká motivácia nakupovať vaše produkty).

Okrem uvedeného prepojenia na cieľ je nutné, aby segmentácia spĺňala ešte niekoľko ďalších podmienok. Ich stručný prehľad prípajam v tejto grafike:

SEGMENTATION_one

A ktorú segmentáciu to vlastne chcete?

To, čo väčšinu ľudí najviac zarazí, keď sa prvý krat bavíme o segmentácii, je, že segmentácie je viac druhov. Áno, väčšina ľudí si myslí, že segmentácia je ako teória relativity, proste iba jedna. Nuž rovnako ako s tou teóriou relativity, aj s tou segmentáciou je to v skutočnosti trochu inak. V súčasnom biznise sa najčastejšie využíva až 5 rôznych typov segmentácie klientov. Vysvetliť ich jednu po druhej by zabralo niekoľko strán textu. Preto bude jednoduchšie, keď opäť nechám prehovoriť radšej priamo nasledovné infografiky:

Segmetácia podľa hodnoty

SEGMENTATION_typ_1

Segmentácia RFM modelom

SEGMENTATION_typ_3Deskriptívna segmentácia

SEGMENTATION_typ_2

Behaviorálna segmentácia

SEGMENTATION_typ_4

Nominačná segmentácia

SEGMENTATION_typ_5

Po odprezentovaní jednotlivých typov často dostávam otázku: “Dobre, ale ktorá sa hodí pre odvetvie, v ktorom podnikáme?” Čo znie ako jednoduchá otázka v skutočnosti nie je úplne ľahké poradiť. Ak vám však ani po treťom prečítani (áno, kľudne sa vráťte hore a skúste znova) žiadna nevyskočila ako jasná voľba, poradím aspoň mechanizmus, ktorým sa dá vylučovaciou metódou prísť k najpragmatickejšiemu rozhodnutiu pre Vašu firmu:

1] Máte priestor na to vytvoriť aspoň 5-6 členný team Segment manažérov po implementovaní segmentácia? Ak NIE, štrtnite si Nominačnú segmentáciu, lebo na jej riadenie v prevádzke je to minimálny počet ľudí, ktorých budete potrebovať. Pokračujte bodom 2.

2] Máte interne vo firme niekoho, kto dokáže pracovať s SQLkom alebo sofistikovanejšímí dátovými analýzami? Ak je odpoveď NIE škrtnite si zo zoznamu Behaviorálnu analýzu. Pokračujte na bod 3.

3] Je možné vo vašom odvetví, aby klient sám proaktívne zvyšoval svoj prínos pre firmu? (napr. spontánne kupujem viac alebo drahšie produkty) Ak je odpoveď NIE, škrtnite si možnosť Hodnotovej segmentácie aj RFM Segmentácie, lebo ju nebude môcť aplikovať, a pokračujte na bod 4. Ak je odpoveď ÁNO, pokračujte na bod 5.

4] Ak ste odpovedali na niektorú z otázok 1 a 2 ÁNO, vyberte si tú, ktorá sa pri danej možnosti škrtala. Ak ste obpovedali na obe otázky 1 a 2 áno, vyberte si Nominačnú, ak máte veľa (rozumej 100+) rozličných druhov tovarov v ponuke. Ak máte menej tovarov vyberte si Behaviorálnu. Ak ste záporne odpovedali na otázky 1 až 3, vašou jedinou voľbou bude Deskriptívna segmentácia.

5] Ak nie ste v časovej núdzi vyberte si ten v poradí Nominačná, Behaviorálna, Hodnotová (ak máte aj po zodpovedaní prvých dvoch otázok stále tieto možnosti k dispozícii). Ak nemáte viac ako 2 mesiace na vytvorenie a implementovanie segmentácie, zvoľte si jednu z nasledovného poradia: Deskriptívna, RFM model, Hodnotová pričom platí pravidlo, že čím menej času máte tým viac vás to v tejto trojici posúva doprava.

Ak máte napriek tomuto jednoduchému algoritmu stále pochybnosti, čo by bola tá pravá voľba pre vás, neváhajte mi napísať na info@mocnedata.sk a popíšte svoju situáciu, rád Vám z  s výberom zdarma poradím.

Ešte jednu dôležitú poznámku, ktorá z infografík jednotlivých typov nemusí byť zrejmá. Prvé 4 typy segmentácie (Hodnotová, RFM, Deskriptívna a Behaviorálna) majú vlastnosť, ktorej sa v matematike hovorí “disjunktná”. V praxi to znamená, že každý klient pripadne práve do jedného segmentu (nemôže byť súčasťou viacerých segmentov naraz) a každý klient zároveň má nejaký segment priradený. Nominačná segmentácia je v tomto ohľade výnimkou. Pri tomto druhu segmentácie sa rôzne segmenty môžu aj prekrývať a teda môžu (a budú) nastávať situácie keď klient bude patriť do 2 alebo viacerých segmentov súčasne. (napr. ak sú zadefinované segmenty MUŽ 30-40 a Vlastníci psa, ja napríklad bude spadať do oboch segmentov súčasne). Dôležité je vedieť, že to nie je nejaký nedostatok tejto segmentácie, ale jedna z jej vlastností, a Nominačná segmentácia sa dokáže s týmito prekryvmi vysporiadať. Ale o tom asi až niekedy inokedy.

Ok, tak máme vybraný typ. Čo teraz?

Výber typu segmentácie je len prvým zo 6 krokov segmentačného projektu. Samotný proces zavedenia segmentácie je podstatne dlhší. Detailný popis priebehu segmentácie by zabral dokument o rozsah samostatného blogu, takže sa k nemu môžeme vrátiť niekedy v samostatnom blogu v budúcnosti, ak o to bude z vašej strany patričný záujem. Ak vás však segmentácia úpenlivo tlačí v 2017 prioritách, prikladám aspoň základnú kostru projektu, ktorej by ste sa mali držať:

SEGMENTATION_two

Téme segmentácie som sa venoval v minulých blocoh už niekoľko krát. Preto, ak vám aj prečítani tohto aktuálneho, ostali ešte ďalšie otáznik, skúste si pozrieť môj úplne prvý blog k segmentácii a príklady nevhodných segmentácii, ktorým by ste sa mali vyvarovať.

Do momentu, kým na mocnedata.sk pribudne detailnejší blog k postupu, neváhajte sa obratiť s prosbou o radu na mňa na info@mocnedata.sk . Verím, že týchto zopár rád vám pomohlo sa zorientovať aspoň v tom, akú segmentáciu si vybrať a ako jej realizáciu štruktúrovať. Držím vám palce v segmentačnom úsilí!

 

[Ako na to] Meninové kampane

Špeciálne darčeky, či marketingové akcie, k sviatkom klientov sú štandardným arzenálom väčšiny spoločností pracujúcich s dátami svojich klientov. V obave “z konkurenčného boja” vám však málo kto je ochotný čokoľvek na túto tému povedať, či komentovať. Mocnedata.sk sa rozhodli toto mlčanie prelomiť. Prinášam preto listing skúseností a zistení, ktoré som na vlastnej koži odskúšal pri tomto type kampaní.

Oplatí sa to?

Prešiel som niekoľkými firmami, ktoré sa snažili obdarovať klientov k meninám, narodeninám, či dokonca výročiam prvého nákupu. Na otázku, ktorá manažment trápi ako prvá “Oplatí sa vôbec niečo také robiť?”, môžem preto zodpovedne odpovedať: “Ó áno, určite sa oplatí!” Netrúfam si povedať, či je to tým, že sme okolo narodenín mäkší, alebo nám lichotí, že si na nás niekto spomenul. V každom prípade, narodeniny, či meniny pôsobia na klientov ako oveľa lepší dôvod na kúpu než väčšina bežných kampaní. Môžem teda potvrdiť, že tento druh kampaní dosahuje 2,5 – 4 násobne lepšie výsledky ako sú bežné kampane od danej spoločnosti. Samozrejme veľkosť benefitu a adresnosť narodeninovej (či meninovej) ponuky v tom môže zohrať svoju úlohu (somarina na narodeniny je stále somarinou), ale opakovane sa mi potvrdilo, že tento druh ponuky na ľudí proste funguje.

OK, povedali, sme si, že sa to oplatí, ale je nejaký rozdiel medzi narodeninami a meninami? Na túto otázku môžem odpovedať len s určitou mierou presnosti, keďže niektoré typy vecí dáva zmysel darovať aj na narodeniny aj na meniny (napr. sladkosti, flaša vína, či drobná kozmetika), vo všeobecnosti však meniny majú v očiach Slovákov punc menej dôležitého sviatku ako narodeniny. Tým sa znižuje aj hranica “pre vhodný a uveriteľný” darček na meniny. V praxi to znamená, že ak predávate mobilné telefóny či televízor, tak klienti ešte sú schopní reagovať na zľavu na nový mobil k narodeninám. Ale k meninám im takýto darček príde už “divný”. Keď sme testovali meninové a narodeninové akcie s tým istým benefitom, javilo sa, že úspech meninových kampaní je o cca 15-20% nižší ako narodeninových kampaní s tým istým benefitom pre klienta. Tento jav zrejme súvisí aj s tým, že niektorí klienti meniny proste neoslavujú alebo im pripadajú ako príležitosť niekomu potriasť rukou, nie nutne niečo však niečo mu darovať. (pre dokreslenie: kampaňový manažér, s ktorým aktuálne riešim meninové kampane v jednej z firiem sám meniny neoslavuje 🙂 )

Čím sú špecifické meniny?

Okrem zdanlivo menšej významnosti v očiach klientov, majú narodeniny ešte jednu podstatnú odlišnosť: Sezónnosť. Ak si pozriete rozloženie narodenín Slovákov v rámci kalendárneho roka (a odmyslíte si 29.2.), tak je takmer konštantné (drobné odchýlky sú vysvetlené v doplnkovom blogu pre členov Mocnedata.sk komunity) :

NARODENINY_SR

V prípade menín je situácia diametrálne odlišná. Ak zoberiete dospelú populáciu SR (väčšina obchodníkov asi bude mať údaje o klientovi z registrácie do vernostného programu alebo z predošlého nákupu, oboje predpokladá väčšinou dospelého človeka), tak meniny celého SR majú v rámci kalendárneho roka veľmi odlišnú krivku:

MENINY_v_ROKU

Ako je už z grafu vidieť, tie najpopulárnejšie mená dosahujú až 20x vyššiu početnosť ako je priemer pripadajúci na jeden kalendárny deň. Keď si uvedomíte, že kalednárny mesiac má približne 30 dní, tak niektoré dni dokážu mať efekt takmer celého mesiaca. Vravíte si: “No a čo?” Nuž ono to má pomerne dôležité dôsledky…

Na čo si dať pozor pri meninových kampaniach

Poďme vyriešiť najprv tú najdôležitejšiu skutočnosť. Narodeniny musíme mať v niektorý z kalendárnych dní v roku všetci. Meniny však podľa slovenského kalendára nemusia mať všetci vaši klienti. O tom, koľkých klientov nepriamo vynecháte, ak chcete robiť meninové kampane, existuje mnoho mýtov. Rád by som ich tu a teraz nadobro rozptýlil. Z analýzy vzorky 1,5 milióna SR klientov, ktorá je reprezentatívna na vek a pohlavie SR populácie vyplýva, že meninovú zľavu nedostane približne 1.15% klientov. To je však pravda, iba ak okrem štandardných mien v kalendári pridáte aj menej používané mená (zväčša prinesené z iných kultúr). prehľad takýchto mien si môžete pozrieť napríklad tu. (special thanks pre M. Roupu, ktorý sa s touto ošemetnosťou pohral v našom kampaňovom module). Ak nepoužijete dodatočné mená a spoľahnete sa len na bežný kalendár, počítajte s tým, že meninovou akciou nebudete môcť potešiť cca 2,5-3% svojich klientov.

Ako bolo naznačené už v predchádzajúcej stati, meniny trpia výraznou sezónnosťou. Ten hlavný dôvod prečo by ste sa tým mali zaoberať pekne dokumentuje nasledovný graf:

MENINY_mesiace_SR

Jún, ako najsilnejší mesiac v roku, tvorí v objeme klientov, ktorí majú v danom mesiaci meniny až 3-násobok Mája alebo Októbra a to už nie je zanedbateľné! Ak napríklad plánujete do budgetu dať náklady na oslovenie klientov, tak 3 násobne vyššia hodnota v jednom mesiaci ako v inom mesiaci môže urobiť nemalý škrt cez rozpočet. Odbobný problém môže spôsobovať, keď máte naskladnený nejak konkrétny darček aleb oprodukt, ktorý v akcii ponúkate. V 5 z 12 mesiacov ho potrebujete citelne viac ako po iné mesiace.

Rovnako na rozdiel od narodeninových akcií, ktoré môžu prinášať relatívny stabilný obchodný výsledok v priebehu roka, Meninové kampane budú v takom Januári, či Máji citeľné slabšie. Toto je potrebné vedieť vopred, aby ste nemuseli pátrať po odpovedi, prečo po skvelom Marci ste mali tragický Apríl a Máj. Z toho plynie aj to, že ak chcete niekoho presvedčiť o zmysluplnosti Meninových kampaní, určite nezačnite niektorým zo slabších mesiacov. Absolútne prínosy kampane (počet predaných kusov) budú – aj pri konštatnej úspešnosti kampane- v niektorých mesiacoch citeľné slabšie.

Všetko vyššie uvedené musí prejsť ešte jedným podstatným filtrom: Skladba Vášho portfólia. Totiž pri narodeninách je veľmi ťažké namiešať nejakú skupinu, ktorá by mala výrazne odlišný priebeh v rámci roka v porovnaní s celou populáciou. Hipsteri sa proste rodia rovnako pravidelne ako dôchodcovia. V meninách však vychýlenie od slovenského priemeru už vôbec nie je nemysliteľné. Rôzne mená sú rozne populárne v dekádach (o tom viac v doplnkovom blogu) a tak stačí mať vašu cieľovú skupinu jemne mladšiu či staršiu ako je priemer SR a meninové schémy sa výrazne pohnú. Ešte jednoduchšie je rozkolísať reprezentatívnosť menín vo vašom portfóliu pomocou pohlavia. Ak váš produkt totiž šmakuje skôr jednému z pohlaví, vplyv meninových kampaní na Váš biznis v rámci roka sa opäť výrazne zmení. Práve preto …

Ako ste na tom vy?

… som pre Vás pripravil Meninový test. Ide o jednoduchú Excel aplikáciu, v ktorej si môžete otestovať, či Vaše portfólio je nejak vychýlené oproti bežnej slovenskej populácii. (tento test je benefitom pre členov komunity Mocnedata.sk . Ak nie si ešte členom komunity bezplatne sa ním ihneď môžeš stať tu. Heslá dorazia do 24 hod od registrácie)

Keďže krstné mená sú pomerne stabilným prediktorom vekovej a pohlavnej skladby klientov, túto aplikácii môžete zároveň použiť aj ako nepriamy analyzér svojho kmeňa klientov. Mala by vám prezradiť na akú podskupinu populácie sa vám podarilo najviac zaútočiť. Verím, že Vám táto drobná utilitka príde vhod.

 

Na záver mi už len zostáva vám popriať čo najviac úspechov v meninových kampaniach. Nech je Jún s Vami!