Deep alebo Machine Learning – viete aký je medzi nimi rozdiel?

Artificial Intelligence, Strojové učenie, Učiace sa algoritmy. Média na nás strieľajú tieto výrazy zo všetkých strán. Občas sa preto zlejú do spoločnej guče aj pojmy, ktoré nie sú úplne synonymami. Tak sa stáva, že si ľudia zamieňajú aj pojmy Machine Learning a Deep Learning.  Viete aký je medzi nimi rozdiel ?

machine learning

Machine Learning

Pod týmto pojmom sú združené všetky metódy, ktoré automatizujú proces postupného učenia počítačov. Rečou bežných ľudí, počítače sa môžu sami naprogramovať na určité činnosti bez toho, že by do tohto procesu učenia zasahoval človek. V rámci machine learningu stroj zoberie dostupné dáta, sám si určí, ktoré su dôležité a odhadne z nich podľa akých pravidiel sa daný jav správa. Takýmto príkladom môže byť databáza podvodných platieb kreditnou kartou, z ktorej si počítač sám odvodí, že nie je s kostolným poriadkom, keď tá istá karta je použítá najprv v Číne a za pár minút na to v Prešove. Rovnako stroje sa z histórie poistných udalostí naučia, že dopravné nehody nahlásené v noci sú oveľa častejšie pokusom o poistný podvod ako havárky za bieleho dňa.

Hlavnou črtou Strojového učenia je teda to, že z jednotlivých opakovaní určitého javu alebo správania vzniká systém pravidiel (algoritmus). Tento systém pravidiel však nie je rozmar programátorov, ako si autisticky pokecať s milovanými integrovanými obvodmi. Väčšina machine learning algoritmov vzniká s cieľom, že budú použité na odhad výsledku budúcich (či práve prebiehajúcich) opakovaní toho javu, z dát ktorého model vznikol. Teda ak poisťovňa vytvorí model na popísanie podozrivých poistných udalostí, robí tak kvôli tomu, aby vedela odhadnúť, na ktoré poistné udalosti sa pri preverovaní podvodov (v budúcnosti) zamerať.

Ukážka použitia Machine learningu    [predikcia príjmu klienta]

——————————————————————–

deep learning

Deep Learning

Čisto z akademického hľadiska je Deep learning jednou z vetiev Machine Learningu. Ale pozornému citateľovi hneď nanapadne, že keď sa na niečo používa samostatný pojem, bude tam asi nejaká podstatná odlišnosť. Inak by sme predsa mohli mať len citrusové plody a nepotrebovali zvlášť pomaranče a citróny. Nuž Deep learning má predsa jednu podstatnú a zásadnú odlišnosť. Na rozdiel od ostatných foriem Machine Learningu, Deep Learning na začiatku ani nevie, čo bude cieľom skúmania? Že vám to znie ako popis väčšiny vašich firemných porád (kde tiež nie je jasné, čo je vlastne cieľom) ? Tak vedzte, že Deep Learning (na rozdiel od tých porád) sa s tým poľahky vysporiada.

Proces Deep learningu prebieha tak, že počítač si všíma vnútorné odlišnosti a sám si vytvorí hypotézy, čo by mohli byť pravidlá a tieto hypotézy si sám aj potvrdí alebo vyvráti. Väčšine ostatných machine learningových modelov musí človek povedať, ktoré sú tie žiaduce prípady (napr. korektné poistné udalosti) a ktoré napoak nežiaduce (poistné podvody). Machine learning si potom odvodí pravidla na rozlišovanie zlých od dobrých a dokáže predpovedať, ktoré budú podozrivo nežiaduce. Deep learning postupuje podobne, ale navyše ani nevie na začiastku, ktoré sú tie dobré a zlé. On si ich sám najprv zoskupí podľa podobných črtov a vytvorí si skupiny dobrých a zlých. Deep learning algoritmy síce nevedia povedať, akí presne sú tí zlí, ale vedia, že sú iní ako dobrí.

Poďme si to priblížiť na príklade: Predstavte si, že počítaču dodáte niekoľko miliónov fotiek. On si ich postupne zanalyzuje, rozloží si ich na miniaturné dátové farebné plôšky a postupne sa naučí rozoznať, ako vyzerá mačka. On síce nevie, že je to mačka ani by to nevedel pomenovať, ale viem, že ten istý typ objektu X sa na obrázku nachádza. Nakonci cvičenia by Deep Learning algoritmus vedel povedať, či na fotke je objekt X (mačka) alebo nie a vytriediť fotky (aj tie, ktoré počas učenia nevidel), na ktorý sa mačka nachádza. Len zdôrazňujem, že môže ísť o mačky rozličných farieb a mačacích rás, Deep Learning algoritmus dokáže vytvoriť schématický model mačky podľa tvaru/obrysu bez ohľadu na konkrétnosti mačiek. V biznise samozrejme je potrebné z Deep Learningu vyťažiť podstatnejšie postrehy než, či na fotke Vášho biznis partnera je aj mačka a tak sa deep learning používa hlavne na strojové analyzovanie ľudských prejavov (analýza hlasu v telefóne, videa pohybu klienta po predajni alebo neverbálnej komunikácie klienta pri komunikácii s obsluhou). Deep Learning algoritmy sú teda omnoho viac “wow”, ale aj podstatne ťažšie na vývoj.

Ukážka použitia deep learningu  [falšovanie písma]

——————————————————————–

Nech už budete vo svojej praxi potrebovať počítač naučiť nejaký Machine Learning model alebo priam Deep Learning model, pamätajte, že nie je dôležitá eleganciamodelu alebo exorickosť parametrov, ale skôr to, ako dobre dokáže predikovať skúmaný jav. Obávam sa, že vstupujeme do doby, keď nadobudne platnosť jemne parafrázované heslo minulosti: “S Machine Learningom na veky vekov a nikdy inak.” Tak teda Vašej analytickej práci česť!

——————————————————————–

Cieľom portálu Mocné dáta je okrem sprostredkovania CRM trendov & noviniek, byť aj studňou inšpirácie a rozšírenia poznatkov. K tomu smeruje aj séria blogov [AKO NA TO], ktorá je vám k dispozícii. Ak chceš dostať avízo na ďalšie blogy o postupoch CRM a dataminingu, zaregistruj sa do bezplatnej komunity stálych čitateľov Mocné dáta. Odmenou Ti budú aj prezentácie a detailnejšie návody, ku ktorým majú prístup len stáli čitatelia.

 

Prehľad iných CRM blogov autora


Publikované dňa 14. 12. 2016.