[IT Systems] Velká data nejsou pro každého

I s malými daty lze dělat velké věci.

V současnosti neuběhne den, kdybychom nečetli o velkých datech (Big data) ve velikosti terabytů nebo petabytů a nutnosti jejich každodenního využití ve firmách. Bavíme se o možnostech zpracovávat data ze senzorů, sociálních sítí, strojů, automobilů nebo kamer a mikrofonů, snímky z družic a podobně. K tomu přibývá potřebná role datových vědců, kteří nám velkými daty musí pomáhat a také nové třídy IT nástrojů pro sběr, analýzu a ukládání takových dat v reálném čase, které si na to musíme pořídit. Člověk postupně nabývá dojmu, že jen ve světě opravdu velkých dat je budoucnost a kdo je neanalyzuje, tak jako by nebyl. Reálně ale úspěšných příběhů spojených s velkými daty zase není tak mnoho a praxe ukazuje, že velká data nejsou pro každého.

Za úspěch totiž nelze brát jen to, že se někde implementuje technologie nebo vytváří big data infrastruktura a ověří se, že „to jde“. Ono to také „musí k něčemu být“. Zpracování velkých dat má své výhody, ale stejně jako u předchozích vln zájmu spojených s novými technologiemi se ukazuje, že big data nejsou všelék na řešení všech problémů firmy a hodí se jen na určité typy specifických úloh. Zejména v sektoru malých a středních firem se proto opět začíná mluvit o malých datech (small data) a o jejich využití pro rychlejší a akčnější analýzy. Malá data jsou data uložená v současných podnikových systémech, účetnictví a prodejních systémech. Definice pojmu je, ostatně stejně jako u velkých dat, zatím poněkud neustálená. Obecně se autoři shodují, že se jedná o data v takovém množství, ve kterém se může člověk sám a rychle vyznat. Může jít o data z eshopu nebo z historie jednání se zákazníky. Malá data nemusí být uzavřena jen v bublině podniku, mohou být obohacena i zdroji ze světa dat velkých prostřednictvím např. analýzy chování zákazníků na sociálních sítích apod, ale bez toho, aby pro takové analýzy vznikala specializované podniková datová infrastruktura. K tomuto účelu se v daném případě používají specializované cloudové služby.

Je to paradox, protože právě s nástupem velkých dat byla malá data odsunuta do pozadí zájmu, jako něco jednoduchého, vytěženého a nezajímavého. Ale není tomu tak. Velká většina „analytické“ hodnoty pro řízení firmy je uložena právě v datech malých, která jsou pro podnik klíčová, jen je potřeba je správně a rychle zpřístupnit. Právě s malými daty je potřeba při zavádění datové analytiky do firmy vždy začít, teprve potom je možné uvažovat o posunu k datům velkým. Za posledních několik let došlo v oblasti malých dat k velkým technologickým posunům. Dozrála celá řada nástrojů pro jejich analýzu, kterým říkáme self service business intelligence (SSBI) a které poskytují mnohem větší nezávislost těm, kdo malá data analyzují. Typickými reprezentanty této skupiny nástrojů je Power BI, Tableau nebo Qlik. Tyto nástroje jsou vytvořeny pro datovou analýzu, přičemž na malých datech fungují perfektně a kvalitativně svými výsledky převyšují analýzy v Excelu nebo jiných tabulkových procesorech. Nasazení těchto nástrojů na malá data je rychlé a výsledky – pokud jsou jejich uživatelé alespoň minimálně datově gramotní a data v pořádku a bez vstupních chyb – jsou vidět okamžitě. Dalším výrazným faktorem, který ovlivňuje využívání malých dat, je zvýšení přístupnosti cloudových technologií, které umožňují velmi rychle vytvořit potřebnou infrastrukturu pro ukládání a zpřístupňování dat. Rozvoj cloudových služeb pro ukládání, analýzu a reporting dat je v současnosti na velkém vzestupu a cloudové služby se postupně stávají cenově konkurenceschopnými ve srovnání s řešeními, které si podnik musí instalovat a udržovat sám. Cenová politika jednotlivých poskytovatelů nyní nahrává právě správě malých dat, protože pro jejich malé objemy je možné pořídit datovou infrastrukturu zdarma nebo za velmi malé peníze. Vytvoření takové infrastruktury pro menší podnik je pro znalejšího uživatele záležitostí několika minut. Pokud to srovnáme s ruční instalací a vzájemným navazováním jednotlivých softwarových nástrojů na počítačích napříč firmou, jsme ve zcela jiné kategorii náročnosti. Současně díky uložení dat v cloudu je možné využívat předpřipravených cloudových služeb a malá data propojovat a obohacovat o data ze světa mimo firmu – typicky například o analýzy chování zákazníků na sociálních sítích, jejich citlivosti na reklamu a mnoho dalšího. Stejně tak řada poskytovatelů systémů a nástrojů pro podporu každodenního řízení firem začíná postupně svoje produkty nabízet jako cloudovou službu. Díky přesunu do cloudu se rychlost nasazení takových analytických řešení malých dat snížila na řády dnů, a navíc bez omezení možnosti jejich budoucího růstu. Velmi diskutovaným trendem v oblasti malých dat je také postupné opouštění ideje tvorby jednoho centralizovaného místa pro uložení malých dat pro analytické potřeby, tzv. centrálního datového skladu. Ukazuje se, že pro rychlé analytické potřeby firem je mnohdy vhodnější spravovat částečně propojené skupiny malých dat spíš, než se snažit o jejich centrální ukládání a správu. I tento přístup moderní cloudové nástroje umožňují, je zde však třeba strategie a disciplína. Posledním trendem v oblasti malých dat je vyšší rychlost. Díky výše uvedeným technologiím je možné data zpracovávat mnohem častěji a rychleji, blíže reálnému času. Díky tomu mohou být malá data mnohem flexibilnější a mohou reprezentovat skutečný stav firmy bez zbytečných zpoždění. Kvalita takových včasných výstupů je mnohem vyšší, než když firemní systémy generovaly pouze týdenní nebo měsíční reporty. Stejně tak je možné mnohem rychleji dělat změny v procesu zpracování dat a promítat je do činnosti firmy.

Výše uvedené jsou však stále „jen technologie“ spojené s malými daty. Jsou rychlejší, chytřejší a levnější, než tomu bylo před nástupem velkých dat, ale pořád potřebují někoho, kdo bude mít jasný cíl, co s nimi vlastně chce dosahovat a měřit. Proto je nutné zmínit i poslední trend spojený s malými daty, kterým je snaha o snižování rozsahu podnikového reportingu a analýzy. Ne, není to chyba, jde skutečně o „snižování“ nebo „zmenšování“ rozsahu podnikového reportingu. Technologie malých dat totiž umožňují vytvořit velmi rychle velké množství analytických výstupů a pokud není tento proces tvorby správně řízen, ve firmě se záhy vytvoří i z malých dat reportingový balast – množství neřízených, navzájem se překrývajících a nestejně aktuálních výstupů, které nelze rozumně spravovat, a hlavně se v nich ti, pro které byly původně určené, přestanou orientovat a odmítnou je používat. Firmy se následně dostávají do stavu paralýzy analýzou. Z tohoto důvodu je potřeba i pro malá data vždy důsledně definovat, co je cílem analýzy, a nesnažit se měřit a vykazovat vše, co lze. Praxe ukazuje, že se zodpovědnou strategií malých dat lze snížit rozsah podnikových reportů až na desetinu původního stavu, díky čemuž zbude více zdrojů na to, udělat tu klíčovou část podnikové analýzy kvalitně a v rozumném čase. Aby byly výše popsané způsoby analýzy malých dat úspěšné, nedocházelo k informačnímu přehlcení a podniková analytika opravdu pomáhala, je potřeba splnit poslední klíčový předpoklad. Lidé, co s malými daty pracují, jim musí rozumět, musí být datově gramotní. Nejde o to, aby uměli nastavovat složité datové modely, ale musí být schopni chápat principy, na kterých je analýza malých dat postavena, rozumět svým vlastním datům, a hlavně vědět co a proč vlastně chtějí zjišťovat. Bez toho jsou k ničemu jakákoliv data – ať už velká nebo malá. Pokud jsou ve firmě lidé datově gramotní, mohou i s malými daty udělat velké věci.


Autor: Ing. Ota Novotný Ph.D.
Zdroj: IT Systems