Data jsou zlato. Když ale nevíte, proč je sbíráte, jsou vám k ničemu
Data jsou zlatem moderní doby a datoví analytici jsou vlastně moderní zlatokopové. Prorektor VŠE Ota Novotný již několik let učí, jak se tohle „zlato“ správně hledá a co všechno s ním lze dělat. A jak říká, po lidech studujících datovou analytiku je ve firmách obrovská poptávka. Jak by také ne, když jich podle odhadů chybí v české ekonomice tisíce až desetitisíce.
Roste v Česku zájem o datové analytiky?
Určitě ano. Je to vidět i na zvyšujícím se počtu firem, které s námi spolupracují. Když jsme před sedmi lety začínali se studijními programy pro analýzu dat na VŠE, tak jsme měli tři firemní partnery. Teď jich je přes třicet a jejich počet se bude dál rozšiřovat.
Jaké studijní programy v této oblasti vlastně nabízíte?
Máme jak program pro bakaláře, tak i magistry a rovněž program MBA. Ročně u nás ve všech těch programech studuje kolem 170 až 180 lidí. Kdybychom napočítali studující všech vysokoškolských univerzitních programů tohoto typu v celé České republice, dostaneme se možná ke čtyřem stovkám. V poměru k potřebám Česka je to samozřejmě stále málo. Proto máme i programy, jež pomáhají firmám vyškolit vlastní zaměstnance jako datové analytiky. Jejich součástí je i kurz datové minimum, je to vlastně zážitková hra, která se ve firmách používá k vytipování lidí, kterým datová analýza jde a mají v ní potenciál.
Jak se pozná, že má člověk pro datovou analýzu předpoklady? Jaké schopnosti a vlastnosti by měl mít?
Předně musí mít nadhled, musí mít otevřenou hlavu a schopnost přemýšlet, jak věci, s nimiž se v realitě setkává, uchopit a transformovat do datového problému. Měl by mít byznysové znalosti. Když máte člověka se skvělými datovými znalostmi, ale musíte mu od základů vysvětlovat, jak to v dané firmě funguje, tak je jeho použitelnost významně menší.
Kde dělají firmy při datové analýze chyby?
Nejdůležitější je vědět, k čemu vlastně datovou analýzu potřebuji. Spousta lidí ve firmách si myslí, že nasazení nástrojů pro analýzu přinese nějakým kouzlem hodnotu samo o sobě. Když se jich ale zeptáte, co vlastně tou analýzou potřebují zjistit, tak to nedokážou určit. Na začátku je tedy nutné pokládat si ty správné otázky. Pak určitě platí, že méně je více. Dnes si do cloudové technologie můžete v podstatě nasypat všechna firemní data, když to tedy vaše kreditka unese. Ale pokud nevíte, proč je tam máte, tak akorát vytvoříte obrovský balast, který může v důsledku napáchat víc škody, než kdybyste data nesbírali vůbec. Proto také vždycky na začátku datové analýzy lidem říkám, aby si určili, co je pro ně důležité. Nemělo by to být dvacet věcí, ale třeba jen tři. Když pak ve firmě neměříte desítky věcí, ale jen tři a o ně tu firmu opřete, tak to najednou funguje mnohem lépe.
Už několik let pořádáte KPMG Data Festival. Pro koho je tato akce určena?
Je to akce, jejímž cílem je dostat do datařiny co nejvíce lidí. Proto je to také zdarma pro všechny, kdo se chtějí zúčastnit. Původně jsme mířili především na studenty, ale postupem času se ukázalo, že zájem mají i lidé z malých a středních firem, a nyní nás navštěvují i týmy z firem velkých – každý si na festivalu najde to svoje. Každý rok se zaměřujeme na nějaké téma, letos v říjnu to bude na téma „datového podsvětí“ – nepořádku v datech. Firmy se dnes spíš potýkají tím, že mají dat moc a kvůli nepořádku, ze kterého někdy vznikají, jim nemohou stoprocentně věřit.
Když se středně velká firma rozhodne, že si udělá pořádek v datech, jak dlouho jí to podle vašich zkušeností zabere?
Řekl bych, že tak půl roku až rok. To, že firma má svoje data někde uložená, totiž vůbec neznamená, že půjdou dobře vytěžit. Myšlenka, že se data někam nasypou a ono z toho něco rychle vypadne, je naivní. Je za tím strašně moc práce.
Jak si představit výsledný produkt takové analýzy? Je to v té nejjednodušší formě třeba excelovská tabulka?
Excelovská tabulka je něco, čeho se chceme vyvarovat. Excelovská tabulka vám třeba vyplivne seznam faktur. Když jich je ale dvacet tisíc, tak jsou vám k ničemu, protože se v tak dlouhém seznamu ztratíte. Když na tato data ale aplikujete nějaký pokročilejší nástroj, najednou se na ty faktury můžete dívat třeba přes zákazníky, přes produkty, které kupují, a tak dále. Díváte se tedy zpětně, co se v té dané firmě stalo. Při použití dalších nástrojů se můžete dobrat toho, proč se to stalo. A dokonce pak můžete s určitou mírou pravděpodobnosti predikovat, co se stane v budoucnosti. Poslední fáze je, že nasadíte technologie, které budou zabraňovat tomu, co by se v té budoucnosti mohlo stát, nebo to budou naopak podporovat. V současnosti se ale v Česku potýkáme s tím, že spousta firem má vůbec problém zpracovat data tak, aby zjistily, co se v jejich podniku vůbec stalo. Pokud nemáte v datech pořádek, tak ty další fáze prostě nemají smysl.
Jsou-li data neúplná nebo nepřesná, mohou přece výsledky jejich analýzy napáchat víc škody než užitku.
To samozřejmě ano a už se to také několikrát stalo. Naposledy pamatuji, že se během pandemie v jedné zemi vycházelo z datového zdroje v Excelu, který má limitovaný počet řádků. Záznamů, které do něj vstupovaly, bylo ale dvakrát tolik, tudíž se polovina dat vůbec do analýzy nedostala a výsledky byly hrubě zkresleny. Když pak nemáte kontrolní mechanismy, může snadno dojít ke katastrofě. Neustálá kontrola procesů, které data ve firmě připravují, je naprosto nezbytná.
Když se podíváme na srovnání se zahraničím, umí české firmy dobře analyzovat svá data?
Srovnání se rozhodně nemusíme bát, určitě nezaostáváme. Česko je již řadu let špičkou v regionu ohledně zpracování dat. Řada velkých nadnárodních společností k nám přesunula svoje centra analýzy dat, naopak české firmy nabízející služby datové analytiky expandují do zahraničí. V Česku vznikla také řada zajímavých start-upů založených právě na analýze dat. Na druhou stranu je zde stále prostor pro zlepšování – zejména v sektoru malých a středních firem –, v tom se ale nelišíme od našich sousedů v regionu.
Dnes můžete sbírat ve firmě spoustu dat. Když ale nevíte, proč je sbíráte, tak vytvoříte velký balast, který je k ničemu. Ota Novotný Prorektor pro rozvoj a corporate relations na Vysoké škole ekonomické v Praze. Vystudoval Vysokou školu ekonomickou v Praze, kde získal i titul Ph. D. v oboru informatika. Od roku 1996 zde na katedře informačních technologií přednáší problematiku business intelligence, měření výkonnosti informačních systémů a jejich auditu.
Zdroj: EKONOM
Foto: Tomáš Nosil