Datawarehousing

1. 12. 1997

Sdílet

Zahoďte křišťálové koule, datové sklady přicházejí! Když jsem nedávno odmítl jít se svým znám





Zahoďte křišťálové koule, datové sklady přicházejí!





Když jsem nedávno odmítl jít se svým známým na kulečník s tím,

že mě ještě čeká ten datawarehousing, řekl mi: „Vídíš, kdybys

měl pořádnej antivirák, tak bys žádnýho verhauze v datech

neměl“. A tak jsem mu začal vysvětlovat, že.



Datawarehousing, nebo chcete-li česky datový sklad, není nic

tajemného nebo převratného. Název sám trefně charakterizuje, že

se jedná o schraňování dat. Složitá není ani odpověď na dotaz, k

čemu je takové hromadění dat dobré. Mám-li totiž k dispozici

dostatek kvalitních informací, může mi být jejich analýza

nápomocná při mých budoucích rozhodnutích. Takže např. pokud

jsem v restauraci U Tří boulí již dvakrát inkasoval pár facek,

rozhodnu se pravděpodobně po zhodnocení těchto skutečností pro

jiný podnik nebo zůstanu raději doma.



Ale teď vážně. Pokud se na problematiku datových skladů podíváme

hlouběji, zjistíme, že se v určitých ohledech liší od běžně

používaných databázových systémů. Je to dané především

specifickými požadavky, které jsou na oblast datawarehousingu

kladeny. Jedná se o následující rysy:



Silná schopnost přístupu k datům. Datové zdroje podniku

(může se samozřejmě jednat i o externí data) mohou být často

uloženy v řadě rozdílných formátů na více místech, lišících se

síťovým protokolem či operačním systémem.



Vysoký výkon. Ve většině případů jsou zpracovávány velké

objemy dat, protože čím více je vstupních údajů , tím jsou

samozřejmě získané výsledky přesnější a objektivnější.

Složitější je také vyladění systému, neboť používané dotazy

bývají komplikované, nahodilé a zřídka se opakují. V praxi je

také třeba výsledky získat v rozumném časovém horizontu.



Naproti tomu některé funkce podnikových systémů, sloužící

především ke zvýšení produktivity a efektivnosti zpracovávání

běžné agendy, nejsou pro datawarehousing bezpodmínečně nutné:



Pořizování dat. Standardně se datový sklad naplňuje po

velkých celcích, není určen k zadávání jednotlivých záznamů.

Proto je volena optimalizace pro čtení, a nikoliv zápis.



Počet uživatelů. Datawarehousing není určen pro široký

okruh uživatelů. U většiny firem je zpracovávání informací na

této úrovni doménou úzkého okruhu specialistů, mnohdy dokonce

jednotlivce.



Dalším termínem spojeným s datawarehousingem je datamart. I přes

vzrůstající výkon hardwaru je totiž stále třeba zamýšlet se nad

návratností investic vložených do budování datového skladu.

Nashromáždíme-li např. 200 GB „čistých“ dat, můžeme spolu s

vytvářenými indexy a sumacemi (ty podle statistik tvoří 65 – 75

procent z celkového objemu dat) dostat až 800 GB velkou

databázi. To již vyžaduje opravdu výkonné stroje, nasazení

systémů na bázi symetrického procesingu nebo použití jiných

speciálních a nikterak levných řešení. Díky technologii založené

na datamartech to však není bezpodmínečně nutné.



Datamart je vlastně podmnožina datového skladu, tvořená daty

určitého zaměření. Oddělit tak lze například data, jejichž

analýza má význam pro ekonomický úsek, data týkající se

personalistiky, marketingu nebo profilace výrobní náplně.

Získáme tak menší, lépe zpracovatelné datové zdroje, aniž by

utrpěla relevantnost výsledných údajů.



Význam datawarehousingu a datamartů. Při dnešním rozmachu

výpočetní techniky vzniká v rámci různých podnikových aplikací

obrovské množství dat s většinou dočasným významem. Datové

sklady a datamarty umožňují využití potenciálu těchto zdánlivě

„mrtvých“ dat pro lepší řízení, plánování a strategická

rozhodnutí v rámci podniku. A to jak jistě uznáte stojí v tržním

prostředí nejen za úvahu, ale i za tu partičku kulečníku.



7 0…/OK







 

Autor článku