Præsentation er lastning. Vent venligst

Præsentation er lastning. Vent venligst

Data Warehouse - indledning 8. semester forår 2010 v/ Jens Godik Højen, Februar 2010 Fredag kl. 9.00.

Lignende præsentationer


Præsentationer af emnet: "Data Warehouse - indledning 8. semester forår 2010 v/ Jens Godik Højen, Februar 2010 Fredag kl. 9.00."— Præsentationens transcript:

1 Data Warehouse - indledning 8. semester forår 2010 v/ Jens Godik Højen, Februar 2010 Fredag kl. 9.00

2 Data Warehouse v/ Jens Godik Højen – Cand. Merc. 8. semester forår 2010 forretnings-drevet mål bag et data warehouse Data warehouse udgivelse Væsentlige dele af de samlede data warehouse Betydningen af dimensional modellering for data warehouse præsentation område Fact og dimension tabel terminologi Myter omkring dimensional modellering Undgå faldgruber i udviklingen af data warehouse Information som underbygger beslutningsgrundlag 2

3 Data Warehouse v/ Jens Godik Højen – Cand. Merc. 8. semester forår 2010 Problemstillinger bag ofte stillede spørgsmål Vi er i besiddelse af enorme mængder af data, men kan ikke komme i forbindelse med dem Vi kan ikke kombinere data efter behov, (Slice/Dice) To forskellige personer med samme data kommer med to forskellige svar? Objektiv og subjektiv ?????? Problemorienteret løsning bag data warehouse 3

4 Data Warehouse v/ Jens Godik Højen – Cand. Merc. 8. semester forår 2010 DWH skal afhjælpe problemer med svart tilgængelige data DWH skal formes efter virksomhedens kultur og krav til information DWH skal kunne modstå krav til omskiftelighed og løbende tilpasninger DWH skal sikre vitale data i forbindelse med driften af virksomheden DWH skal fungerer som et fundament under vigtige beslutninger Virksomheden skal have tiltro til og accepterer svar leveret af DWH Hvad ønskes opnået? 4

5 Data Warehouse v/ Jens Godik Højen – Cand. Merc. 8. semester forår 2010 Sæt faste mål for hvad et DWH skal løse! Forstå forretningsformålene i virksomheden Forstå hvilke beslutninger der ønskes sat fundament under Finde kompetente med-/mod-spillere til hjælp under udvikling Finde nye brugere af DWH, hjælp dem på vej Find de data der fungerer i et DWH, sikre dig adgang Udvikling af simple datahøst metoder, og optimering af datatilgang Sikre datavaliditet igen og igen og igen!!!!! Fortsæt med at overvåge resultatet af output igen og igen og igen Identificer nye datakilde muligheder og find en metode til indlejring Sikre at resultater af DWH virker inden videreudvikling finder sted Data warehouse udgivelse 5

6 Data Warehouse v/ Jens Godik Højen – Cand. Merc. 8. semester forår 2010 En anden måde at vise Kimballs system – se side 7 6

7 Data Warehouse v/ Jens Godik Højen – Cand. Merc. 8. semester forår 2010 1. niveau – hent data væk fra den oprindelige datakilde 2. niveau – data staging area, ETL. Skille ad, rense, samle på ny 3. niveau – upload til datapræsentationsserver Hvorfor det? Det er vigtigt at der er vandtætte skotter mellem virksomhedens registreringssystemer og data præsentationsområdet. Efterfølgende designes kuberne der skal sikre levering af data til et data Access værktøj Tre niveauer i et effektivt DWH 7

8 Data Warehouse v/ Jens Godik Højen – Cand. Merc. 8. semester forår 2010 Metadata er data om datakilden, dvs. det er ikke data om data En form for opslagsværk over opbygningen af et DWH’s datastruktur design Metadata kan/indeholder oplysninger om: Systemtabeller Partitionsinstillinger Index View’s Sikkerhedsindstillinger … Metadata 8

9 Data Warehouse v/ Jens Godik Højen – Cand. Merc. 8. semester forår 2010 En række i en fact tabel svarer til en måling. En måling er en række i en fact tabel. Alle målinger i et fact tabel skal være det samme på samme granuleringsniveau. De mest anvendelige elementer i en fact tabel består af numeriske og samlingsmulige værdier Dimensionstabeller er vigtige additiver i forhold til fact tabellen. Robuste dimensions attributter sikre solide analytiske (slicing and dicing) muligheder. Dimensionerne implementere brugergrænsefladen til det endelige DWH konforme Fact tabeller og konforme dimensioner 9

10 Data Warehouse v/ Jens Godik Højen – Cand. Merc. 8. semester forår 2010 dimensionelle modeller og data marts indeholder kun summariske data. dimensionelle modeller og data marts er afdelingsorienteret og ikke anvendelig som en overordnet virksomhedsløsning. dimensionelle modeller og data marts er ikke skalerbar. dimensionelle modeller og data marts er kun fornuftige løsningsmodeller, når der er en forudsigelig brugsmønster. dimensionelle modeller og data marts er svært at implementerer og fører ofte til spagettiprogrammerede løsninger Fem myter omkring DWH 10

11 Data Warehouse v/ Jens Godik Højen – Cand. Merc. 8. semester forår 2010 Undgå teknologiliderlighed! Gennemfør hellere små succeser ned flerårige mastodont projekter! Sikre tilstrækkelige midler til at kunne gennemføre et projekt (projektledelse er vigtig) God performance på data giver tilbagevendende brugere. Simple løsninger er kunst – komplekse løsninger er en sikker vej til fiasko Overhold altid en fastlagt metodisk procedure….. Anvend kun summeret data i datapræsentationsområdet! At tro at virksomheden ikke ændre sig og at data derfor ikke skal tilpasses! At tro at et DWH’s succes ikke er direkte forbundet med accept fra brugerens side !!!!!!!!!!!!!!!!!!!!!!!!!!! Tid til at du tænker dig rigtigt godt om 11

12 Data Warehouse v/ Jens Godik Højen – Cand. Merc. 8. semester forår 2010 Konto Dato Afdeling Medarbejder Projekt Datakilde Organisation Art, sted, formål Handlinger Oversættelser Service Kunder og kundetype Valuta ….. Forslag til dimensioner 12


Download ppt "Data Warehouse - indledning 8. semester forår 2010 v/ Jens Godik Højen, Februar 2010 Fredag kl. 9.00."

Lignende præsentationer


Annoncer fra Google