Præsentation er lastning. Vent venligst

Præsentation er lastning. Vent venligst

Data Warehouse 8. semester forår 2010

Lignende præsentationer


Præsentationer af emnet: "Data Warehouse 8. semester forår 2010"— Præsentationens transcript:

1 Data Warehouse 8. semester forår 2010
v/ Jens Godik Højen, Februar 2010

2 Data Warehouse som kilde til Balanced Scorecard
Den efterfølgende lektion har til formål at anvende DWH begreberne i praksis. Balanced Scorecard introduceres kort, med det formål at stille en opgave hvor der ønskes leveret en løsning hvor økonomistyringsmetodik anvendes i forhold til DWH

3 The Balanced Scorecard

4 Strategikort

5 Opfølgning på Metadata
Opgaven fra fredag færdiggøres

6 Sådan laver du et Data Warehouse!
Normaliseret data model, Dimensionaliseret data model.

7 Udviklings ”Road Map”

8 Normaliseret data model
Den traditionelle måde at designe databaser på Anvendes normalt i de fleste kildesystemer, såsom et ERP-system Dog skal man ikke regne med, at de alle er ”pænt” designet Væsentligste formål er at undgå redundant data i databasen Nemt at arbejde med de enkelte posteringer Indtaste, opdatere, slette og hente data om enkelte kunder, ordrer, produkter osv. Kompleks at overskue samlede modeller

9 Dimensionaliseret data model
Forskellige arter af dimensionaliseret modeller Star schema (stjerneskema) Snowflake schema Konstellations schema Datamodellen er relativ nem at overskue Velegnet som grundlag til analyser og rapporter: Idet det er nemmere at gennemskue strukturen Endvidere vil hastigheden på forespørgsler være hurtigere pga. af færre tabeller og dermed færre joins mellem tabeller Ikke velegnet til OLTP-systemer pga. at der bevidst er redundante data i modellen.

10 Martens betydning Data marten er en emneorienteret datasamling designet til at besvare specifikke spørgsmål til bestemte organisatoriske niveauer. Data marten kan f.eks. leverer svar på spørgsmål i forbindelse med markedsføring, salg, drift, samlinger osv. Det forekommer ofte at en virksomhed har mange marter med næsten enslydende resultater. Data marten kan nemt forveksles med begrebet DWH. Nem/hurtig adgang til ofte nødvendige data Opretter kollektive opfattelse af en gruppe af brugere Forbedrer leverance responstid Billigere end at udvikle DWH

11 Stjerne-, konstellations- og snowflake skemaer

12 Stjerne skema Et stjerneskema er den enkleste form for DWH skema.
flad struktur i dimensionerne

13 Fact tabeller og dimensioner
konforme fakta tabel Attributterne i en fakta tabel er typisk numeriske og kan normalt summeres (ikke f.eks. %) Disse attributter er dem, som der foretages analyser på Har enten en primærnøgle, der dannes af fremmednøglerne fra hver dimension eller en syntetisk (sekvens) dannet primærnøgle Stor mængde af værdier konforme dimensioner Dimensionerne indeholder informationen, som beskriver fakta-attributerne Normalt er dimensionstabellens attributter tekstfelter/beskrivelser Relativt få værdier i forhold til Fakta-tabel Der er næsten altid et ”et-til-mange” forhold mellem data i en dimension og data i fakta-tabellen

14 Konstellationsskema Konstellationsskemaet er en mere kompleks form for organisering af komplementære stjerneskemaer

15 Snowflake skema Snowflake skemaer er tæt forbundet med den logik et stjerneskema bygger på Forskellen mellem dem skal findes i at dimensionerne anvender en vis grad af normalisering

16 Start opgave 2 Target / mål Databasen der indeholder et DWH
Source / kildesystemer Kildesystemerne/filer der leverer data til DWH Extraction, Transformation and Loading (ETL) – Data Staging Processen hvormed der overføres data fra kilderne til DWH (Target)

17 Data Staging – ETL Hvad betyder ETL - hvordan flyttes data fra datakilder til DWH? Rense data Beriget data ved f.eks. akkumulering i forhold til økonomistyringsmodeller. Transformeret data til en passende datamodel Extraction Transformation (og cleaning) Load

18 Extraction Udtræk af data fra relevante datakilder.
Der anvendes forskellige teknologier afhængig af kildens type ODBC Mapping JDBC CVS Tekst filer - og MS Excel filer

19 Transformation Anvendelse af forskellige operatorer og konstanter i datatransformationsprocessen. Joins Key Lookups Filtre Sorteringsoperatorer Set-operator (union, intersection, minus) Beregninger Summeringer Tekst erstatninger M.fl.

20 Load Uploade transformerede data i DWH Type 1: Ingen historik
Overskrivning af tidligere lagrede entiteter Type 2: Fuld historik Opret en ny dimensionsrække/-post og behold tidligere lagrede entiteter – effektiv i forbindelse med timelines – mulighed for styring af data ud fra SQL script eller vha. fra- og til-dato kolonner Type 3: Delvis historik Flyt den gamle/forrige værdi over i et nyt attribut/ kolonne i den samme dimension, og opret den nye værdi i den oprindelige attribut/kolonne.

21 Tak for i dag - på gensyn 


Download ppt "Data Warehouse 8. semester forår 2010"

Lignende præsentationer


Annoncer fra Google