Data Warehouse 8. semester forår 2010

Slides:



Advertisements
Lignende præsentationer
Telos Team Introduktion.
Advertisements

Trehøje-Pigerne Side 1 Vejledning til brug af hjemmesiden Det er slet ikke så vanskeligt – så brug hjemmesiden flittigt… Det er.
Arkitektur - data.
Data Warehousing Del 3 af 3:
Relationsstyper En-til-en relationer: TABEL 1 NAVN ID Peter Hansen 1
– Sådan virker det! Dit elektroniske postsystem Ved Arne Crown Rasmussen
Formularer (Access, del 3)
SQL 1 DDL og DML.
Virksomhedens informationsbehandling
Regnskab & økonomistyring - Lektion 3 HD 5. semester forår 2010 v/ Jens Godik Højen, April 2010.
Virksomheder - definition
ER-diagrammer (databaser, del 4)
Obligatorisk projekt 5: ERP-systemer
Informationsteknologi B-A, HHX, 2005,
Regnskab & økonomistyring - Lektion 15 HD 5. semester forår 2010 v/ Jens Godik Højen, April 2010.
Regnskab & økonomistyring - Lektion 4 HD 5. semester forår 2010 v/ Jens Godik Højen, April 2010.
Regnskab & økonomistyring - Lektion 13 HD 5. semester forår 2010 v/ Jens Godik Højen, April 2010.
Regnskab & økonomistyring - Lektion 2 HD 5. semester forår 2010
NOEA/IT - FEN - Databaser/TabelDesign 1 Tabeldesign Design af relationsdatabaser Normalisering.
Brug af IT redskaber og -systemer i den administrative stilling
Masterpages/Otto Knudsen 1 Master Pages Master Pages i ASP.NET 2.0.
Introduktion til Access (Access, del 1)
Opslagsfelter (Access, del 6). RHS – Informationsteknologi 2 Udgangspunkt Vi er ofte i den situation, at valg af en type for et felt ikke begrænser vores.
Oprettelse af tabeller (Access, del 2)
Rapporter (Access, del 5)
Beskrivelses- og analyse-teknikker understøttet af Oracle Designer
1 Dagens gang Repeter systemvalg Gennemgang af klasser og strukturer (kap. 3+4 OOA+D) Tavle opgave Gruppe opgave til næste gang.
Backup/Storage Søren Helmer Jensen.
DK-CLARIN Workspace Struktur - Arbejdsbænk / Workbench Værktøj Ressource Ny ressourceEgen mappe 1DKClarin (KMIV)
2:Relations modellering og design regler.
12.1 Mathiassen, Munk-Madsen, Nielsen & Stage, 2000 © Modelkomponent Oversigt, principper og teknikker Kapitel 12.
Relationsdatabaser og SQL
Operationer på relationer
Data Warehousing Del 2 af 3: Opbygning af et Data Warehouse
Udvikling i GODS Transporten Sammenfatningsrapport maj 2010.
NOEA/IT FEN - Databaser/modellering 1 Tabeldesign Omformning af E/R-modellen til relationelle skemaer.
SQL – Oracle Relationsdatabase
Informationssystemer kursusgang: Modellering med henblik på dataudtræk
Den relationelle model
XML Rasmus D. Lehrmann DM Indhold Hvad er XML? XML standarder Hvor bruges XML? XML struktur Træ struktur Element & Attribute Syntaks i XML Stylesheets.
Relationelle databaser og XML
Rapporter (Access, del 5). RHS – Informationsteknologi – Udgangspunkt Vi har oprettet en database Vi har defineret en eller flere tabeller, og.
Virksomhedens informationsbehandling lektion Ved. Jens Godik Højen.
2009NOEA/IT - Databaser/arkitektur1 Tabeldesign Design af relationsdatabaser Normalisering.
IT i Byggeriet Semester 6, kursusgang Databaser (2) Kjeld Svidt Kjeld Svidt  Institut for Bygningsteknik  Aalborg Universitet.
IT i Byggeriet Semester kursusgang Databaser (2) Kjeld Svidt Kjeld Svidt  Institut for Bygningsteknik  Aalborg Universitet.
1. Database-systemer, introduktion
Virksomhedens informationsbehandling
Opslagsfelter (Access, del 6). RHS – Informationsteknologi – Udgangspunkt Vi er ofte i den situation, at valg af en type for et felt ikke begrænser.
Introduktion til Access (Access, del 1). RHS – Informationsteknologi – Fra design til udvikling Vi ved nu, hvordan vi finder et design for en database,
Data Warehouse - indledning 8. semester forår 2010 v/ Jens Godik Højen, Februar 2010 Fredag kl
ER-modellering1 Analyse af data og sammenhæng mellem data.
DIEB4.1 Kursusgang 4 Oversigt: Sidste kursusgang Opgaver Aktivitet 2: Generer design (fortsat) Design af interaktionselementer.
Kjeld Svidt  Institut for Byggeri og Anlæg  Aalborg Universitet IT i Byggeriet Semester 6, kursusgang Databaser (2) Kjeld Svidt
Geografisk Information
NOEA/IT FEN - Databaser/modellering 1 Datamodellering Den udvidede (enhanced) E/R-model (EE/R- modellen) Begreber Diagrammering Omformning til.
Dokumentation 7. Semester
Oprettelse af tabeller (Access, del 2)
2009Softwarekonstruktion / DB-design 11 Databasedesign 1 Fra begrebsmæssig model til relationel model.
Virksomhedens informationsbehandling
Oracle Application Express Lektion 2 7. Semester 2008.
OPERATIONEL ANALYSE AF WEBADFÆRD OAW – LEKTIONSGANG 11.
Database.
E/R-diagrammering 7. Semester.
Den relationelle model
Virksomhedens informationsbehandling Opgave inden for databehandling Opgave 1 Ved. Jens Godik Højen.
Oracle Application Express Lektion 1 7. Semester 2008.
Normal former i en database Jan Christiansen Nyborg Gymnasium.
Inspire implementering med brug af modelregler
Præsentationens transcript:

Data Warehouse 8. semester forår 2010 v/ Jens Godik Højen, Februar 2010

Data Warehouse som kilde til Balanced Scorecard Den efterfølgende lektion har til formål at anvende DWH begreberne i praksis. Balanced Scorecard introduceres kort, med det formål at stille en opgave hvor der ønskes leveret en løsning hvor økonomistyringsmetodik anvendes i forhold til DWH

The Balanced Scorecard

Strategikort

Opfølgning på Metadata Opgaven fra fredag færdiggøres

Sådan laver du et Data Warehouse! Normaliseret data model, Dimensionaliseret data model.

Udviklings ”Road Map”

Normaliseret data model Den traditionelle måde at designe databaser på Anvendes normalt i de fleste kildesystemer, såsom et ERP-system Dog skal man ikke regne med, at de alle er ”pænt” designet Væsentligste formål er at undgå redundant data i databasen Nemt at arbejde med de enkelte posteringer Indtaste, opdatere, slette og hente data om enkelte kunder, ordrer, produkter osv. Kompleks at overskue samlede modeller

Dimensionaliseret data model Forskellige arter af dimensionaliseret modeller Star schema (stjerneskema) Snowflake schema Konstellations schema Datamodellen er relativ nem at overskue Velegnet som grundlag til analyser og rapporter: Idet det er nemmere at gennemskue strukturen Endvidere vil hastigheden på forespørgsler være hurtigere pga. af færre tabeller og dermed færre joins mellem tabeller Ikke velegnet til OLTP-systemer pga. at der bevidst er redundante data i modellen.

Martens betydning Data marten er en emneorienteret datasamling designet til at besvare specifikke spørgsmål til bestemte organisatoriske niveauer. Data marten kan f.eks. leverer svar på spørgsmål i forbindelse med markedsføring, salg, drift, samlinger osv. Det forekommer ofte at en virksomhed har mange marter med næsten enslydende resultater. Data marten kan nemt forveksles med begrebet DWH. Nem/hurtig adgang til ofte nødvendige data Opretter kollektive opfattelse af en gruppe af brugere Forbedrer leverance responstid Billigere end at udvikle DWH

Stjerne-, konstellations- og snowflake skemaer

Stjerne skema Et stjerneskema er den enkleste form for DWH skema. flad struktur i dimensionerne

Fact tabeller og dimensioner konforme fakta tabel Attributterne i en fakta tabel er typisk numeriske og kan normalt summeres (ikke f.eks. %) Disse attributter er dem, som der foretages analyser på Har enten en primærnøgle, der dannes af fremmednøglerne fra hver dimension eller en syntetisk (sekvens) dannet primærnøgle Stor mængde af værdier konforme dimensioner Dimensionerne indeholder informationen, som beskriver fakta-attributerne Normalt er dimensionstabellens attributter tekstfelter/beskrivelser Relativt få værdier i forhold til Fakta-tabel Der er næsten altid et ”et-til-mange” forhold mellem data i en dimension og data i fakta-tabellen

Konstellationsskema Konstellationsskemaet er en mere kompleks form for organisering af komplementære stjerneskemaer

Snowflake skema Snowflake skemaer er tæt forbundet med den logik et stjerneskema bygger på Forskellen mellem dem skal findes i at dimensionerne anvender en vis grad af normalisering

Start opgave 2 Target / mål Databasen der indeholder et DWH Source / kildesystemer Kildesystemerne/filer der leverer data til DWH Extraction, Transformation and Loading (ETL) – Data Staging Processen hvormed der overføres data fra kilderne til DWH (Target)

Data Staging – ETL Hvad betyder ETL - hvordan flyttes data fra datakilder til DWH? Rense data Beriget data ved f.eks. akkumulering i forhold til økonomistyringsmodeller. Transformeret data til en passende datamodel   Extraction Transformation (og cleaning) Load

Extraction Udtræk af data fra relevante datakilder. Der anvendes forskellige teknologier afhængig af kildens type ODBC Mapping JDBC CVS Tekst filer - og MS Excel filer

Transformation Anvendelse af forskellige operatorer og konstanter i datatransformationsprocessen. Joins Key Lookups Filtre Sorteringsoperatorer Set-operator (union, intersection, minus) Beregninger Summeringer Tekst erstatninger M.fl.

Load Uploade transformerede data i DWH Type 1: Ingen historik Overskrivning af tidligere lagrede entiteter Type 2: Fuld historik Opret en ny dimensionsrække/-post og behold tidligere lagrede entiteter – effektiv i forbindelse med timelines – mulighed for styring af data ud fra SQL script eller vha. fra- og til-dato kolonner Type 3: Delvis historik Flyt den gamle/forrige værdi over i et nyt attribut/ kolonne i den samme dimension, og opret den nye værdi i den oprindelige attribut/kolonne.

Tak for i dag - på gensyn 