Data Warehousing Del 3 af 3:

Slides:



Advertisements
Lignende præsentationer
Præsentation på M3UG 2011.
Advertisements

Datakvalitetsstrategi Engrosmodellen
Oplæg til projektmodel Godkendt til anvendelse på ”TOP 12” af AU IT, STUDIER, ØKONOMI og AU HR d i version 1.0. Nedenfor findes version 1.2.
Dataindsamling og kildebearbejdning
Arkitektur - data.
Implementering af it-system
Sikring af tilgængelighed er en proces!
Iterativ udvikling og UP
“Hvad har vi på hylderne?”
Virksomhedens informationsbehandling
Regnskab & økonomistyring - Lektion 3 HD 5. semester forår 2010 v/ Jens Godik Højen, April 2010.
Beskrivelsesværktøj Implementering af bips beskrivelsesværktøj i din virksomhed bips konference 26. september 2011.
Værdistrøms-analyse (Vejledning)
Implementering af brandingstrategi på nettet
Regnskab & økonomistyring - Lektion 13 HD 5. semester forår 2010 v/ Jens Godik Højen, April 2010.
SkoleIntra og integration med kommunale platforme - digital Signatur
WorldIQ A/S - Technology Briefing
Beskrivelses- og analyse-teknikker understøttet af Oracle Designer Del 2 af 2: Proces- og funktionsdiagrammering Aalborg Universitet, d. 9. oktober 2006.
Beskrivelses- og analyse-teknikker understøttet af Oracle Designer
Videnskabsministeriets arbejde med åbne standarder Vicedirektør Mikkel Hemmingsen, Videnskabsministeriet
Virksomhedens informationsbehandling
Digitaliseringsstyrelsen
Arkitektur - software. RHS - Informationsteknologi 2 Software-arkitektur Formålet med software-arkitekturen er at definere en software-”platform”, som.
11.1 Mathiassen, Munk-Madsen, Nielsen & Stage, 2000 © Processer Oversigt, principper og teknikker Kapitel 11.
Dansk kvalitetsmodel på det sociale område.
PBJ Consult A/S – Mere end et systemhus HR i øjenhøjde
Data Warehousing Del 2 af 3: Opbygning af et Data Warehouse
Quality Management Systems
Rambøll Managements definition af it-governance
Kvalitetssikringsprocedurer og programmer.. Jesper Bak DMU.
TietgenSkolen – hovedopgaven til datamatiker.  Intro  Introduktion af ITemp  Gennemgang af ITempSys  Bruge af XP samt fordele/ulemper  Tortoise,
OPI EFFEKTMÅLINGSVÆRKTØJ
Dokumentation af opgaver
Kort præsentation Jesper Holmelund Jørgen Peter Ærthøj
Microsoft Office System 21. Oktober 2003 Jesper Aaberg, Business Productivity Advisor Microsoft Danmark.
RADAR i projektarbejdet 12. okt C2E netværk.
BusinessMinds A/S © 2006 Sporbarhed i økonomirapportering 2006 Troels Brøcher BusinessMinds A/S.
5 år med ESCO- hvad er erfaringerne og alternativerne? Jesper Ole Jensen, Statens Byggeforskningsinstitut, Aalborg Universitet Susanne Balslev Nielsen,
Køb og drift af tilgængelige netsteder lbc/ /2.2.
Introduktion I4DAB1 Jesper Tørresø Forår Layers + Tiers ? Tiers er opdelinbgslag omkring en logisk abstraktion (Præsentation, forretningslogik og.
Data Warehouse 8. semester forår 2010
Virksomhedens informationsbehandling
Data Warehouse - indledning 8. semester forår 2010 v/ Jens Godik Højen, Februar 2010 Fredag kl
September 20031KUP - Projektstyring Formålet med projektstyring Formålet med projektstyring er at planlægge og styre et udviklingsprojekt, således at projektet.
Hvorfor Datawarehouse Hvad er det totale salg i område A? Hvilken sælger fik højeste kommission i denne måned ? Hvordan har salget i region A ændret sig.
Styr på ressourcer og projekter Inspirationsseminar 31. oktober 2006.
Rekvirent Landinspektøren Indsamler data Opmåling, beregning Høring hos berørte myndigheder Godkendelse i kommunen Godkendelse og regi- strering hos KMS.
Produkt præsentation Christian Cletus Bjørn Eilertsen.
Carsten Lindorf Lean administration og service Fagspecialistorganisation  Fagspecialicerede funktioner  Fagligt kompetente medarbejdere  Lille helhedforståelse.
Business cases.
Virksomhedens informationsbehandling
Oracle Application Express Lektion 2 7. Semester 2008.
OPERATIONEL ANALYSE AF WEBADFÆRD OAW – LEKTIONSGANG 11.
BusinessMinds A/S © 2004 Metadata i BI udvikling 2005 Troels Brøcher BusinessMinds A/S.
Virksomhedens informationsbehandling Opgave inden for databehandling Opgave 1 Ved. Jens Godik Højen.
TATIONpRÆSEN AARHUS UNIVERSITET NY ØKONOMIMODEL Overordnet beskrivelse af formål og proces, marts
Situationsbestemt metodevalg
Introduktion I4DAB1 Jesper Tørresø Efterår Databaser ? Hvorfor indskyde et lag mellem applikation og det permanente/persistente lager? Hvordan gemmes.
SuperNovaONLINE. Projekt beskrivelse Programmet kører på central server Flere fra foreningen kan få adgang til samme regnskab – idrætsmodul Backup foregår.
IC Companys Projektstyring af nyt Data Warehouse-system (udtræk af data fra databasen – rapporter)
CASE: Udvikling af system til optimering af kassebemanding
Forskningsdata management
SUF - gevinstrealisering
Cloud Computing Model-View-Controller
Tre lags arkitektur.
De nye it-konsulent- og projektaftaler
FOCUS modulopbygget ledelsesinformation Herning Kommune 29. juni 2006
Datafordeleren på ondt og godt
Statens HR – Implementeringskoncept
OS2 - projekt OS2datascanner.
Præsentationens transcript:

Data Warehousing Del 3 af 3: Data Warehouse arkitekturer og implementering Aalborg Universitet, d. 8. februar 2007 B e n t M ø l l e r M a d s e n

Data Warehouse begreber Enterprise Data Warehouse Data Mart Operational Data Store (ODS)

Enterprise Data Warehouse Et data warehouse oprettet til at opbevarer alle virksomhedens data. Det kan tage mange år at opbygge et komplet Enterprise Data Warehouse. Start med en lille løsning og udbyg løbende. Mange datakilder Mange subjects eller forudsætningsfri omkring emner Ofte baseret på en normaliseret model

Data Mart En relativt lille data warehousing løsning ”Altid” baseret på en dimensionel model. Koncentrere sig om et enkelt eller få emner/subjects og/eller en enkelt afdeling Kort implementeringstid (måneder)

Data Mart Uafhængig data mart Afhængig data mart Datakilder er OLTP-systemer Afhængig data mart Datakilden er en virksomheds (Enterprise) Data Warehouse

Operational Data Store (ODS) Anvendt til at give adgang til data fra forskellige kilder meget hurtigt – fra få sekunder til enkelte timers forsinkelse Der foretages relativt få transformeringer Kan være datakilde til Data Warehouse

Forskellige arkitekturer Rapportering direkte fra kilder Uafhængige Data Marts Centralt Data Warehouse Hub-and-spoke

Rapportering direkte fra kilder Fordele: Hurtigt og billigt at implementere Ingen vedligeholdelse af redundante data Adgang til realtids data Adgang til alle operationelle data Ulemper: Kan være besværligt rent teknisk Kan være et sikkerhedsproblem Ikke muligt at ”berige” data Svært at sammenstille data på tværs af kilder Dårlige svartider på rapportkørsler Kan forstyrre driften af de operationelle systemer Manglende adgang til de historiske data

Uafhængige Data Marts Fordele ved arkitektur: Ulemper ved arkitektur Hurtig implementering Omkostningseffektivt Hurtigt synligt udbytte Gentagelig proces Ulemper ved arkitektur ”Ø’er” af data Ingen helhedsbetragtning Ingen synergieffekter Udtræk fra kildesystemer Transformering og rensning af data Ufuldstændige metadata

Centralt Data Warehouse Fordele ved arkitektur Centraliseret kontrol Helhedsbetragtning Konsistente metadata Dataintegritet Ulemper ved arkitektur Uoverskuelig model at trække beslutningsdata ud af Længere forespørgseltid Der tages måske ikke hensyn til individuelle behov Prioriteringsproblemer ved opbygning Svært at styre

Hub-and-spoke Fordele ved arkitektur Ulemper ved arkitektur Centraliseret kontrol Helhedsbetragtning Konsistente metadata Dataintegritet Individuelle behov opfyldes i data marterne Ulemper ved arkitektur Omfattende løsning Ressourcekrævende

Bill Inmons ”Corporate Information Factory” arkitektur Exploration Warehouse Data Mart Stjerneskema RDBMS / OLAP Slutbrugeradgang Kildedata Data Mining Rapporterings- værktøj Slutbruger- applikationer (Enterprise) Data Warehouse Emneorienteret Integreret Normaliseret Fuld historik RDBMS Ingen slutbrugere Operational Data Store Aktuelle data Lille/ingen forsinkelse OLAP Staging area Extraction, Trans- formation, Loading

Ralph Kimballs data warehouse arkitektur Lager flade filer RDBMS Databehandling Rensning Integrering Strukturering Standardisering Conformed dimensions Ingen slutbruger- adgang Data mart #1 Slutbrugeradgang Stjerneskema Emneorienteret RDMBS / MOLAP Del af DW Bus Data mart #2 Kildedata OLAP Rapporterings- værktøj Slutbruger- applikationer Modeller, Forecast Fordeling, Data mining Kildesystemer Data Staging Area Data Warehouse Præsentationsservere DW Bus

Implementering af Data Warehouse

Implementering af Data Warehouse Fastlæggelse af den problemstilling man søger at løse. Er data warehouse overhovedet en relevant Planlægge hvor mange ressourcer man vil afsætte til opgaven Opbygge viden internt i virksomheden/organisationen Hyre eksterne konsulenter til opgaven Valg af data warehouse arkitektur Bestemme om Data Warehouse skal implementere på en gang eller gennemgå en iterativ proces

Implementering af Data Warehouse Logisk design af target med udgangspunkt i de behov der skal opfyldes. Skal data opsummeres i Data Warehouse eller beholdes på transaktionsplan? Fastlæggelse af dimensioner og fakta Foretag kildeanalyse og find ud af om der kan findes kilder til dække alle databehovene Kilder kan både være interne og eksterne Hvis behovene ikke dækkes vil man så reevaluere designet af target eller arbejde på at indarbejde de nye behov i OLTP-systemerne Er datakvaliteten i orden i kilderne

Implementering af Data Warehouse Udarbejd ETL-processer til at overføre data fra kilder til data warehouse Hvordan skal data renses for fejl i kildedata. Hvordan skal data transformeres til analysebehov? Sammen med kildeanalysen er dette den væsentligste del af opgaven med at opbygge et data warehouse. Træk data ud fra data warehouse til præsentations- og analyseprogrammer. Udarbejd standardrapporter og gør det muligt for superbrugere selv at udvikle rapporter Hav en række testbrugere til at teste resultatet. Er rapporterne anvendelige Er data i rapporterne valide

Implementering af Data Warehouse Automatiser ETL-processen, så den foregår på et tidspunkt, hvor det ikke vil genere almindelige brugeres anvendelse af kildesystemerne. Undervis brugere i anvendelse af rapporterings- og analyseværktøjer Evaluering af implementeringsprocessen Hvis en iterativ implementeringsproces er valgt, så fortsæt med næste område. Foretag løbende tilpasninger data warehouset og ETL-processen, hvis der sker ændringer i analysebehovet og/eller kildegrundlaget.

Andre begreber indenfor eller med relation til Data Warehousing/BI Enterprise Application Integration (EAI) Enterprise Information Integration (EII) Realtime Data Warehousing Master Data Management (MDM) Customer Data Integration (CDI) Product Information Management (PIM) / Product Data Integration (PDI) Etc.

Litteratur Ralph Kimball et al. W. H. Inmon The Data Warehouse Toolkit The Complete Guide to Dimensional Modeling The Data Warehouse Lifecycle Toolkit Expert Methods for Designing, Developing, and Deploying Data Warehouses The Data Warehouse ETL Toolkit Practical Techniques for Extracting, Cleaning, Conforming, and Delivering Data W. H. Inmon Building the Data Warehouse