Præsentation er lastning. Vent venligst

Præsentation er lastning. Vent venligst

Hvorfor Datawarehouse Hvad er det totale salg i område A? Hvilken sælger fik højeste kommission i denne måned ? Hvordan har salget i region A ændret sig.

Lignende præsentationer


Præsentationer af emnet: "Hvorfor Datawarehouse Hvad er det totale salg i område A? Hvilken sælger fik højeste kommission i denne måned ? Hvordan har salget i region A ændret sig."— Præsentationens transcript:

1 Hvorfor Datawarehouse Hvad er det totale salg i område A? Hvilken sælger fik højeste kommission i denne måned ? Hvordan har salget i region A ændret sig over de sidste 5 år? Hvordan har sælgerne i område B klaret de sidste 2 år sammen- lignet med dem i område A Hvilket produkt vil sælge bedst næste år? Spørgsmål man ikke umiddelbart kan få svar på i ERP systemer

2 Datawarehouse karakteristika Data er kategoriseret og lagret ud fra forretningsområder ikke ud fra operationelle applikationer Data vedrørende et givet emne er defineret og lagret én gang Data er lagret som en serie af snapshots, som hver repræsenterer et tidsinterval Data vil ikke blive opdateret eller slettet

3 Datawarehouse Datawarehouse omfatter hele den proces, der skal gennemløbes, når data bearbejdes til brugbar information dvs. – Dataidentifikation – Datafangst – Datatransformation – Evt beregninger – Præsentation og distribution af information

4 Databaserne OLTP = On-Line Transaktion Processing – ERP databasen er designet til udtræk af data der understøtter de operationelle arbejdsprocesser OLAP = On-Line Analytical Processing – Datawarehouse databasen er designet til udtræk af data der understøtter analytiske sammenhænge

5 Operationelle contra Warehouse

6 Datawarehouse miljø ERP system Øvrige interne og externe kilder OLAP database Fysiske og metadata (beskrivelse af data) Datafangst DatalagringAnvendelse Rapport generator Analyseværktøj 3.Parts produkter

7 Data anvendelse Rapportgenerator – Forklare hvad der skete Analyseværktøj – Forklare hvor det skete – Forklare hvad der vil ske (datamining) Ser efter skjulte mønstre i data

8 Datawarehouse projekt Afklaring af rammer – Formulering af overordnede mål Kravspecifikation – Forretningsmæssige krav – IT mæssige krav – Tidsmæssigekrav Design Udvikling Review – Vurdering af det iterative forløb – Holder kravspecifikationen Afklaring af rammer Kravspecifikation Design Udvikling Review Implementering Vedligeholdelse og drift

9 Data Mining Data mining er automatisk vidensopdagelse Klassificering – Inddel data ind i foruddefinerede klasser Forudsigelse – Forudsig/estimer ukendt værdi baseret på lignende tilfælde Sammenligning – Finder ligheder/forskelle imellem klasse og konstrastklasse Gruppering – Inddel data i grupper så ligheden indenfor de enkelte grupper er størst mulig og ligheden mellem grupperne er mindst mulig Sammenhænge – Finder sammenhænge/afhængigheder mellem data

10 Eksempler Walmart: USAs (og verdens) største supermarkedskæde Har DW med alle kassetransaktioner for de sidste 2 år (70TB!) Bruger mining intensivt for at opnå forretningsfordele Analyse af sammenhænge indenfor kassebon’er Opdagelse: Øl og bleer ofte på samme bon Mænd køber bleer med hjem, og skal ”lige ha’ en bajer med” Stil de dyre øl ved siden af bleerne Stil øl et stykke væk fra bleerne, med chips og videofilm imellem! Weblog mining Hvad er sammenhængen mellem tid på dagen og requests? Hvilke brugergrupper tilgår mit websted? Hvor mange requests får mit websted om en måned?

11 Form og farve til uoverskuelige statistikker Store mængder af statistiske data kan være umulige at overskue og finde den sammenhæng i, der fører til en passende diagnose. Aalborg Universitet forsker bla. i 3D Visual Data Mining. Der skabes kunstige verdener, hvor statiske data repræsenteres som tredimensionelle, visuelle objekter. Objekter med egenskaber, for eksempel farve, form, orientation og tekstur. En visuel repræsentation giver analytikeren muligheder for at se forbindelser i større mængder data.

12 Alert projekt Data fra biomedicinske databaser kan sikre tidlig påvisning af bivirkninger Projektet har til formål at udvikle et nyskabende computerprogram, der kan påvise bivirkninger bedre og hurtigere end de nuværende indrapporteringssystemer. For at nå målet, vil ALERT udnytte kliniske data i elektroniske patientjournaler fra mere end 30 millioner europæere (danskere, hollændere, englændere og italienere). ALERT vil benytte data mining computerteknik til at analysere de elektroniske data med det formål at opdage kombinationer af medicin og mistanke om bivirkninger, som giver anledning til nærmere undersøgelse.


Download ppt "Hvorfor Datawarehouse Hvad er det totale salg i område A? Hvilken sælger fik højeste kommission i denne måned ? Hvordan har salget i region A ændret sig."

Lignende præsentationer


Annoncer fra Google