Gerth Stølting Brodal Aarhus Universitet Science Center Sorø - 4. september 2009.

Slides:



Advertisements
Lignende præsentationer
Naturgeografi Jordens og livets udvikling samt menneskets tilpasning set i et geologisk og aktuelt samfundsmæssigt perspektiv Altså handler geografi om.
Advertisements

1 Problemkompleksitet 2 Problemers kompleksitet En ineffektiv algoritme: køretiden vokser eksponentielt med input- størrelsen Et problem, der ikke kan.
GeoGebra Som basis for den daglige undervisning i C-niveau og B-niveau
Computerens Anatomi At vælge den korrekte computer
Hvad er et problem ? Et problem er i sin negativt ladede betydning en for nogle utilfredsstillende situation. Et problem er i sin positivt ladede betydning.
DTU uddannelser Per Knudsen 12. januar 2010.
MapReduce implementationer MapReduce Hadoop Apache open source projekt.
Perspektiverende Datalogi Internetalgoritmer MapReduce Gerth Stølting Brodal.
Computer anatomi Vi skal kigge lidt nærmere på kabinens grundlæggende indhold. Tryk på F5 for fuld skærmbillede Skift til næste dias (Museklik) for et.
Forskning og uddannelse uden grænser – to globale initiativer Rektor Lauritz B. Holm-Nielsen, Aarhus Universitet Næstformand for Rektorkollegiet Medlem.
Algoritmer og Datastrukturer 1...mere Sortering [CLRS, kapitel 8] Gerth Stølting Brodal.
25. FEBRUAR 2011 AARHUS UNIVERSITET Aarhus Universitets strategi AARHUS UNIVERSITET.
Implementering af brandingstrategi på nettet
INFORMATIONSMØDE Revideret kandidatuddannelse Ny studieordning 13. Marts i København 20. Marts i Aalborg.
Fagets Informations Teknologi Introduktion til Programmering i Java For Industri, Global Forretningsudvikling, samt fri studie aktivitet ved Bent Thomsen.
INFORMATIONSMØDE PURE4 / TYPO3 m.v.
AARHUS UNIVERSITET Centre for Science Education 27. marts 2009 Centre for Science Education Michael E. Caspersen Centerleder
Kandidatorientering, 2. november 2012 Algoritmer og Datastrukturer Gerth Stølting Brodal Institut for Datalogi Aarhus Universitet.
De naturvidenskabelige kompetencer og erhvervsudviklingen – et samspil v. Udviklingschef Søren Ring, Region Hovedstaden.
Orientering fra bestyrelsesmøde 3. november 2006 Medarbejdermøde.
Datastruktur & Algoritmik1 Datastruktur & Algoritmik 99 Kim Guldstrand Larsen.
Aarhus Universitet AU Uddannelser med væsentligt indhold af geoinformatik.
Algoritmer (v. lektor Gerth S. Brodal) Hør om metoder til at beregne gode GPS kørevejledninger og tog- og flyforbindelser, og hvad problemstillingerne.
Perspektiverende Datalogi Klassiske Algoritmer
Beskrivelses- og analyse-teknikker understøttet af Oracle Designer
Csaudk 1 NOV 2010 DATALOGISK INSTITUT DET NATURVIDENSKABELIGE FAKULTET AARHUS UNIVERSITET KANDIDATORIENTERING 1. Nov 2010.
Algoritmer og Datastrukturer 1...mere Sortering [CLRS, kapitel 8] Gerth Stølting Brodal.
Kandidatorientering om PhD studier ved Datalogisk Institut Aarhus Universitet.
Perspektiverende Datalogi Internetalgoritmer MapReduce Gerth Stølting Brodal.
Algoritmer og Datastrukturer 1 Gerth Stølting Brodal Aarhus Universitet.
FARMA SF 2011 Det Farmaceutiske Fakultet Forskningsformidling ”Formidlingsforpligtigelses -ja tak” Sven Frøkjær 23. marts 2011.
Algoritmer og Datastrukturer 1 Gerth Stølting Brodal.
Fundamentale datastrukturer
© (2001) Jesper Kjeldskov, Mikael Skov, Jan Stage 1.1 Usability Engineering 1. INTRODUKTION l Menneske-maskin interaktion (HCI) l Oversigt l Mål for design.
Algoritmer og Datastrukturer 2 Maksimale Strømninger [CLRS, kapitel ] Gerth Stølting Brodal Aarhus Universitet Ford-Fulkerson.
Lauritz B. Holm-Nielsen, rektor Forberedelsesudvalget Region Midtjylland A A R H U S U N I V E R S I T E T Aarhus Universitet  studerende pt. 
Employer Branding, Gå-hjem-møde, ASBccc 7. maj 2008 Employer Branding Gå-hjem-møde, 7. maj 2008 Helle Kryger Aggerholm, ph.d.-studerende Mona Agerholm.
Lauritz B. Holm-Nielsen, rektor Lederudvikling, 2. oktober2006 AARHUS UNIVERSITET Lederudvikling forventninger til ledelsen i universitetets strategiske.
DMU den 2. januar 2007 Lauritz B. Holm-Nielsen A A R H U S U N I V E R S I T E T Aarhus Universitet 2007.
1 Fundamentale datastrukturer. 2 Definitioner: abstrakt datatype, datastruktur Elementære datastrukturer og abstrakte datatyper : arrays, stakke, køer,
7. MARTS 2011 AARHUS UNIVERSITET Aarhus Universitets strategi AARHUS UNIVERSITET.
Algoritmer Gerth Stølting Brodal Institut for Datalogi Aarhus Universitet MasterClass i Matematik, 10. april 2014, Aarhus Universitet.
Et eller andet datalogi… Gerth Stølting Brodal Institut for Datalogi Aarhus Universitet Voronoi Diagrammer Datalogi, Studiestart 2013.
Algoritmer og Datastrukturer 1 Union-Find [CLRS, kapitel ] Gerth Stølting Brodal Aarhus Universitet.
Algoritmer og Datastrukturer 1 Quicksort [CLRS, kapitel 7] Gerth Stølting Brodal.
Flakkebjerg 2 marts 2007 Lauritz B. Holm-Nielsen A A R H U S U N I V E R S I T E T Aarhus Universitet 2007.
Collaborative Practice Research Lars Mathiassen eCommerce Institute, Georgia State University.
Algoritmer og Datastrukturer 1 Union-Find [CLRS, kapitel ] Gerth Stølting Brodal Aarhus Universitet.
Algoritmer og Datastrukturer 1 Gerth Stølting Brodal.
Aarhus Aros Rotary Det gode forsker- og studieliv.
Algoritmer og Datastrukturer 1 DAIMI Greylisting Gerth Stølting Brodal Aarhus Universitet.
Algoritmer og Datastrukturer 2 Grådige Algoritmer [CLRS, kapitel ] Gerth Stølting Brodal Aarhus Universitet.
Algoritmer og Datastrukturer 1 Gerth Stølting Brodal Aarhus Universitet.
Hjemmet som et Distribueret System Jonas Thomsen Ph.d. studerende Center for Pervasive Computing.
Ændr 2. linje i overskriften til AU Passata Light 10. MARTS 2016 BIG BANG 2016 LEKTOR EMERITA HELENE SØRENSEN AARHUS UNIVERSITET AU HVAD KAN PISA BRUGES.
Er samarbejde med virksomheder og universiteter afgørende for at sikre interessen og relevansen i gymnasiets undervisning? Anvendelsesorientering i de.
Uddannelse til bæredygtig omstilling Universiteternes bidrag Ulrik Jørgensen, prof., centerleder DIST, Aalborg Universitet København 1 Ulrik Jørgensen.
Effektiv vækst - Workshop
Datalogi Tutor gruppen spurgte om jeg ville holde et oplæg – og gav mig helt frie hænder. Tre muligheder var nærliggende: Introducerende foredrag over.
Problem med at følge de konstant voksende datamængder
Algoritmer og Datastrukturer 1
Algoritmer og Datastrukturer 1
Algoritmer og Datastrukturer 1
Climate Change, STX Fysik C
Binomialfordelinger i NetLogo
Grundlæggende Algoritmer og Datastrukturer
Brydning af lys Introduktion Beskrivelse af aktiviteten
Parameterfremstilling og punktmængde
LightAtomsBasic Introduktion: atomer og fotoner (fysik)
Enzymers virkemåde og aktivitet under forskellige forhold
Præsentationens transcript:

Gerth Stølting Brodal Aarhus Universitet Science Center Sorø - 4. september 2009

Overblik  Hvem er jeg ?  Hvad er MADALGO ?  Algoritmiske problemstilling ?  Vidensspredning

Cand. scient., Aarhus Universitet 1994 Ph.d., Aarhus Universitet, 1997 Lektor, Aarhus Universitet, Gerth Stølting Brodal

 Computere og censorer anvendes overalt  Øgede muligheder for at indsamle/gemme/behandle data → Massive data tilstede overalt  Samfundet mere og mere “datadrevet” → Tilgå/behandle data overalt til enhver tid Nature – 2/06: “2020 – Future of computing” – 9/08: “BIG DATA”  Videnskabelig data vokser eksponentielt, mens kvalitet og tilgængelighed forbedres  Paradigmeskift: Videnskab vil blive om datamining → Datalogi altafgørende i alle videnskaber Center motivation: Massive Data

Massive Data Eksempler  Telefon: AT&T 20 TB telefonopkalds database, trådløs sporring  Forbrugere: WalMart 70 TB database, købsmønstre  WEB: Google indeks med »8 milliarder websider  Bank: Danske Bank 250 TB DB2 database  Geografi: NASA sateliter genererer terrabytes hver dag

 Center ved  Lars Arge, Professor, Centerleder  Gerth S. Brodal, Lektor  5 post docs., 13 ph.d. studerende, 2 kandidat studerende, 4 TAP  Total budget for 5 år ca. 60 millioner kr  Overordnede mål – Fremme den algoritmiske viden inden for processering af massive data – Træning af forskere i et verdensførende miljø – At være katalysator for multidisciplinære samarbejder Lars Arge

 Etableret 1991 – 2 milliarder kr – Yderligere 3 milliarder i 2009  Støtter – Grundforskningscentre (“Center of excellence”) – Højt profilerede gæsteprofessorer – Ph.d. skoler  Center of excellence – Grundforskning i verdensklasse – 5 år; nogle forlænges med yderligere 5 år – P.t. ca. 40 centre – Gennemsnitlige 5 års bevilling på ca. 40 million kr

AU MPI MIT Arge Brodal (AU) I/O, cache, og algoritme engineering Mehlhorn Meyer (MPI) (FRA) I/O og algoritme enginnering Demaine Indyk (MIT) (MIT) Cache og streaming MADALGO kerneforskere

Center Aktiviteter  Besøg af kerneforskerne  Udveksling af AU, MPI, FRA og MIT post docs. og ph.d. studerende  Gæsteophold af forskere og studerende fra andre institutioner  Diverse workshops – Incl. multidisciplinære og i samarbejde med industrien  Førende internationalle begivenheder: – 25 th Annual Symposium on Computational Geometry in 2009 – Workshop on Algorithms for Massive Datasets in 2009  Sommerskoler – 2007: Streaming algorithms – 2008: Cache-oblivious algorithms

Center samarbejder  COWI, DHI, DJF, DMU, Duke, NSCU  Finansering fra det Strategiske Forskningsråd og US Army Research Office  Software platform for Galileo GPS – Adskillige danske akademiske/industrielle partnere – Finansering fra Højteknologi Fonden  Europæisk netværk om massive data algoritmik – 8 førende europæiske forskningsgrupper

Algoritmiske Problemstilling

Problemet... datastørrelse køretid Normal algoritme I/O-effektiv algoritme størrelsen af hukommelsen

Hvad er flaskehalsene ? datastørrelse køretid

Hukommelseshierarkier Processor L1L2 A R M L3Disk flaskehals voksende tilgangstid og hukommelsesstørrelse CPU

Hukommelseshierarkier vs. Køretid datastørrelse køretid L1 RAM L2L3

Algoritmik  Central betydning for skalerbarhed/effektivitet → Algoritmik centralt datalogisk område  Traditionel algoritmik: Transformer input til output ved anvendelse af en simpel maskinmodel  Utilstrækkelig til f.eks. – Massive data – Små/varierende maskiner – Kontinuære datastrømme → Software med begrænsninger!  Faglige grupperinger har arbejdet med disse mangler – men meget mangler stadig at blive løst

I/O-Effektivite Algoritmer  Problemer involverende massive data på disk  Tilgang til disk er 10 6 gange langsommere end hukommelsen  Dyr tilgangstid amortiseres ud ved at overførre store blokke af data → Altafgørende at udnytte blokkene når data gemmes/tilgås  I/O-effektivie algoritmer: – Flytte så få blokke som muligt for at løse et givet problem “Forskellen i hastighed mellem moderne CPU- og diskteknologier svarer til forskellen i hastigheden mellem at spidse sin blyant med sin blyantspidser på sit skrivebord og at tage et fly til den anden side af jorden og anvende en anden persons blyantspidser på dennes skrivebord.” (D. Comer)

I/O-Effektive Algoritmer: I/O-model  Model parametre – N= # elementer i input – B = # elementer I en disk blok – M = # elementer i intern hukommelse  Mål: Minimer # I/O – Flyt B sammenhængende elementer mellem hukommelsen og disk  Typiske teoretiske grænser: – Sortering: – Søgning: O(log B N) – Prioritets køer: amortiseret D P M Blok I/O

MADALGO Fokusområder Cache Oblivious Algoritmer Streaming Algoritmer Algoritme Engineering I/O Effektive Algoritmer

I/O-Effektive Algoritmer Gør Forksel  Eksempel: Gennemløb en kædet liste – Problemstørrelse N = 10 elementer – Diskblokstørrelse B = 2 elementer – Hukommelsesstørrelse M = 4 elementer (2 blokke)  Forskellen mellem N og N/B stor da blokstørrelsen er stor – Eksempel: N = 256 x 10 6, B = 8000, 1ms disk tilgang  N I/O tager 256 x 10 3 sek = 4266 min = 71 timer  N/B I/O tager 256/8 sek = 32 sek Algoritme 2: N/B = 5 I/OAlgoritme 1: N = 10 I/O

Cache-Oblivious Algoritmer  Hvis problemer skal løses på ukendte eller ændrende maskiner  Bloktilgang er vigtig på alle niveauer i hukommelseshierarkiet – Men hukommelseshierarkier er meget varierende  Cache-oblivious algoritmer: – Brug alle blokke effektivt på alle niveauer i ethvert hukommelseshierarki

– Design/implementation af praktiske algorithmer – Eksperimenter  Center motiveret ved teoretiske mangler  Center promoverer interdisciplinær/industrielt arbejde → Naturligt at lave algorithm engineering  Algorithm engineering – Ofte værdifuld input til teoretisk arbejde f.eks. til design af bedre beregningsmodeller – Nogle gange praktiske gennembrud f.eks. MADALGOs terræn data implementation Algoritme Engineering

Hurricane Floyd Sep. 15, :007:00

Massive Terræn Data

Terræn Data  Nye teknologier: Meget nemmere/billigere at indsamle detaljeret data  Før ‘manuel’ eller radarbaserede metoder – Ofte 30 meter mellem datapunkter – Nogle gange 10 meter data tilgængelig  Nye laserskannings metoder (LIDAR) – Mindre end 1 meter mellem datapunkterne – Præcision i centimeter (hidtil meter) Danmark  ~2 millioner punkter v. 30 meter («1GB)  ~18 milliarder punkter v. 1 meter (»1TB)  COWI (og andre) skanner nu DK  NC skannet efter Hurricane Floyd i 1999

Simulering af Oversvømmelse  Ikke alt terræn over højde h bliver oversvømmet når vandet stiger h meter!  Teoretisk ikke så hårdt at beregne områderne der oversvømmes når vandet stiger h meter – Men ingen software kunne gøre det for Danmark ved 2-meter opløsning  Anvend I/O-effektiv algoritme  Danmark på én dag

29 Oversvømmelse af Danmark +1 meter +2 meter

30  Begræbsmæssigt bliver strømninger modelleret ved to attributer: – Retning: Retningen vandet flyder i et punkt – Akkumulation: Mængden af vand der strømmer igennem et punkt  Bruges til at beregne andre hydrologisk attributer: afvandingsnetværk, topografisk konvergensindeks… Eksempel: Terræn Strømninger

 Mange anvendelser: – Forudse områder der er i risikogruppen for at blive oversvømmet – Forudse strømninger – Beregn vandskel – Forudse erosion – Forudse vegegations udbredelsen – …… Eksempel: Strømninger på terrænger

TerraStream Terræn Software  Skalerbar, generelt, porterbar, håndtering af datafejl  Pipeline af massive terræn data processerings software Demo:

Opsummering  Massive datamængder forekommer overalt  Medfører skaleringsproblemmer – pga. hierarkisk hukommelse og langsom I/O  I/O-effektive algoritmer giver en signifikant forbedring af skalerbarhed  Nyt forskningscenter fokuserer på algoritmiske emner inden for massive data

Vidensspredning

 Folkeskolepraktik  Gymnasiepraktik  UNF foredrag om internetsøgemaskiner  ACM programmeringskonkurrence  Perspektiverende datalogi kursus

Tak ! Spørgsmål, hvad nu? Gerth Stølting Brodal, MADALGO, Aarhus Universitet

Science Center Danmark DAIMIs bidrag = giv lærerne en forståelse for hvordan de kobler det med deres undervisning i gymnasiet. Science gymnasier = gymnasier med specielt fokus på naturvidenskab. Master Classes findes på SSC som er et udbud for de bedste fra gymnasiet. En Master Class = udvalgte studerende fra fem gymnasier, ca totalt 25 studerende. 1) besøg på virksomhed, 2) AU besøg, heraf MAT+DAIMI 2 time, 3) Sorø i 2-3 dage. Fredag : Hvad er er algoritmik? Relation til Matematik? MADALGO i perspektiv.