Det semantiske web og XML Costanza Navarretta Center for Sprogteknologi, Københavns Universitet

Slides:



Advertisements
Lignende præsentationer
Introduktion til HTML HTML dokumentets struktur & Indhold.
Advertisements

Introduktion til CSS Godt i gang med CSS. 201 – V1 – Introduktion til CSS Hvad er stylesheet?
Hjemmesidekonstruktion Tjekspørgsmål 1.Hvad er et markup-sprog – hvad bruges det til? 2.Hvad er forskellen mellem et markup-sprog og et scriptsprog? 3.Hvad.
Afklaring Ekspertpanelet peger på begrebet "Semantisk interoperabilitet" som et møde mellem den strukturede verden og den kaotiske verden, på en måde så.
Introduktion til HTML Hypertekst referencer. Uden links – Hypertekst referencer – intet world wide web. World wide web er et Hypermedium….. Link definition.
IT i Byggeriet Semester kursusgang Introduktion til projektweb og html Kjeld Svidt Kjeld Svidt  Institut for Bygningsteknik  Aalborg.
PDF/A Skal - Skal ikke? v/ René Mittå Specialkonsulent
Sikring af tilgængelighed er en proces!
Formularer (Access, del 3)
Dias 1 Lene Offersgaard Center for Sprogteknologi, Københavns Universitet WP 5.2 Kortlægning af eksisterende resurcer/collections.
OPFINDELSEN AF WEBBEN JOEK © TEC 2011 WWW blev opfundet i 1990 af Tim Berners-Lee. Berners- Lee var en fysiker ved CERN, det europæiske laboratorium for.
Trivselsundersøgelse og ledelsesevaluering
TEST 3 modul 1 20 spørgsmål. Du skal klikke med musen på det rigtige svar, så kommer du automatisk til næste spørgsmål Klik for start.
SQL 1 DDL og DML.
XML 1.
SEO PÅ AU.
Statistik.
Fra Internet til semantisk web via taksonomier AF:Hosein Askari ITST.
Kursus om borger.dk og brugen af digital signatur
Introduktion/Otto Knudsen 1 Overblik WebForms ASP.NET.
Introduktion til Access (Access, del 1)
Opslagsfelter (Access, del 6). RHS – Informationsteknologi 2 Udgangspunkt Vi er ofte i den situation, at valg af en type for et felt ikke begrænser vores.
Rapporter (Access, del 5)
Køb og drift af tilgængelige netsteder lbc/ /2.0.
Anvendelser af Web- sprog; Ontologier Costanza Navarretta Center for Sprogteknologi Københavns Universitet
XML1 4.7 XML and Its Data Model. XML2 Introduktion til XML, 178 XML = eXtensible Markup Language Markup language –sprog, hvor data "pakkes ind" i tags.
XML1 4.7 XML and Its Data Model. XML2 Introduktion til XML, 178 XML = eXtensible Markup Language Markup language –sprog, hvor data "pakkes ind" i tags.
Introduktion til XML.
FEN Rekursion og induktion1 Induktion og (især) rekursion Mange begreber defineres ud fra en basis og så en gentagen anvendelse af et antal regler.
Trivselsundersøgelse og ledelsesevaluering Anæstesiologisk Afdeling Flere ledere
ALEPH GUI & XML Arkitektur XML/XSL XSL editor. eLib seminar 18.–19. november 2004 SERVER KLIENT GUI, Job manager, Print Dæmon PrintFile (Udskrifter) XML.
1 Webdesign - De første trin Grundliggende begreber Internettet (1969-): En fællesbetegnelse for netværk eller tjenester der benytter samme.
Rammeformater og indholdsformater
Øvelsesgang 1 - DWDK Rikke Poulsen. Timernes indhold supplement til læsningen og forelæsningen Jeres behov? Gennemgang af opgaverne? Andre emner, i vil.
Sensus Hyppige brud på retningslinierne for tilgængelighed - WCAG Helene Nørgaard Bech Sensus ApS.
1 HMAK XMLRelationel model og XMLNOEA / PQC 2005 SQLServer og XML Hent data via URL Generering af xml –Raw –Auto –Explicit Hent data via template Evt.
XML Schema og RDF Costanza Navarretta Center for Sprogteknologi, Københavns Universitet
Det semantiske web Costanza Navarretta Center for Sprogteknologi, Københavns Universitet
FOVITS: Informationshåndtering på nettet - sprogteknologiske løsninger 9933 RDF I XML og RDFS Costanza Navarretta Center for Sprogteknologi, Københavns.
Globaliseringsredegørelsen 24.mar. 14 Figurer fra Danmark tiltrækker for få udenlandske investeringer i Sådan ligger landet
1 Sortering I elementære metoder. 2 Plan Terminologi Elementære metoder til sortering -sortering ved udvælgelse -sortering ved indsættelse -Shellsort.
Videregående pc-vejledning Modul 06: Netværk WWW = World Wide Web 60+Bornholm.
ALEPH og XML. eLib Seminar 18 – 19 november 2004 ALEPH og XML Status  Print system arbejder med XML lignende mellem filer.  Færdige printfiler kan gemmes.
HTML intro Dag 1. Client – Server miljø Client Server Klient ◦ Hardware (Screen size, colors, processor…) ◦ Platform (Mac, Windows, Linux…) ◦ Browser.
XML Rasmus D. Lehrmann DM Indhold Hvad er XML? XML standarder Hvor bruges XML? XML struktur Træ struktur Element & Attribute Syntaks i XML Stylesheets.
XML og Skemaer Costanza Navarretta Center for Sprogteknologi, Københavns Universitet
MSBuild & Team Build i C#/C++ solutions VSTS ERFA d. 25 November.
Rapporter (Access, del 5). RHS – Informationsteknologi – Udgangspunkt Vi har oprettet en database Vi har defineret en eller flere tabeller, og.
XML Schema og RDF Costanza Navarretta Center for Sprogteknologi, Københavns Universitet
Grunde til at jeg elsker dig
Fundamentale datastrukturer
Opslagsfelter (Access, del 6). RHS – Informationsteknologi – Udgangspunkt Vi er ofte i den situation, at valg af en type for et felt ikke begrænser.
Introduktion til Access (Access, del 1). RHS – Informationsteknologi – Fra design til udvikling Vi ved nu, hvordan vi finder et design for en database,
Interaktionsformer En begrebsmæssig model kan understøttes med forskellige interaktionsformer Interaktionsformen fastlægger centrale egenskaber: Hvordan.
1 Team Build med Team Foundation Server 2008 Konfiguration og udvidelse af build jobs Kort præsentation Hvorfor bruge Team Build Afvikling af et build.
1 Fundamentale datastrukturer. 2 Definitioner: abstrakt datatype, datastruktur Elementære datastrukturer og abstrakte datatyper : arrays, stakke, køer,
IT i Byggeriet Semester kursusgang Introduktion til projektweb og html Kjeld Svidt Kjeld Svidt  Institut for Bygningsteknik.
DIEB4.1 Kursusgang 4 Oversigt: Sidste kursusgang Opgaver Aktivitet 2: Generer design (fortsat) Design af interaktionselementer.
DWDK Øvelsesgang 2. Tegnsæt: utf-8 vs. iso Utf-8 = universelt tegnsæt Giver advarsel i validator Dokument skal gemmes i utf-8 format i notepad.
Grundlæggende XML og XML- baserede teknologier til textmodellering DTD 2. kursusgang (7/ )
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation og dataproblemer 2. november 2004.
Fremstilling af Simple WEB steder [ITPL] Foråret 2004
IT i Byggeriet Semester kursusgang Introduktion til projektweb og html Kjeld Svidt Kjeld Svidt  Institut for Bygningsteknik  Aalborg.
Organisering og navigation Ole Gregersen 22. Februar 2006 Usability.
DIEB4.1 Kursusgang 4 Oversigt: Sidste kursusgang Opgaver Aktivitet 2: Generer design (fortsat) Design interaktionselementer Analysedokumentet.
DWDK – øvelsestime 3 CSS – let the fun begin!!. Tilgængelige slides Disse slides ligger på mit public drev
Kjeld Svidt  Institut for Byggeri og Anlæg  Aalborg Universitet IT i Byggeriet Semester kursusgang Introduktion til projektweb og html Kjeld.
Kjeld Svidt  Institut for Byggeri og Anlæg  Aalborg Universitet IT i Byggeriet Semester kursusgang Projektweb og html (fortsat) Kjeld Svidt.
23. juni 2015 Det Semantiske Web Mads Carlsen. 23. juni 2015 Problemer med det nuværende Internet Ingen semantiske specifikationer. Søgning giver mange.
Præsentationens transcript:

Det semantiske web og XML Costanza Navarretta Center for Sprogteknologi, Københavns Universitet

C. Navarretta: Noter om Semantic Web og XML 2 Indhold hvad er det semantiske web? den oprindelige vision hvordan kan visionen realiseres? hvad har man gjort? fremtiden introduktion til XML elementer, attributter, opmærkning, velformede dokumenter

C. Navarretta: Noter om Semantic Web og XML 3 Hvad er det semantiske web? Initiativ fra W3C, et konsortium af offentlige og private organisationer fra hele verden stiftet i 1994 ( MIT-CERN-DARPA-EU).W3C W3Cs overordnede formål er at forbedre udveksling og anvendelsesmuligheder af resurser på nettet.formål Det semantiske webs hjemmeside

C. Navarretta: Noter om Semantic Web og XML 4 Visionen: det semantiske web Fremtidsorienteret vision om et web hvor dataresurserne kan anvendes på en "intelligent" måde af både mennesker og maskiner, også i form af agenter. Den viden som er “gemt” i data skal udnyttes.

C. Navarretta: Noter om Semantic Web og XML 5 Vision, behov og nutid Det semantiske web bygger på en vision, men visionen kommer ud fra et reelt behov: at kunne udnytte den viden som er implicit i de store mængder data som findes på internettet. Det semantiske web er en igangværende udvidelse af det web, som findes i dag.

C. Navarretta: Noter om Semantic Web og XML 6 Hvordan kan visionen realiseres? Semantikken (betydningen) i resurserne på internettet skal gøres eksplicit. Resultatet vil være et netværk af semantisk opmærket viden (det semantiske web). For at kunne bruges af programmer, skal viden være opmærket på standardiserede måder og organiseret i fx domæne-specifikke ontologier, som kunstige agenter kan anvende på tværs af sprog og systemer.

C. Navarretta: Noter om Semantic Web og XML 7 3WC-initiativer 1.Definition af et XML-baseret standardsprog for at beskrive semantikken af resurserne (XML er standardsyntaksen for resurser på internettet). 2.Definition af et XML-baseret standardsprog for at formalisere ontologier. 3.Fastsættelse af protokoller til udveksling af semantiske resurser.

C. Navarretta: Noter om Semantic Web og XML 8 Resultater: specifikationer RDF/XML Syntax Specification (Revised) RDF Vocabulary Description Language 1.0: RDF Schema RDF Primer Resource Description Framework (RDF): Concepts and Abstract Syntax RDF Semantics RDF Test Cases Web Ontology Language (OWL) Use Cases and Requirements OWL Web Ontology Language Reference OWL Web Ontology Language Semantics and Abstract Syntax OWL Web Ontology Language Overview OWL Web Ontology Language Test Cases OWL Web Ontology Language Guide

C. Navarretta: Noter om Semantic Web og XML 9 XML XML Schema RDF RDFS DAML+OIL OWL Syntaks Datakontrol Beskrivelse af resurser Objekt-orienteret RDF Ontologibeskrivelse ikke W3C Ontologibeskrivelse W3C WC3 Ontologisprog

C. Navarretta: Noter om Semantic Web og XML 10 Opmærkningssprog og XML Opmærkningssprog er notationer for at opmærke data med tags. De mest kendt opmærkningssprog på webbet er HTML. Andre opmærkningssprog er SGML, som mest bruges i tekstsamlinger og XML, som er et generelt opmærkningssprog.

C. Navarretta: Noter om Semantic Web og XML 11 XML (eXtensible Markup Language) XML er et metasprog til opmærkning af dokumenter: består af en mængde syntaktiske regler for at strukturere dokumenter så at computere kan læse data, generere dem og sikre at de er utvetydige; understøtter UNICODE. UNICODE angiver et entydigt tal for hvert tegn, uafhængigt af programtype, sprog og system. er et opmærkningssprog (markup).

C. Navarretta: Noter om Semantic Web og XML 12 XML XML er blevet defineret som en undermængde af SGML. Opmærkning angives med tags ( ). Selv om XML er et opmærkningssprog som kan minde om HTML, er der mange forskelle mellem de to sprog.

C. Navarretta: Noter om Semantic Web og XML 13 Forskelle mellem HTML og XML I HTML har alle tags og attributter en forudbestemt betydning, fx angiver " " et afsnit (paragraf), attributtet href bruges til at angive en link. Mængden af lovlige tag-navne i HTML er begrænset. HTML's semantik er forbundet med sprogets syntaks som kun er egnet til at strukturere dokumenter som hypertekst. I XML anvendes tags'ene til at afgrænse og strukturere data af forskellige typer. Strukturen bestemmes af dem der skaber et XML-dokument og betydningen af tag-navnene er ikke forudbestemt, men afhænger af den aktuelle brug/definition. Derfor er XML et metasprog. Fx kunne " ” stå for bogstavet ”p”, for pris, person, problem o.s.v.

C. Navarretta: Noter om Semantic Web og XML 14 XML egenskaber XML-dokumenter skal være velformede, d.v.s. skal følge den syntaks som er beskrevet i XML- specifikationer. XML kræver ikke nogen form for licens, er system- uafhængigt og understøttes af mange platforme. Information i XML er struktureret således at den kan kombineres og genanvendes til forskellige formål. XML er et metasprog, som bruges til at definere et ubegrænset antal sprog (MusicXML, VoiceXML....). XML er modulært.

C. Navarretta: Noter om Semantic Web og XML 15 XML -fortsat XML 1.0 specifikationer angiver hvad tags og attributterne er i XML. Der findes også et voksende antal specifikationer, der supplerer XML. Nogle eksempler er: XLink angiver hvordan der kan tilføjes hyperlinks til en XML-fil. XPointer angiver hvordan man kan danne links til dele af en XML-dokument. XSL angiver Style Sheets for XML-dokumenter

C. Navarretta: Noter om Semantic Web og XML 16 Hvordan editeres XML? XML-dokumenter er tekster og kan derfor skrives i almindelige teksteditorer (word, wordpad, emacs, notepad, jedit etc.) Der findes specielle XML-editorer der viser XML-syntaks og struktur (fx. jedit fra XML-dokumenter kan indlæses i de fleste browsere. Der findes parsere til validering af XML- dokumenter

C. Navarretta: Noter om Semantic Web og XML 17 Hierarkisk og logisk struktur struktur XML-dokumenter har en hierarkisk struktur (tree structure). De skal have en unik rod, og kan have et ubestemt antal blade. Træets rod og blade hedder elementer. Den logisk struktur kan tegnes. How to think like a Computer Scientist Learning with Python A. Downey, J. Elkner & Chris Meyer..... text…. ….

C. Navarretta: Noter om Semantic Web og XML 18 Elementer: er de basale enheder i et XML-dokument. kan have et indhold eller være tomme. Elementer med indhold: kan indeholde andre elementer og/eller tekst. Elementerne angives med et opening-tag og afsluttes med et closing-tag. opening-tag : closing-tag: " " indhold " " For eks. Frøken Smillas fornemmelse for sne

C. Navarretta: Noter om Semantic Web og XML 19 Elementer og attributter Tomme elementer (empty elements ) " " " " som forkortes: " " Elementer (tomme og med indhold) kan have attributter. attributnavn = " værdinavn" Frøken Smillas fornemmelse for sne

C. Navarretta: Noter om Semantic Web og XML 20 XML-navne et elementnavn skal være et XML-navn: tilladte tegn: bogstaver, tal, underscore ”_”, apostrof, punktum tilladte begyndelsestegn : bogstaver, _ fx XML-navne: bo, BO, bo3, _bo, bo’s, bo_3’s.NaVn, φεαν,طظ ikke XML-navne:.bo, 3bo, bo;3, b o._3

C. Navarretta: Noter om Semantic Web og XML 21 Velformede XML-dokumenter Et XML-dokument er velformet hvis det: har en hierarkisk træstruktur, d.v.s. har nøjagtigt et rod-element og alle elementer er korrekt indlejret er skrevet i overensstemmelse med XML- syntaktiske regler, bl.a. begyndelse- og sluttags er velformede, attribut- og elementnavne er XML-navne, attribut-værdierne er skrevet mellem to apostrofer ’ eller mellem anførselstegn ” mm.

C. Navarretta: Noter om Semantic Web og XML 22 Velformede dokumenter -fortsat Der findes parsere der kontrollerer om et XML-dokument er velformet (browsere kontrollerer også om XML-dokumenter er velformede) Eksempel på et ikke-velformet dokument (2 fejl): Python programmer Learning XML

C. Navarretta: Noter om Semantic Web og XML 23 Tegnsættet XML-dokumenter er tekster: indhold og opmærkning skrives med tegn. Små og store bogstaver opfattes som forskellige tegn. Det mest udbredte standardiserede tegnsæt der inkluderer tegn fra de fleste verdenssprog er Unicode. Til tider bruges der kun en delmængde af Unicode. Standarden for de nordiske sprog er fx ISO (Latin-1), mens ASCII-formatet er begrænset til det nordamerikanske tegnesæt. Tegnsæt defineres i XML-erklæring, der starter et XML- dokument:

C. Navarretta: Noter om Semantic Web og XML 24 Opmærkning tags processing instructions CDATA entity references character references kommentarer DTD erklæringer

C. Navarretta: Noter om Semantic Web og XML 25 Opmærkning -fortsat tags: 3354 processing instructions: kommando til eksterne programmer: CDATA fri tekst der ikke skal opmærkes:, samt &, ', " men disse fortolkes ikke som XML-opmærkning] ]>

C. Navarretta: Noter om Semantic Web og XML 26 Entity references anvendes til at bruge som almindelige tegn de tegn som er reserverede i XML, eller til at erstatte større mængder af tekst med en enkelt reference (en slags makroer). indledes af tegnet & og afsluttes med et semikolon. Der er 5 reserverede tegn i XML ( & ' "). <: < >: > &: & ': &apos; ": "

C. Navarretta: Noter om Semantic Web og XML 27 Et eksempel XML & SGML &part1; &part2; &part3; < 10

C. Navarretta: Noter om Semantic Web og XML 28 Character referents og kommentarer Character references tillader at angive tegn som man ikke har på sin tastatur ved at skrive deres position i tegnsæt: &#decimaltal eller &#xhexadecimaltal kommentar: indledes med tegnene " " en kommentar kan indeholde alle tegn, bortset fra to efterfølgende bindestreger "--" og "-->"

C. Navarretta: Noter om Semantic Web og XML 29 Et eksempel Example This is a very simple & short XML document

C. Navarretta: Noter om Semantic Web og XML 30 DTD: (Document Type Definition) bruges til at definere vokabularet for XML- dokumenter (der er andre form for skemaer). kan være interne elle eksterne dokumenter der følger et DTD siges at være gyldige i følge DTD’en

C. Navarretta: Noter om Semantic Web og XML 31 Et eksempel

C. Navarretta: Noter om Semantic Web og XML 32 Øvelser øvelser findes på adresse: