Præsentation er lastning. Vent venligst

Præsentation er lastning. Vent venligst

Det semantiske web og XML Costanza Navarretta Center for Sprogteknologi, Københavns Universitet

Lignende præsentationer


Præsentationer af emnet: "Det semantiske web og XML Costanza Navarretta Center for Sprogteknologi, Københavns Universitet"— Præsentationens transcript:

1 Det semantiske web og XML Costanza Navarretta Center for Sprogteknologi, Københavns Universitet costanza@cst.dk

2 C. Navarretta: Noter om Semantic Web og XML 2 Indhold hvad er det semantiske web? den oprindelige vision hvordan kan visionen realiseres? hvad har man gjort? fremtiden introduktion til XML elementer, attributter, opmærkning, velformede dokumenter

3 C. Navarretta: Noter om Semantic Web og XML 3 Hvad er det semantiske web? Initiativ fra W3C, et konsortium af offentlige og private organisationer fra hele verden stiftet i 1994 ( MIT-CERN-DARPA-EU).W3C W3Cs overordnede formål er at forbedre udveksling og anvendelsesmuligheder af resurser på nettet.formål Det semantiske webs hjemmeside

4 C. Navarretta: Noter om Semantic Web og XML 4 Visionen: det semantiske web Fremtidsorienteret vision om et web hvor dataresurserne kan anvendes på en "intelligent" måde af både mennesker og maskiner, også i form af agenter. Den viden som er “gemt” i data skal udnyttes.

5 C. Navarretta: Noter om Semantic Web og XML 5 Vision, behov og nutid Det semantiske web bygger på en vision, men visionen kommer ud fra et reelt behov: at kunne udnytte den viden som er implicit i de store mængder data som findes på internettet. Det semantiske web er en igangværende udvidelse af det web, som findes i dag.

6 C. Navarretta: Noter om Semantic Web og XML 6 Hvordan kan visionen realiseres? Semantikken (betydningen) i resurserne på internettet skal gøres eksplicit. Resultatet vil være et netværk af semantisk opmærket viden (det semantiske web). For at kunne bruges af programmer, skal viden være opmærket på standardiserede måder og organiseret i fx domæne-specifikke ontologier, som kunstige agenter kan anvende på tværs af sprog og systemer.

7 C. Navarretta: Noter om Semantic Web og XML 7 3WC-initiativer 1.Definition af et XML-baseret standardsprog for at beskrive semantikken af resurserne (XML er standardsyntaksen for resurser på internettet). 2.Definition af et XML-baseret standardsprog for at formalisere ontologier. 3.Fastsættelse af protokoller til udveksling af semantiske resurser.

8 C. Navarretta: Noter om Semantic Web og XML 8 Resultater: specifikationer RDF/XML Syntax Specification (Revised) RDF Vocabulary Description Language 1.0: RDF Schema RDF Primer Resource Description Framework (RDF): Concepts and Abstract Syntax RDF Semantics RDF Test Cases Web Ontology Language (OWL) Use Cases and Requirements OWL Web Ontology Language Reference OWL Web Ontology Language Semantics and Abstract Syntax OWL Web Ontology Language Overview OWL Web Ontology Language Test Cases OWL Web Ontology Language Guide

9 C. Navarretta: Noter om Semantic Web og XML 9 XML XML Schema RDF RDFS DAML+OIL OWL Syntaks Datakontrol Beskrivelse af resurser Objekt-orienteret RDF Ontologibeskrivelse ikke W3C Ontologibeskrivelse W3C WC3 Ontologisprog

10 C. Navarretta: Noter om Semantic Web og XML 10 Opmærkningssprog og XML Opmærkningssprog er notationer for at opmærke data med tags. De mest kendt opmærkningssprog på webbet er HTML. Andre opmærkningssprog er SGML, som mest bruges i tekstsamlinger og XML, som er et generelt opmærkningssprog.

11 C. Navarretta: Noter om Semantic Web og XML 11 XML (eXtensible Markup Language) XML er et metasprog til opmærkning af dokumenter: består af en mængde syntaktiske regler for at strukturere dokumenter så at computere kan læse data, generere dem og sikre at de er utvetydige; understøtter UNICODE. UNICODE angiver et entydigt tal for hvert tegn, uafhængigt af programtype, sprog og system. er et opmærkningssprog (markup).

12 C. Navarretta: Noter om Semantic Web og XML 12 XML XML er blevet defineret som en undermængde af SGML. Opmærkning angives med tags ( ). Selv om XML er et opmærkningssprog som kan minde om HTML, er der mange forskelle mellem de to sprog.

13 C. Navarretta: Noter om Semantic Web og XML 13 Forskelle mellem HTML og XML I HTML har alle tags og attributter en forudbestemt betydning, fx angiver " " et afsnit (paragraf), attributtet href bruges til at angive en link. Mængden af lovlige tag-navne i HTML er begrænset. HTML's semantik er forbundet med sprogets syntaks som kun er egnet til at strukturere dokumenter som hypertekst. I XML anvendes tags'ene til at afgrænse og strukturere data af forskellige typer. Strukturen bestemmes af dem der skaber et XML-dokument og betydningen af tag-navnene er ikke forudbestemt, men afhænger af den aktuelle brug/definition. Derfor er XML et metasprog. Fx kunne " ” stå for bogstavet ”p”, for pris, person, problem o.s.v.

14 C. Navarretta: Noter om Semantic Web og XML 14 XML egenskaber XML-dokumenter skal være velformede, d.v.s. skal følge den syntaks som er beskrevet i XML- specifikationer. XML kræver ikke nogen form for licens, er system- uafhængigt og understøttes af mange platforme. Information i XML er struktureret således at den kan kombineres og genanvendes til forskellige formål. XML er et metasprog, som bruges til at definere et ubegrænset antal sprog (MusicXML, VoiceXML....). XML er modulært.

15 C. Navarretta: Noter om Semantic Web og XML 15 XML -fortsat XML 1.0 specifikationer angiver hvad tags og attributterne er i XML. Der findes også et voksende antal specifikationer, der supplerer XML. Nogle eksempler er: XLink angiver hvordan der kan tilføjes hyperlinks til en XML-fil. XPointer angiver hvordan man kan danne links til dele af en XML-dokument. XSL angiver Style Sheets for XML-dokumenter

16 C. Navarretta: Noter om Semantic Web og XML 16 Hvordan editeres XML? XML-dokumenter er tekster og kan derfor skrives i almindelige teksteditorer (word, wordpad, emacs, notepad, jedit etc.) Der findes specielle XML-editorer der viser XML-syntaks og struktur (fx. jedit fra http://jedit.org) XML-dokumenter kan indlæses i de fleste browsere. Der findes parsere til validering af XML- dokumenter

17 C. Navarretta: Noter om Semantic Web og XML 17 Hierarkisk og logisk struktur struktur XML-dokumenter har en hierarkisk struktur (tree structure). De skal have en unik rod, og kan have et ubestemt antal blade. Træets rod og blade hedder elementer. Den logisk struktur kan tegnes. How to think like a Computer Scientist Learning with Python A. Downey, J. Elkner & Chris Meyer..... text…. ….

18 C. Navarretta: Noter om Semantic Web og XML 18 Elementer: er de basale enheder i et XML-dokument. kan have et indhold eller være tomme. Elementer med indhold: kan indeholde andre elementer og/eller tekst. Elementerne angives med et opening-tag og afsluttes med et closing-tag. opening-tag : closing-tag: " " indhold " " For eks. Frøken Smillas fornemmelse for sne

19 C. Navarretta: Noter om Semantic Web og XML 19 Elementer og attributter Tomme elementer (empty elements ) " " " " som forkortes: " " Elementer (tomme og med indhold) kan have attributter. attributnavn = " værdinavn" Frøken Smillas fornemmelse for sne

20 C. Navarretta: Noter om Semantic Web og XML 20 XML-navne et elementnavn skal være et XML-navn: tilladte tegn: bogstaver, tal, underscore ”_”, apostrof, punktum tilladte begyndelsestegn : bogstaver, _ fx XML-navne: bo, BO, bo3, _bo, bo’s, bo_3’s.NaVn, φεαν,طظ ikke XML-navne:.bo, 3bo, bo;3, b o._3

21 C. Navarretta: Noter om Semantic Web og XML 21 Velformede XML-dokumenter Et XML-dokument er velformet hvis det: har en hierarkisk træstruktur, d.v.s. har nøjagtigt et rod-element og alle elementer er korrekt indlejret er skrevet i overensstemmelse med XML- syntaktiske regler, bl.a. begyndelse- og sluttags er velformede, attribut- og elementnavne er XML-navne, attribut-værdierne er skrevet mellem to apostrofer ’ eller mellem anførselstegn ” mm.

22 C. Navarretta: Noter om Semantic Web og XML 22 Velformede dokumenter -fortsat Der findes parsere der kontrollerer om et XML-dokument er velformet (browsere kontrollerer også om XML-dokumenter er velformede) Eksempel på et ikke-velformet dokument (2 fejl): Python programmer Learning XML

23 C. Navarretta: Noter om Semantic Web og XML 23 Tegnsættet XML-dokumenter er tekster: indhold og opmærkning skrives med tegn. Små og store bogstaver opfattes som forskellige tegn. Det mest udbredte standardiserede tegnsæt der inkluderer tegn fra de fleste verdenssprog er Unicode. Til tider bruges der kun en delmængde af Unicode. Standarden for de nordiske sprog er fx ISO-8859-1 (Latin-1), mens ASCII-formatet er begrænset til det nordamerikanske tegnesæt. Tegnsæt defineres i XML-erklæring, der starter et XML- dokument:

24 C. Navarretta: Noter om Semantic Web og XML 24 Opmærkning tags processing instructions CDATA entity references character references kommentarer DTD erklæringer

25 C. Navarretta: Noter om Semantic Web og XML 25 Opmærkning -fortsat tags: 3354 processing instructions: kommando til eksterne programmer: CDATA fri tekst der ikke skal opmærkes:, samt &, ', " men disse fortolkes ikke som XML-opmærkning] ]>

26 C. Navarretta: Noter om Semantic Web og XML 26 Entity references anvendes til at bruge som almindelige tegn de tegn som er reserverede i XML, eller til at erstatte større mængder af tekst med en enkelt reference (en slags makroer). indledes af tegnet & og afsluttes med et semikolon. Der er 5 reserverede tegn i XML ( & ' "). <: < >: > &: & ': ' ": "

27 C. Navarretta: Noter om Semantic Web og XML 27 Et eksempel XML & SGML &part1; &part2; &part3;.......... 3 < 10

28 C. Navarretta: Noter om Semantic Web og XML 28 Character referents og kommentarer Character references tillader at angive tegn som man ikke har på sin tastatur ved at skrive deres position i tegnsæt: &#decimaltal eller &#xhexadecimaltal kommentar: indledes med tegnene " " en kommentar kan indeholde alle tegn, bortset fra to efterfølgende bindestreger "--" og "-->"

29 C. Navarretta: Noter om Semantic Web og XML 29 Et eksempel Example This is a very simple & short XML document

30 C. Navarretta: Noter om Semantic Web og XML 30 DTD: (Document Type Definition) bruges til at definere vokabularet for XML- dokumenter (der er andre form for skemaer). kan være interne elle eksterne dokumenter der følger et DTD siges at være gyldige i følge DTD’en

31 C. Navarretta: Noter om Semantic Web og XML 31 Et eksempel

32 C. Navarretta: Noter om Semantic Web og XML 32 Øvelser øvelser findes på adresse: http://cst.dk/costanza/course/informasoeg/oev8.doc


Download ppt "Det semantiske web og XML Costanza Navarretta Center for Sprogteknologi, Københavns Universitet"

Lignende præsentationer


Annoncer fra Google