Præsentation er lastning. Vent venligst

Præsentation er lastning. Vent venligst

XML Schema og RDF Costanza Navarretta Center for Sprogteknologi, Københavns Universitet

Lignende præsentationer


Præsentationer af emnet: "XML Schema og RDF Costanza Navarretta Center for Sprogteknologi, Københavns Universitet"— Præsentationens transcript:

1 XML Schema og RDF Costanza Navarretta Center for Sprogteknologi, Københavns Universitet costanza@cst.dk

2 2 Indhold Litteratur Fra sidst: URI, DTD’er og validering Namespaces XML Schema og validering hvad er RDF? RDFs grundsten RDF og XML

3 3 Validering (DTD) og Python validerende parser (virker kun med DTD) Brug følgende python program import sys from xml.parsers.xmlproc import xmlval from xml.parsers.xmlproc.utils import validate_doc, load_dtd, ErrorPrinter parser = xmlval.XMLValidator() parser.set_error_handler(ErrorPrinter(parser, out=sys.stdout)) parser.parse_resource(”xml-dokument")

4 4 Namespaces skelne mellem elementer og attributter fra forskellige vokabularer som har samme navn samle elementer og attributter fra en XML-applikationer, således at programmer kan genkende dem. I nogle dokumenter er der brug for at kombinere opmærkning fra flere domæner defineret i forskellige XML- applikationer, fx har man brug for at referere til to typer adresser: web-adresser og almindelige adresser (vej+by)

5 5 Namespaces - syntaks xmlns:prefiks = "uri " (både URL og URN) Nogle navne-konventioner: Prefiks må ikke indeholde ":" og må ikke begynde med strengen xml uafhængigt af tegnstørrelse (xml, XML, Xml, ol.) URN må heller ikke indeholde ":"

6 6 Namespaces: virkefelt Prefikset kan defineres på et element (også roden). Det virker på det element det erklæres på og på alle dets underordnede elementer,fx …. ….

7 7 XML Schema Et XML-dokument beskrevet af et skema kaldes et instansdokument. Det er gyldigt (schema valid) hvis det følger skemaet. Et XML skema bindes til et instansdokument ved et attribut i rodelementet. To mulige attributter: xsi:schemaLocation: har som værdi en liste af de namespaces der anvendes i dokumentet samt URLs for de skemaer som validerer elementerne i de angivne namespaces xsi:noNamespaceSchemaLocation: har som værdi URL for skemaet (uden namespaces)

8 8 Et eksempel: poem.xml The Waste Land April is the cruellest month, breeding Lilacs out of the dead land

9 9 poem.xsd

10 10 Typer: simple Elementer der kun må indeholde tekst er af simpel type. Simple typer kan ikke have attributter. eksempler af simple typer: strenge Costanza Navarretta decimaltal 1.68

11 11 Simple typer Predefinerede datatyper (built-in) http://www.w3.org/TR/xmlschema-2/#built-in- vs-user-derived

12 12 Udledte typer fx typer der er mere specifikke end de predefinerede simple typer:

13 13 Komplekse typer Komplekse typer kan indeholde flere elementer af simpel eller kompleks type, samt attributter. Nye elementtyper kan skabes ved at kombinere flere eksisterende elementtyper eller ved at lave variationer af eksisterende typer. …

14 14 komplekse typer - fortsat ……

15 15 En online-validator http://www.w3.org/2001/03/webdata/xsv Valider poem.xml på adressen: http://cst.dk/costanza/course/informasoeg/eksempler/poem.xml Man kan validere dokumenter på lokale kataloger, men de skal være bundet et skema der findes på internettet. Øvelse: gem filen hos jer og rediger værdien på rodens attributtet xsi:noNamespaceSchemaLocation. Værdien skal være URL for poem.xsd.

16 16 Ekstra øvelse Dokumentet firma.xml på adressen http://cst.dk/costanza/course/informasoeg/eksempler/firma. xml er bundet skema firma:xsd på adressen http://cst.dk/costanza/course/informasoeg/eksempler/firma. xml http://cst.dk/costanza/course/informasoeg/eksempler/firma.xsd 1.Gem dokumentet firma.xml på jeres katalog og bind det til firma.xsd på internettet. 2.gennemgå dokumentet i forhold til skemaet. 3.Tilføj til XML-dokumentet et ansat Lene Kristensen som arbejder i afdelingen ”afdeling2”. 4.Valider dokumentet ( http://www.w3.org/2001/03/webdata/xsv) http://www.w3.org/2001/03/webdata/xsv

17 17 Hvad er RDF? RDF (Resource Description Framework) er et sprog til at repræsentere information om resurser på internettet i form af udsagn om resurserne. RDF er udviklet af W3C, uafhængigt af XML, men kan udtrykkes med XML- syntaks.

18 18 Hvad er RDF? - fortsat RDF giver mulighed for at beskrive data gennem simple udsagn, som fx: ’Bogen hedder How to think like a computer scientist’, ’Forfatterne til bogen er Downey, Elkner & Meyers’. RDF-beskrivelser omkring de samme resurser danner en graf.

19 19 RDFs grundsten En resurse (resource): ethvert objekt der kan identificeres på internettet fx en hjemmeside, et billede, et program, et element i et XML-dokument. En egenskab (property): en resurse som har et navn og kan anvendes som egenskab, fx kan et kursus have egenskaber som et navn, lærere. En egenskabsværdi (value): kan være en streng eller en resurse. En sætning (statement): sammensætning af en resurse, en egenskab og en værdi.

20 20 RDF-tripler RDF-tripel: resursen kaldes for subjektet; egenskaben kaldes for prædikatet; værdien kaldes for objektet; subjekt objekt prædikat

21 21 Eksempler En resurse, fx dette kursus (med en link til dets hjemmeside http://isis.ku.dk/kurser/index.aspx?kursusid=25076 &xslt=simple6&param8=false&param1=116674 ) http://isis.ku.dk/kurser/index.aspx?kursusid=25076 &xslt=simple6&param8=false&param1=116674 En egenskab, fx have_navn En værdie, fx IT og informationssøgning En sætning: kursets titel er IT og informationssøgning

22 22 Et eksempel Sætningen: “Navnet på kurset med adressen http://isis.ku.dk/kurser/index.aspx?kursusid= 25076&xslt=simple6&param8=false&param 1=116674 er IT og informationssøgning”. http://isis.ku.dk/kurser/index.aspx?kursusid= 25076&xslt=simple6&param8=false&param 1=116674 Vi kan tilføje at kurset finder sted i lokalerne 22.1.62 og 25.1.40.

23 23 Grafisk repræsentation http://isis.ku.dk/kurs er/index.aspx?ku rsusid=25076&xsl t=simple6&para m8=false&param 1=116674 IT og informationssøgning 22.1.62 finder-sted har_navn 25.1.40 finder-sted

24 24 RDF og logiske udsagn RDF-sætninger kaldes også for logiske udsagn. Logiske udsagn kan bruges til automatisk at uddrage ny viden, gennem logisk inferens.

25 25 Udsagn og inferens Alle lokaler som indeholder mere end 6 pc’er, er edb- lokaler. Alle lokaler som har navn i listen [20.0.50,…,22.1.62, …24.0.33,…], er undervisningslokaler. lokalet har navn ”22.1.62”. lokalet 22.1.62 indeholder 15 pc’er. Vi kan slutte ”logisk” at lokalet 22.1.62 er et undervisningslokale og et edb-lokale.

26 26 1. opgave om RDF 1.Hent Laudrups ontologi fra syvende undervisningsgang og definer enkelte RDF- tripler for klassen mand, fx “Michael Laudrup” er_bror_til XX. 2.Hvad kunne være en resurse for Michael Laudrup?

27 27 RDF og XML - specifikationer http://www.w3.org/RDF/#specs RDF/XML Syntax Specification (Revised) RDF Vocabulary Description Language: RDF SchemaRDF Vocabulary Description Language: RDF Schema RDF Primer Resource Description Framework (RDF): Concepts and Abstract SyntaxResource Description Framework (RDF): Concepts and Abstract Syntax RDF Semantics RDF Test Cases

28 28 RDF i XML <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf- syntax-ns#"> …..

29 29 RDF og XML eksempler Elementet rdf:RDF angiver Namespaces (rdf). rdf:Description indeholder en eller flere predikat-objekt par for en resurse. Resursen kan være identificeret med attributtet rdf:about, fx adressen for Michael Laudrups hjemmeside eller andre resurser om ham fx billeder


Download ppt "XML Schema og RDF Costanza Navarretta Center for Sprogteknologi, Københavns Universitet"

Lignende præsentationer


Annoncer fra Google