Præsentation er lastning. Vent venligst

Præsentation er lastning. Vent venligst

Grundlæggende XML og XML- baserede teknologier til textmodellering DTD 2. kursusgang (7/09-2004)

Lignende præsentationer


Præsentationer af emnet: "Grundlæggende XML og XML- baserede teknologier til textmodellering DTD 2. kursusgang (7/09-2004)"— Præsentationens transcript:

1 Grundlæggende XML og XML- baserede teknologier til textmodellering DTD 2. kursusgang (7/09-2004)

2 Fra sidst Skemaer og validering DTD og gyldighed Interne og eksterne DTD’er Erklæring af elementer og elementtyper Erklæring af attributter og attributtyper Entiteter XML og data Øvelser

3 XML Hvad er XML? Hvordan repræsenteres XML-strukturen? Opmærkningstyper Elementer Attributter Velformede XML-dokumenter

4 XML - gyldighed Reglerne som definerer hvilke elementer og attributter der gælder for et eller flere XML- dokumenter, samt dokumentets hierarkiske struktur defineres i såkaldte skemaer og kaldes et vokabular Skemaerne giver muligheden for validering af XML-dokumenter. En XML-parser kan kontrollere at XML-dokumenter følger de regler specificeret i de skemaer de følger: gyldighed XML-dokumenter skal være velformede for at være gyldige (valid)

5 Gyldige dokumenter Er forbundet et eller flere skemaer (fx DTD’er eller XML-skemaer) Er velformede Er gyldige ifølge de angivne skemaer On line parsere: http://www.stg.brown.edu/service/xmlvalid/ http://www.cogsci.ed.ac.uk/%7Erichard/xml- check.htmlhttp://www.cogsci.ed.ac.uk/%7Erichard/xml- check.html

6 Typer af DTD’er interne: indlejret i XML-dokument …. eksterne SYSTEM PUBLIC

7 Public DTD DTD-navn: "(+|-)//Owner//DTD label //XX//"

8 Erklæring af elementer og elementtyper 1.Ekementer med indhold 2.Elementer uden indhold 1. fx

9 Eksempler Elementnavn=XML-navn: indeholder: bogstaver; tal; underscore ”_”,apostrof, punktum Starter med: bogstaver, _ XML-navne: bo, BO, bo3, _bo, bo’s, bo_3’s.NaVn, φεαν, طظعس, ikke XML-navne:.bo, 3bo, bo;3, b o._3

10 Elementer med indhold

11 Antal af elementer tegnene "?", "+", "*" efter elementnavn: " ?" elementet kan forekomme 0 eller 1 "+" elementet kan forekomme 1 eller flere gange "*" elementet kan forekomme 0, 1 eller flere gange

12 Blandede elementer (mixed elements) The Abrasion resistance indicates the ability of a construction element to resist mechanical abrasion such as foot traffic and wind blown particles which tend to progressively remove materials from exposed surfaces such as roofing the membranes

13 Elementer uden indhold (Empty elements) Tomme elementer erklæres således: fx

14 Attributter

15 Attributtyper CDATA: alle tekststrenge der er tilladt i XML NMTOKEN: name token (ingen mellemrum, ellers bogstaver, tal, -,.,og _. Ingen restriktioner på første tegn) NMTOKENS: flere name tokens adskilt af mellemrum Enumeration: list af name tokens (ntok1 |ntok2|ntok3|...|...) ID: et XML navn, ikke en NMTOKEN. Alle ID's i et dokument skal være forskellige IDREF: Refererer til ID'er (XML-navne).Bruges til at referere mellem elementer IDREFS: Liste af IDREF'er, adskilt af mellemrum ENTITY: Navnet på en ikke-parset entitet erklæret et andet sted i DTD'en ENTITIES: Liste af entities, adskilt af mellemrum NOTATION: Navnet på en "notation", en benævnelse

16 Attibut-default #IMPLIED: attributtet er optionelt fx XML #REQUIRED: attributtet er obligatorisk og der er ikke nogen default- værdi. fx XML #FIXED "default value": hvis attributtet ikke har en værdi, binder XML-parseren default-værdien til attributtet. Hvis værdien angives i XML-dokumentet dens værdi skal matche default-værdien. Literal : den aktuelle værdi er givet som en tekststreng

17 CDATA bla…bla

18 NMTOKEN bla…bla

19 Liste (Enumeration) …. bla…bla

20 ID og IDREF …

21 Notation & Entities <!ATTLIST billede type NOTATION (gif | jpeg) #REQUIRED kilde ENTITY #REQUIRED>

22 Entitettyper

23 Tegn-entiteter prædefinerede, > && ‘ &apos; “ " Nummererede: et tal angiver et tegn fx Cedilla (ç) er det 231. tal i Unicode: & #231; &#e7; Navngivne tegnentiteter: et tegn angives med et navn fx £ kan skrives £ Þ kan skrives som Þ

24 Mixed content entiteter: Syntaks: interne eksterne Interne generelle entiteter (erklærede i DTD) &writer;&copyright;

25 Eksterne generelle entiteter Syntaks: eller <!ENTITY copyright SYSTEM "entities/copyright.xml“ &copyright;&footer;

26 Eksterne ikke parsede entiteter Der er ingen standard for hvad man skal referere til. Det er op til applikationen. En anden mulighed er at bruge "notations" til at specificere noget der ikke er et XML-navn.

27 Parameter-entiteter Parameter-entiteter ligner generelle entiteter, blot bruges der % istedet for &. De kan bruges i DTD'en (interne), mens generelle entiteter kun kan bruges i dokumentet. fx

28 Betinget inkludering IGNORE ]]> INCLUDE ]]>


Download ppt "Grundlæggende XML og XML- baserede teknologier til textmodellering DTD 2. kursusgang (7/09-2004)"

Lignende præsentationer


Annoncer fra Google