Un documento XML deve cominciare con una dichiarazione XML che ha tre funzioni:
<?xml version="1.0" ?>
<?xml version="1.0" encoding="iso-8859-1" ?>
Di default, e raccomandato, è la codifica ‘UTF-8’ (Unicode)
Tutti i documenti TEI hanno una dichiarazione all'interno del namespace TEI:
<TEI xmlns="http://www.tei-c.org/ns/1.0"> ...
</TEI>
I documenti TEI possono includere differenti namespace.
xmlns:math="http://www.mathml.org">
<p>...<math:expr>...</math:expr>...</p>...</TEI>
The xml namespace is used by the TEI for global attributes
@xml:id and @xml:lang
Tutti i documenti TEI hanno una dichiarazione all'interno del namespace TEI:
<TEI xmlns="http://www.tei-c.org/ns/1.0"> ...
</TEI>
<TEI xmlns="http://www.tei-c.org/ns/1.0"
<TEI xmlns="http://www.tei-c.org/ns/1.0" xmlns:math="http://www.mathml.org">
<p>...<math:expr>...</math:expr>...</p>...
</TEI>
The xml namespace is used by the TEI for global attributes
@xml:id and @xml:lang
In qualche documento XML puoi trovare la dichiarazione "Document Type”. Il documento inizia:
<?xml version="1.0" ?>
<!DOCTYPE greeting SYSTEM "greeting.dtd []">
La DTD è uno dei modi per associare il documento con lo SCHEMA
Si possono utilizzare quello della W3C o RELAX NG a questo fine
Il subset della DTD è usato per fornire dichiarazioni all'interno di uno schema - per esempio per file esterni.
Il subset della DTD può essere interno, esterno o entrambi.
Le DTDs sono cosiderate old-fashioned – lo schema RELAX NG sono più utilizzati.
Uno Schema XML descrive una struttura di un documento XML.
XML Document
SCHEMA XML
XML Document
SCHEMA XML
XSLT *
* (EXtensible Stylesheet Language trasformazione del documento in altri formati)
Output
<?xml version="1.0" encoding="utf-8" ?>
<div n="1">
<head>SCENE I. On a ship at sea: a tempestuous noise of thunder and lightning heard.</head>
<stage>Enter a Master and a Boatswain</stage>
<sp>
<speaker>Master</speaker>
<ab>Boatswain!</ab>
</sp>
<sp>
<speaker>Boatswain</speaker>
<ab>Here, master: what cheer?</ab>
</sp>
<sp>
<speaker>Master</speaker>
<ab>Good, speak to the mariners: fall to't, yarely,</ab>
<ab>or we run ourselves aground: bestir, bestir.</ab>
</sp>
<stage>Exit</stage> [...]
</div>
<?xml version="1.0" encoding="utf-8" ?>
<div n="1">
<!-- L'elemento root -->
</div>
<?xml version="1.0" encoding="utf-8" ?>
<head>SCENE I. On a ship at sea: a tempestuous noise of thunder and lightning
heard.</head>
<?xml version="1.0" encoding="utf-8" ?>
<stage>Enter a Master and a Boatswain</stage>
<sp>
<speaker>Master</speaker>
<ab>Boatswain!</ab>
</sp>
<div>
<head>
<stage>
<sp>
<speaker>
<ab>
Text
<seg>some text</seg>
<seg> <foo>some</foo> <bar>text</bar> </seg>
<seg> <foo>some <bar></foo>text</bar> </seg>
<seg type="text">some text</seg>
<seg type='text'>some text</seg>
<seg type=text>some text</seg>
<seg type="text"> some text <seg/>
<seg type="text"> some text<gap/> </seg>
<seg type="text">some text</Seg>
<seg type="text">some text</Seg type="text">
Insisteremo sui metadati perché rappresentano lo strumento per eccellenza ai fini della preservazione dei contenuti digitali
Quando parliamo di oggetto digitale ci riferiamo a qualcosa di molto preciso anche se non ancora ufficialmente formalizzato e quindi unicamente definito.
Principalmente oggetto digitale è associazione del dato, la fonte primaria nelle sue (potenzialmente) varie manifestazioni, e del metadato, le informazioni su quella fonte finalizzate alla sua descrizione, gestione e reperimento.
Gli oggetti digitali siano preservati è necessario che vengano realizzati utilizzando sistemi formali, standardizzati e portabili.
File portabili, quindi, cioè leggibili da piattaforme hardware e software diverse, ma anche file che possano garantire l'interoperabilità, cioè che possano essere scambiati fra sistemi eterogenei in grado di comprenderne la struttura, ed eventualmente la semantica.
Che cos'è allora TEI? È un sistema di marcatura, è un insieme di molti elementi del linguaggio XML
Che cos'è allora TEI?
creato per facilitare lo scambio e la circolazione delle richerche tra i ricercatori di tutto il mondo. La TEI (Text Encoding Initiative) è stata creata nel 1986, prima che nascesse il Web (quindi esiste da più di 30 anni) e provvede a fornire alcune linee guida alle persone che imparano ad usarla.
Che cos'è allora TEI?
E sapete cosa? Ci sono più di 500 elementi, abbastanza per soddisfare i bisogni della maggior parte dei ricercatori in tutto il mondo.
A che cosa serve la TEI?
Serve per scambiare dei dati, è indipendente da qualsiasi piattaforma
e può adattarsi ai nuovi strumenti perché è scritta in XML;
di conseguenza, se qualcuno inventa un nuovo strumento e usa l'XML, questo sarà compatibile con TEI.