TEI

Text Encoding Initiative

Cesare Segre nel suo Avviamento all’analisi del testo letterario definisce lo stile come “l’assieme dei tratti formali che caratterizzano il modo di esprimersi di una persona o il modo di scrivere di un autore”. Successivamente parla dello stile come di un “assieme di tratti formali che caratterizzano un gruppo di opere costituito su basi tipologiche o storiche”.

Testo!

Avantesto / Paratesto

In critica letteraria, l’insieme di produzioni, verbali e non verbali, sia nell’ambito del volume stesso (quali il nome dell’autore, il titolo, una o più prefazioni, le illustrazioni, i titoli dei capitoli, le note), sia all’esterno del libro (interviste, conversazioni, corrispondenze, diarî, ecc.), che accompagnano il testo vero e proprio e ne guidano il gradimento da parte del pubblico.

Che cos'è la TEI? 

Perché devo studiare uno SCHEMA creato da altri?

Cosa abbiamo detto sul markup?

  • Markup è utilizzato per molti scopi e in campi differenti.
  • Permette di creare risorse e rappresentare la conoscenza
  • Ha il compito di rendere esplicito (alla macchina) cosa è implicito a una persona (disambiguazione)
  • Facilita il riuso dei materiali:

- in differenti formati

- in contesti differenti

Cosa abbiamo detto sul markup?

  • Ci impone di dare una struttura ai dati
  • Permette di collegare informazioni, data, risorse
  • Permette di selezionare aspetti del testo che ci interessano
  • Aiuta a farci condividere le nostre risorse intellettuali attraverso un vocabolario comune
  • Un markup descrittivo ci dà la possibilità di fare esplicite distinzioni per processare delle stringhe di caratteri

L’informatica, infatti, non si limita soltanto ad affrontare il problema della rappresentazione in forma adeguata dell’informazione, ma considera soprattutto il problema delle procedure di elaborazione dei dati codificati in qualsivoglia formato.

(Dino Buzzetti, Oltre il rappresentare, in La macchina del tempo)

Il punto cruciale consiste nel tener conto in modo adeguato del nesso che lega l'espressione al contenuto.

 

L'introduzione del markup era dunque motivata primariamente, da un'esigenza di completezza e di esaustività della rappresentazione, per ridurre al minimo la perdita di informazione nel passaggio dalla forma convenzionale alla forma digitale del testo.

 

(Dino Buzzetti, Oltre il rappresentare, in La macchina del tempo)

Funzioni del markup

  • Nominare, annotare, descrivere dei dati
  • attraverso un linguaggio formale
  • per poter riusare quei dati in forme diverse
  • e condividere i nostri progetti con altre risorse

Cosa abbiamo detto su

XML (EXtensible Markup Language) ?

  • Ha molti aspetti in comune con l'HTML ma non è HTML!
  • Quali sono le differenze?
  • è extensible
  • Deve essere ben formato
  • può essere validato
  • è indipendente da software, programmi, piattaforme

Cosa abbiamo detto su

XML (EXtensible Markup Language) ?

Esiste un (e uno solo) elemento, detto elemento radice (corrispondente al nodo radice dell’albero), che non è contenuto da nessun altro e che contiene direttamente o indirettamente tutti gli altri


Ogni elemento, escluso l’elemento radice, deve essere contenuto da un solo elemento (elemento padre) e può contenere altri sotto-elementi (elementi figli) e/o stringhe di caratteri


Esiste un sottoinsieme di elementi che non contengono altri elementi e che possono

  • essere vuoti
  • contenere esclusivamente stringhe di caratteri

Cosa abbiamo detto su

XML (EXtensible Markup Language) ?

La codifica degli attributi:

 

  • Ogni elemento XML può avere uno o più attributi
  • Un attributo ha un nome e un valore, che può assumere diverse tipologie

Cosa abbiamo detto su

XML (EXtensible Markup Language) ?

<text resp=“Italo Svevo” n=“Senilità”>
<div n=“1”>
    <p id=“C1P1”>Subito, con le prime parole che le rivolse, volle avvisarla 
    che non intendeva compromettersi in una relazione troppo seria…</p>
    <p id=“C1P2”>La sua famiglia? Una sola sorella non ingombrante né fisicamente 
    né moralmente, piccola e pallida, di qualche anno più giovane di lui…</p>
<pb n=“5”/>

L'esempio che abbiamo realizzato

Codifichiamo una poesia:

 

 

<?xml version="1.0" encoding="UTF-8"?>
<libro>
    <introduzione>
        <para> Por su libro Vida de Don Quijote y Sancho.</para>
    </introduzione>
    <corpo>
        <poesia>
            <titolo>A DON MIGUEL DE UNAMUNO</titolo>
             <strofa>
                    <verso>Este donquijotesco</verso>
                    <verso>don Miguel de Unamuno, fuerte vasco,</verso>
                    <verso>lleva el arnés grotesco</verso>
                    <verso>y el irrisorio casco</verso>
                    <verso>del buen manchego. Don Miguel camina,</verso>
                    <verso>jinete de quimérica montura,</verso>
                    <verso>metiendo espuela de oro a su locura,</verso>
                    <verso>sin miedo de la lengua que malsina.</verso>
                
                </strofa>
                <strofa>
                    <verso> A un pueblo de arrieros,</verso>
                    <verso>lechuzos y tahúres y logreros</verso>
                    <verso>dicta lecciones de Caballería.</verso>
                    <verso>Y el alma desalmada de su raza,</verso>
                    <verso>que bajo el golpe de su férrea maza</verso>
                    <verso>aún durme, puede que despierte un día.</verso>
                </strofa>
                <strofa>
                    <verso> Quiere enseñar el ceño de la duda,</verso>
                    <verso> antes de que cabalgue, el caballero;</verso>
                    <verso> cual nuevo Hamlet, a mirar desnuda</verso>
                    <verso> cerca del corazón la hoja de acero.</verso>
                </strofa>
            </poesia>
        </corpo>
    <epilogo>
    <para/>
    <firma>Antonio Machado</firma>
    </epilogo>
</libro>

Perché utilizziamo TEI?

Abbiamo bisogno di scambiarci informazioni fra persone e macchine.

Perché abbiamo bisogno di preservare le risorse; dobbiamo preservare anche i metadata!

Perché è uno SCHEMA - quindi un modello di aspetti inerenti alla critica del testo

Perché utilizziamo TEI?

TEI è un progetto internazionale che ha visto coinvolte le maggiori organizzazioni internazionali dedicate all'Informatica Umanistica

Qual È la strttura della tei?

tag root: TEI

<teiHeader>

<text>

Tutti i testi conformi alla TEI contengono:


 
 


una trascrizione del testo vero e proprio marcata con l'elemento <text>.

una testata TEI <teiHeader>, da considerarsi il frontespizio del documento elettronico;

<TeiHeader>

 

L’intestazione elettronica TEI contiene informazioni analoghe a quelle contenute nel titolo della pagina di un testo stampato:


documentazione della responsabilità editoriale, dati bibliografici, metodologie adottate per la codifica, etc

<TeiHeader>

Una corretta documentazione del testo elettronico dovrebbe prevedere le seguenti informazioni:


individuazione del testo elettronico attraverso le sue determinazioni bibliografiche: titolo, autore, luogo e data di edizione, ecc.;


certificazione della responsabilità del testo, anche quando la codifica ha avuto diversi responsabili;

 

<TeiHeader>

Una corretta documentazione del testo elettronico dovrebbe prevedere le seguenti informazioni:


indicazione della fonte;


documentazione accurata delle metodologie di rappresentazione dei vari fenomeni testuali, delle scelte teoriche che permettano di interpretare correttamente i simboli usati nella codifica del testo, delle eventuali modifiche o correzioni introdotte rispetto alla fonte.

 

TEI ODD customisation

Quanti elementi ci sono per la codifica con TEI?

http://www.tei-c.org/release/doc/tei-p5-doc/en/html/

 

La codifica di un testo lirico

<l> (a line of verse)


<lg> (a line group such as stanza or paragraph)


 

La codifica di un testo lirico

<lg>
    <l>There were eight pretty walkers who went up a hill;</l>
    <l>They were Jessamine, Joseph and Japhet and Jill,</l>
    <l>And Allie and Sally and Tumbledown Bill,</l>
    <l rend="i10">And Farnaby Fullerton Rigby.</l>
</lg>

La codifica di un testo lirico

<!-- Molti poemi consistono soltanto in un gruppo di versi. 
Una poesia di Emily Dickinson: -->


<body>
    <l>To make a prairie it takes a clover and one bee,</l>
    <l>One clover, and a bee,</l>
    <l>And revery.</l>
    <l>The revery alone will do,</l>
    <l>If bees are few.</l>
</body>
@

La codifica di un testo lirico



<lg type="stanza">
    <lg type="sestet">
        <l>In the first year of Freedom's second dawn</l>
        <l>Died George the Third; although no tyrant, one</l>
        <l>Who shielded tyrants, till each sense withdrawn</l>
        <l>Left him nor mental nor external sun:</l>
        <l>A better farmer ne'er brushed dew from lawn,</l>
        <l>A worse king never left a realm undone!</l>
    </lg>
    <lg type="couplet">
        <l>He died — but left his subjects still behind,</l>
        <l>One half as mad — and t'other no less blind.</l>
    </lg>
</lg>

La codifica di un testo lirico

<!-- compara le strutture! -->    

<lg>
    <lg type="quatrain">
        <l>My Mistres eyes are nothing like the Sunne,</l>
        <!-- 3 more lines -->
    </lg>
    <lg type="quatrain">
        <l>
        <!-- 4 lines -->
    </l>
    </lg>
    <lg type="quatrain">
        <l>
        <!-- 4 lines -->
        </l>
    </lg>
    </lg>
    <lg type="couplet">
        <l>And yet by heaven I think my love as rare,</l>
        <l>As
    </lg>
</lg>

La codifica di un testo lirico

<!-- compara le strutture! -->    

<div n="I" type="book">
    <div n="I.1" type="canto">
        <div n="I.1.1" type="stanza">
            <l>A noble knight was pricking on the plain</l>
            <l>Ycladd in mightie armes and silver shielde...</l>
        </div>
      </div>
</div>
.
.
<div n="I" type="book">
    <div n="1" type="canto">
        <lg n="I.1.1" type="stanza">
            <l>A Gentle Knight was pricking on the plain</l>
            <l>Y cladd in mightie armes and silver shielde,</l>
        </lg>
    </div>
</div>

La codifica di un testo lirico

<!-- per le parti di verso -->    

<l>
    <seg>In a somer seson,</seg>
    <seg>whan softe was the sonne,</seg>
</l>
<l>
    <seg>I shoop me into shroudes</seg>
    <seg>as I a sheep were,</seg>
</l>
<l>
    <seg>In habite as an heremite </seg>
    <seg>unholy of werkes,</seg>
</l>
<l>
<seg>Went wide in this world </seg>
</l>

La codifica di un testo lirico

<!-- per le parti di verso -->    

<l>
    <seg type="foot">
        <seg type="syll">Ar</seg>
        <seg type="syll">ma </seg>
        <seg type="syll">vi</seg>
    </seg>
    <seg type="foot">
        <seg type="syll">rum</seg>
        <seg type="syll">que </seg>
        <seg type="syll">ca</seg>
    </seg>
    <seg type="foot">
        <seg type="syll">no </seg>
        <seg type="syll">Tro</seg>
    </seg>...
</l>

La codifica di un testo lirico

<!-- caesura -->    

<l>In a somer seson, <caesura/> whan softe was the sonne, </l>
<l>I shoop me into shroudes <caesura/> as I a sheep were, </l>
<l>In habite as an heremite <caesura/> unholy of werkes, </l>
<l>Went wide in this world <caesura/> wondres to here. </l>

La codifica di un testo lirico

<div type="book" n="1" met="-+|-+|-+|-+|-+/" rhyme="aa">
<lg n="1" type="paragraph">
    <l>'Tis hard to say, if greater Want of Skill</l>
    <l>Appear in <hi>Writing</hi> or in <hi>Judging</hi> ill;</l>
    <l>But, of the two, less dang'rous is th'Offence,</l>
    <l>To tire our <hi>Patience</hi>, than mis-lead our <hi>Sense</hi>:</l>
</lg>
</div>

TEI-HEADER E la responsabilità del testo?

1.Individuazione del testo elettronico attraverso indicazioni bibliografiche (titolo, autore, luogo e data di edizione, etc.) 2.Certificazione della responsabilità editoriale del testo (anche nel caso in cui la codifica ha avuto diversi responsabili)

3.Indicazione della fonte del testo elettronico (edizioni di testi già editi su stampa o trascrizioni di manoscritti)

4.Documentazione accurata delle metodologie di rappresentazione dei vari fenomeni testuali,

5.Documentazione delle scelte di approcci disciplinari o teorici che permettano di interpretare correttamente i simboli usati nella codifica del testo

6.Documentazione delle eventuali correzioni e modifiche introdotte rispetto alla fonte. o

Text Encoding Initiative

By Tiziana Mancinelli

Text Encoding Initiative

  • 551