1. Introduzione
Testualità digitale e fondamenti di editoria digitale. Che cos'è un'edizione scientifica digitale?
2. Tutorial XML/TEI
Strumenti di base e linguaggi dichiarativi XML. Lo standard TEI (Text Encoding Initiative) utilizzato per la realizzazione di un progetto editoriale sul web.
3. Laboratorio
Esercitazione pratica: presentazione dell’editor XML/TEI e marcatura di un testo concordato.
Elaborato finale: Marcatura XML/TEI di un testo concordato.
Il progetto potrebbe essere un file XML valido e ben formato, che preveda la marcatura di uno dei livelli trattati durante il corso
Gli obiettivi
// Codifica di livello 0 o di basso livello. Riguarda la rappresentazione binaria
della sequenza ordinata dei caratteri (la codifica dei caratteri, UnicodeUTF8)
// Codifica di alto livello. Arricchisce il testo codificato al livello zero con infor-
mazioni di tipo strutturale:
e.g. l’organizzazione del testo in elementi macrotestuali (e.g. paragrafazione, intestazioni ecc...), gli elementi stilistici-grafici (grandezza del font, margini, ecc...), valenza semantica del testo, la specifica di strutture linguistiche (tipologia di sintagma, analisi morfologica ecc...) e quindi di ogni possibile interpretazione l’editore voglia corredare il testo, esplicitandola formalmente.
I li
I livelli di codifica del testo:
I tipi di codifica
I tipi di
Presentazionale. Il linguaggio di markup mira a rappresentare la struttura fisica del testo mettendone in luce le caratteristiche superficiali
Analitico. Rende evidente le relazioni logiche e presenti all’interno del testo.
Gli obiettivi:
I Linguaggi di markup (codifica ad alto livello):
Un linguaggio di markup è un linguaggio che consente di descrivere dati tramite dei marcatori (tag). Un esempio molto popolare di linguaggio di markup è l’HTML, che consente di descrivere pagine per il Web. Il linguaggio HTML utilizza un insieme predefinito di tag per descrivere gli elementi di una pagina Web (es.: <head></head>, <body></body>, ecc.).
I Linguaggi di markup (codifica ad alto livello):
Ma possiamo fermarci a tag predefiniti come l'HTML?
L'HTML è l'ultima fase della realizzazione di un'edizione digitale.
La codifica informatica di un testo è la rappresentazione di un testo su un supporto digitale in un formato comprensibile da un elaboratore elettronico.
Tale definizione sottende però una serie di questioni teoriche (ma anche pratiche!). Innanzitutto il concetto di rappresentazione del testo (a che livello? da quale punto di vista?), e in secondo luogo il problema della comprensione, vale a dire un sistema di comunicazione condiviso dall'uomo e dalla macchina.
Elena Pierazzo, La codifica dei testi letterari, Carocci, 2005 (1 Capitolo)
Le informazioni incorporate in un testo sono denominate, dall'inglese, alternativamente "codifica" (encoding), "marcatura" (markup), o, con un brutto calco, "taggatura" (tagging).
Elena Pierazzo, La codifica dei testi letterari, Carocci, 2005 (1 Capitolo)
Elena Pierazzo, La codifica dei testi letterari, Carocci, 2005 (1 Capitolo)
Senza una marcatura semantica o strutturale, si possono effettuare solo ricerche molto semplici sui testi
La codifica gioca un ruolo importante per la rappresentazione e modellizzazione del documento in quanto, ogni volta che un atto di comunicazione ne viene attuato, si opera una selezione e una organizzazione dell'informazione da trasmettere.
Analizzare significa innanzittutto scomporre, selezionare.
La codifica, quindi, è un mezzo per rendere esplicita un'interpretazione del testo (G. Gigliozzi, 1997)
La codifica di un testo, quindi, può essere definita come una rappresentazione di un testo su un supporto digitale, in funzione di un determinato punto di vista, secondo un codice condiviso in modo sostanziale dall'uomo e dall'elaboratore elettronico cui tale codifica è destinata.
Che cosè la codifica?
Nel caso dei manoscritti antichi abbiamo tre modelli di edizione possibili:
// Meccanico. Una riproduzione tecnica, un facsimile, del manoscritto.
// Diplomatico-interpretativo. Il testo rispetta quello attestato e in nota vengono esplicitate le scelte dell’editore.
// Critico. Tenta la riproduzione (per congettura) del presunto testo originale.
MODELLI DI EDIZIONE
Nel caso di testi a stampa, la ricostruzione dell’esemplare ideale è il modello più rilevante. Quando ci si propone di realizzare un’edizione digitale si dovrà scegliere - o saper fare convivere - il tipo di edizione e quindi quali informazioni codificare.
MODELLI DI EDIZIONE
Un’edizione digitale deve offrire strumenti efficienti per la visualizzazione e la fruizione del testo, superando i limiti imposti dal supporto cartaceo (costi, diffusione, limiti spaziali e organizzativi, ecc...).
La codifica del testo digitale consente potenzialmente di:
-- gestire contemporaneamente più livelli (il facsimile, l’edizione diplomatica, l’edizione critica), senza imporre un testo base in fase di visualizzazione.
-- le scelte e la responsabilità dell’editore sono sempre evidenti, benchè il testo non sia “fisso”, suscettibile di modifiche.
Edizione scientifica digitale
Quali sono le fasi di realizzazione di
un'edizione scientifica digitale?
scelta del testo
studio e analisi
creazione del modello
scelta del modello di edizione
scelta dei TAG TEI
Quali sono le fasi di realizzazione di
un'edizione scientifica digitale?
Schema
XML/TEI
XSLT
(o altri linguaggi)
HTML
ePub
OUTPUT
LA TEI può offrirci di descrivere il testo:
nella sua struttura (poesia, prosa)
Con un livello di analisi più approfondita
Obiettivo della trascrizione
Rendere accessibile il testo
...e comprensibile
le annotazioni ci aiutano a creare diversi livelli di testo
Quindi:
Una trascrizione è un processo di selezione
Interpretativa
transcription è soggetta alle scelte dell'editore
LA TRASCRIZIONE: un modo particolare di lettura del testo?
Omissione
LA TRASCRIZIONE: un modo particolare di lettura del testo?
Omissione
LA TRASCRIZIONE: un modo particolare di lettura del testo?
<gap extent="1" unit="word" reason="illegible"/>
LA TRASCRIZIONE: un modo particolare di lettura del testo?
<choice>
<orig>ę</orig>
<reg>ae</reg>
</choice>
Elements Available in All TEI Documents -- Example
.
An <choice>
<corr cert="high">Autumn</corr>
<sic>Antony</sic>
</choice>
it was, That grew the more by reaping
.
.
the <choice>
<expan>World Wide Web Consortium</expan>
<abbr>W3C</abbr>
</choice>
.
.
...how godly a <choice>
<orig>dede</orig>
<reg>deed</reg>
</choice>
LA TRASCRIZIONE: un modo particolare di lettura del testo?
<subst><del>vindicatus est et</del>
<add hand="#Bh2" place="margin">venenum
<choice><abbr>datū</abbr>
<expan>datu<ex>m</ex></expan></choice>
MSdescriprion
La codifica <msDesc>
<msContents>: una lista delle informazioni e note sul manoscritto
<physDesc>: informazioni sugli aspetti fisici del documento
<history>: fornisce la storia del manoscritto
MSdescriprion
Text
<msIdentifier>
<country>United States of America</country>
<region>Texas</region>
<settlement>Austin</settlement>
<institution> The University of Texas at Austin </institution>
<repository>Harry Ransom Centre</repository>
<collection>Wilfred Owen Collected Letters</collection>
<idno type="folio">ff504</idno>
<altIdentifier>
<idno>Letter no. 535 Ed. 'Wilfred Owen Collected Letters'</idno>
</altIdentifier>
<msName>Letter to Leslie Gunston</msName>
</msIdentifier>
MSdescriprion
Text
<msIdentifier>
<country>United States of America</country>
<region>Texas</region>
<settlement>Austin</settlement>
<institution> The University of Texas at Austin </institution>
<repository>Harry Ransom Centre</repository>
<collection>Wilfred Owen Collected Letters</collection>
<idno type="folio">ff504</idno>
<altIdentifier>
<idno>Letter no. 535 Ed. 'Wilfred Owen Collected Letters'</idno>
</altIdentifier>
<msName>Letter to Leslie Gunston</msName>
</msIdentifier>
MSdescriprion
<objectDesc>: sulla descrizione fisica
<handDesc>: quali sono gli strati di scrittura
MSdescriprion
<objectDesc>: sulla descrizione fisica
<handDesc>: quali sono gli strati di scrittura
MSdescriprion
Text
<objectDesc form="codex">
<supportDesc material="mixed">
<p>Early modern <material>parchment</material> and
<material>paper</material>.</p>
</supportDesc>
<layoutDesc>
<layout columns="1" ruledLines="25 32"/>
</layoutDesc>
</objectDesc>
MSdescriprion
Text
<handDesc hands="2">
<handNote xml:id="Eirsp-1" scope="minor" script="other">
<p>The first part of the manuscript,
<locus from="1v" to="72v:4">fols 1v-72v:4</locus>, is
written in a practised Icelandic Gothic bookhand. This hand
is not found elsewhere.</p>
</handNote>
<handNote xml:id="Eirsp-2" scope="major" script="other">
<p>The second part of the manuscript,
<locus from="72v:4" to="194v">fols 72v:4-194</locus>, is
written in a hand contemporary with the first; it can also
be found in a fragment of <title>Knýtlinga saga</title>,
<ref>AM 20b II fol.</ref>.</p>
</handNote>
</handDesc>
MSdescriprion
Text
<physDesc>
<objectDesc form="folio">
<supportDesc material="paper">
<support>A single folio of <material>paper</material> in
the collection as ff504 recto and verso</support>
</supportDesc>
<layoutDesc>
<layout columns="1" writtenLines="20">Written full width
as a single column, with approximately 20 lines per
page</layout>
</layoutDesc>
</objectDesc>
<handDesc hands="1">
<handNote>Written in <persName ref="#WO">Wilfred
Owen's</persName> hand.</handNote>
</handDesc>
</physDesc>
PersName
<rs> ("referring string") -- qualsiasi frase che si riferisce a una persona
‘the girl you mentioned’, ‘my husband’...
<name> - qualsiasi nome
‘Siegfried Sassoon’ , ‘Calais’, ‘John Doe’ ...
<persName>, <placeName>, <orgName>: ‘syntactic sugar’ for
<name type="person"> etc.
<surname>, <forename>, <geogName>,
<geogFeat> etc.
PersName
Dove descrivo questi elementi?
PersName
1. Nella TeiHeader TEI > teiHeader > profileDesc > particDesc
aggiungi l'elemento <listPerson> </listPerson>
persName
2. Aggiungi l'elemento <person> nella lista <listPerson>:
<person xml:id="[ID]">
<persName>[NAME]</persName>
<birth>[BIRTH]</birth>
<death>[DEATH]</death>
<socecStatus>[STATUS]</socecStatus>
<note type="Biographical">[NOTE]</note>
</person>