Edizione scientifica digitale in pratica

1. Introduzione

Testualità digitale e fondamenti di editoria digitale. Che cos'è un'edizione scientifica digitale?


2. Tutorial XML/TEI
Strumenti di base e linguaggi dichiarativi XML. Lo standard TEI (Text Encoding Initiative) utilizzato per la realizzazione di un progetto editoriale sul web.


3. Laboratorio
Esercitazione pratica: presentazione dell’editor XML/TEI e marcatura di un testo concordato.

 


Elaborato finale: Marcatura XML/TEI di un testo concordato.


Il progetto potrebbe essere un file XML valido e ben formato, che preveda la marcatura di uno dei livelli trattati durante il corso

Gli obiettivi

 

  • definire i concetti chiave per fornire una panoramica delle tecnologie per realizzare un'edizione scientifica digitale e, più in generale, dell'editoria digitale

 

  • fornire conoscenze e strumenti preliminari per entrare nel mondo delle edizioni digitali e delle biblioteche digitali


// Codifica di livello 0 o di basso livello. Riguarda la rappresentazione binaria
della sequenza ordinata dei caratteri (la codifica dei caratteri, UnicodeUTF8)


// Codifica di alto livello. Arricchisce il testo codificato al livello zero con infor-
mazioni di tipo strutturale:


e.g. l’organizzazione del testo in elementi macrotestuali (e.g. paragrafazione, intestazioni ecc...), gli elementi stilistici-grafici (grandezza del font, margini, ecc...), valenza semantica del testo, la specifica di strutture linguistiche (tipologia di sintagma, analisi morfologica ecc...) e quindi di ogni possibile interpretazione l’editore voglia corredare il testo, esplicitandola formalmente.

 


I li

 

 

I livelli di codifica del testo:

 

  •  Proprietario. Le specifiche non sono disponibili apertamente.
  • Non proprietario. Risorse open source, fruibili dalla comunità.

 

  • Leggibile. Il file contenente la marcatura è visualizzabile e interpretabile.
  • Non leggibile. Il documento è nascosto.

 

I tipi di codifica

 

  • Procedurale. Contiene istruzioni inerenti l’impaginazione del documento (la
    spaziatura, il font, l’interlinea ecc...).
  • Dichiarativo. Specifica la struttura logica di un documento.

I tipi di codifica

 

  •  Presentazionale. Il linguaggio di markup mira a rappresentare la struttura fisica del testo mettendone in luce le caratteristiche superficiali

  • Analitico. Rende evidente le relazioni logiche e presenti all’interno del testo.

  • Il ruolo della codifica come "disciplina comprendente una serie di conoscenze culturali e tecniche che consentono di memorizzare un documento
  • I linguaggi di markup - XML/TEI (Text Encoding Initiative)

 

Gli obiettivi:

  • fornire conoscenze e strumenti preliminari per entrare nel mondo delle edizioni digitali e delle biblioteche digitali

I Linguaggi di markup (codifica ad alto livello):

 

Un linguaggio di markup è un linguaggio che consente di descrivere dati tramite dei marcatori (tag). Un esempio molto popolare di linguaggio di markup è l’HTML, che consente di descrivere pagine per il Web. Il linguaggio HTML utilizza un insieme predefinito di tag per descrivere gli elementi di una pagina Web (es.: <head></head>, <body></body>, ecc.).

 

I Linguaggi di markup (codifica ad alto livello):

 

Ma possiamo fermarci a tag predefiniti come l'HTML?

 

L'HTML è l'ultima fase della realizzazione di un'edizione digitale.

 

Che cos'è la codifica?

La codifica informatica di un testo è la rappresentazione di un testo su un supporto digitale in un formato comprensibile da un elaboratore elettronico.

 

Tale definizione sottende però una serie di questioni teoriche (ma anche pratiche!). Innanzitutto il concetto di rappresentazione del testo (a che livello? da quale punto di vista?), e in secondo luogo il problema della comprensione, vale a dire un sistema di comunicazione condiviso dall'uomo e dalla macchina.

 

Elena Pierazzo, La codifica dei testi letterari, Carocci, 2005 (1 Capitolo)

 

 

 

Le informazioni incorporate in un testo sono denominate, dall'inglese, alternativamente "codifica" (encoding), "marcatura" (markup), o, con un brutto calco, "taggatura" (tagging).

 

Elena Pierazzo, La codifica dei testi letterari, Carocci, 2005 (1 Capitolo)

Che cos'è la codifica?

Elena Pierazzo, La codifica dei testi letterari, Carocci, 2005 (1 Capitolo)

 

Senza una marcatura semantica o strutturale, si possono effettuare solo ricerche molto semplici sui testi

La codifica gioca un ruolo importante per la rappresentazione e modellizzazione del documento in quanto, ogni volta che un atto di comunicazione ne viene attuato, si opera una selezione e una organizzazione dell'informazione da trasmettere.

Che cos'è la codifica?

Analizzare significa innanzittutto scomporre, selezionare.

 

La codifica, quindi, è un mezzo per rendere esplicita un'interpretazione del testo (G. Gigliozzi, 1997)

La codifica di un testo, quindi, può essere definita come una rappresentazione di un testo su un supporto digitale, in funzione di un determinato punto di vista, secondo un codice condiviso in modo sostanziale dall'uomo e dall'elaboratore elettronico cui tale codifica è destinata.

Che cosè la codifica?

Nel caso dei manoscritti antichi abbiamo tre modelli di edizione possibili:


// Meccanico. Una riproduzione tecnica, un facsimile, del manoscritto.


// Diplomatico-interpretativo. Il testo rispetta quello attestato e in nota vengono esplicitate le scelte dell’editore.
// Critico. Tenta la riproduzione (per congettura) del presunto testo originale.
 

MODELLI DI EDIZIONE

Nel caso di testi a stampa, la ricostruzione dell’esemplare ideale è il modello più rilevante. Quando ci si propone di realizzare un’edizione digitale si dovrà scegliere - o saper fare convivere - il tipo di edizione e quindi quali informazioni codificare.

MODELLI DI EDIZIONE

Un’edizione digitale deve offrire strumenti efficienti per la visualizzazione e la fruizione del testo, superando i limiti imposti dal supporto cartaceo (costi, diffusione, limiti spaziali e organizzativi, ecc...).

 

La codifica del testo digitale consente potenzialmente di:

 

-- gestire contemporaneamente più livelli (il facsimile, l’edizione diplomatica, l’edizione critica), senza imporre un testo base in fase di visualizzazione.

-- le scelte e la responsabilità dell’editore sono sempre evidenti, benchè il testo non sia “fisso”, suscettibile di modifiche.
 

Edizione scientifica digitale

Quali sono le fasi di realizzazione di

un'edizione scientifica digitale?

scelta del testo

studio e analisi

creazione del modello

scelta del modello di edizione

scelta dei TAG TEI

Quali sono le fasi di realizzazione di

un'edizione scientifica digitale?

Da questo momento:

 

il MOOC di DariahTeach
 

https://teach.dariah.eu/

Schema

XML/TEI

XSLT

(o altri linguaggi)

HTML

ePub

PDF

OUTPUT

ESERCIZIO!

 

http://tinyurl.com/y8ln5cph

 

http://xsltransform.net/

LA TEI può offrirci di descrivere il testo:

nella sua struttura (poesia, prosa)

 

Con un livello di analisi più approfondita

 

  • Obiettivo della trascrizione

    • Rendere accessibile il testo

    • ...e comprensibile

    • le annotazioni ci aiutano a creare diversi livelli di testo

  • Quindi:

    • Una trascrizione è un processo di selezione

    • Interpretativa

    • transcription è soggetta alle scelte dell'editore

LA TRASCRIZIONE: un modo particolare di lettura del testo?

 

  • Omissione

  • Sostituzione
  • Cancellazione
  • Normalizzazione

LA TRASCRIZIONE: un modo particolare di lettura del testo?

 

  • Omissione

LA TRASCRIZIONE: un modo particolare di lettura del testo?

<gap extent="1" unit="word" reason="illegible"/>

LA TRASCRIZIONE: un modo particolare di lettura del testo?

<choice>
    <orig>ę</orig>
    <reg>ae</reg>
</choice>

Elements Available in All TEI Documents -- Example
.
An <choice>
<corr cert="high">Autumn</corr>
<sic>Antony</sic>
</choice>
it was, That grew the more by reaping
.
.
the <choice>
<expan>World Wide Web Consortium</expan>
<abbr>W3C</abbr>
</choice>
.
.
...how godly a <choice>
<orig>dede</orig>
<reg>deed</reg>
</choice>

LA TRASCRIZIONE: un modo particolare di lettura del testo?

<subst><del>vindicatus est et</del>
<add hand="#Bh2" place="margin">venenum 
<choice><abbr>datū</abbr>
<expan>datu<ex>m</ex></expan></choice>

MSdescriprion

La codifica <msDesc>

 

<msContents>: una lista delle informazioni e note sul manoscritto


<physDesc>: informazioni sugli aspetti fisici del documento


<history>: fornisce la storia del manoscritto

MSdescriprion

Text

<msIdentifier>
    <country>United States of America</country>
    <region>Texas</region>
    <settlement>Austin</settlement>
    <institution> The University of Texas at Austin </institution>
    <repository>Harry Ransom Centre</repository>
    <collection>Wilfred Owen Collected Letters</collection>
    <idno type="folio">ff504</idno>
    <altIdentifier>
    <idno>Letter no. 535 Ed. 'Wilfred Owen Collected Letters'</idno>
    </altIdentifier>
    <msName>Letter to Leslie Gunston</msName>
</msIdentifier>

MSdescriprion

Text

<msIdentifier>
    <country>United States of America</country>
    <region>Texas</region>
    <settlement>Austin</settlement>
    <institution> The University of Texas at Austin </institution>
    <repository>Harry Ransom Centre</repository>
    <collection>Wilfred Owen Collected Letters</collection>
    <idno type="folio">ff504</idno>
    <altIdentifier>
    <idno>Letter no. 535 Ed. 'Wilfred Owen Collected Letters'</idno>
    </altIdentifier>
    <msName>Letter to Leslie Gunston</msName>
</msIdentifier>

MSdescriprion

<objectDesc>: sulla descrizione fisica


<handDesc>: quali sono gli strati di scrittura

MSdescriprion

<objectDesc>: sulla descrizione fisica


<handDesc>: quali sono gli strati di scrittura

MSdescriprion

Text

<objectDesc form="codex">
    <supportDesc material="mixed">
        <p>Early modern <material>parchment</material> and
    <material>paper</material>.</p>
        </supportDesc>
        <layoutDesc>
        <layout columns="1" ruledLines="25 32"/>
    </layoutDesc>
</objectDesc>

MSdescriprion

Text

<handDesc hands="2">
    <handNote xml:id="Eirsp-1" scope="minor" script="other">
        <p>The first part of the manuscript,
        <locus from="1v" to="72v:4">fols 1v-72v:4</locus>, is
        written in a practised Icelandic Gothic bookhand. This hand
        is not found elsewhere.</p>
    </handNote>
    <handNote xml:id="Eirsp-2" scope="major" script="other">
        <p>The second part of the manuscript,
        <locus from="72v:4" to="194v">fols 72v:4-194</locus>, is
        written in a hand contemporary with the first; it can also
        be found in a fragment of <title>Knýtlinga saga</title>,
        <ref>AM 20b II fol.</ref>.</p>
    </handNote>
</handDesc>

MSdescriprion

Text

<physDesc>
<objectDesc form="folio">
<supportDesc material="paper">
<support>A single folio of <material>paper</material> in
the collection as ff504 recto and verso</support>
</supportDesc>
<layoutDesc>
<layout columns="1" writtenLines="20">Written full width
as a single column, with approximately 20 lines per
page</layout>
</layoutDesc>
</objectDesc>
<handDesc hands="1">
<handNote>Written in <persName ref="#WO">Wilfred
Owen's</persName> hand.</handNote>
</handDesc>
</physDesc>

PersName

<rs> ("referring string") -- qualsiasi frase che si riferisce a una persona

‘the girl you mentioned’, ‘my husband’...
<name> - qualsiasi nome
‘Siegfried Sassoon’ , ‘Calais’, ‘John Doe’ ...


<persName>, <placeName>, <orgName>: ‘syntactic sugar’ for
<name type="person"> etc.

 

 <surname>, <forename>, <geogName>,
<geogFeat> etc.

PersName

Dove descrivo questi elementi?

PersName

1. Nella TeiHeader TEI > teiHeader > profileDesc > particDesc

 

aggiungi l'elemento <listPerson> </listPerson>

 

persName

2. Aggiungi l'elemento <person> nella lista <listPerson>:


<person xml:id="[ID]">
<persName>[NAME]</persName>
<birth>[BIRTH]</birth>
<death>[DEATH]</death>
<socecStatus>[STATUS]</socecStatus>
<note type="Biographical">[NOTE]</note>
</person>

Edizione scientifica in pratica

By Tiziana Mancinelli

Edizione scientifica in pratica

  • 512