Introduzione all'edizione scientifica digitale e alla codifica TEI (Text Encoding Initiative

 

Winter school - Università di parma

 

 

Tiziana Mancinelli

Ca' Foscari University of Venice

Obiettivi:

 

  • Introduzione alla TEI (Text Encoding Initiative)

  • Acquisire strumenti per poter gestire dati XML-TEI

  • Trovare soluzioni per la visualizzazione

  • Saper interrogare e navigare un documento XML

Obiettivi:

 

1. Introduzione

Testualità digitale e fondamenti di editoria digitale. Che cos'è un'edizione scientifica digitale?


2. Tutorial XML/TEI
Strumenti di base e linguaggi dichiarativi XML. Lo standard TEI (Text Encoding Initiative) utilizzato per la realizzazione di un progetto editoriale sul web.


3. Esercitazione pratica: presentazione dell’editor XML/TEI e marcatura di un testo concordato.

 

Obiettivi:

  • definire i concetti chiave per fornire una panoramica delle tecnologie per realizzare un'edizione scientifica digitale e, più in generale, dell'editoria digitale

 

  • fornire conoscenze e strumenti preliminari per entrare nel mondo delle edizioni digitali e delle biblioteche digitali

 

Perché queste lezioni?

A introdurti alla teoria e alla pratica del documento digitale, ovvero:
 

  • Acquisire una conoscenza storico-critica delle radici culturali e dell’evoluzione della testualità digitale

 

  • Conoscere le principali risorse e iniziative nel campo dell’edizione digitale dei testi

 

  • Familiarizzare con i linguaggi e gli strumenti dell’edizione digitale scientifica (SDE)

teoria e prassi

La teoria e la prassi: quante riflessioni sono state oziosamente proposte su questo antichissimo rapporto dialettico, ma quale riflessione radicale e dirompente ha prodotto l’informatica, per la quale il detto è fatto, l’algoritmo è la propria realizzazione, e per conseguenza chi non teorizza o teorizza male produce danni

 

(Tito Orlandi, Prefazione, in Raul Mordenti, Informatica e critica dei testi, cit. p. 8.

what's a digital scholarly edition?

Paradigm shift?

Each [of the scientific revolutions] produced a consequent shift in the problems available for scientific scrutiny and in the standards by which the profession determined what should count as an admissible problem or as a legitimate problem-solution Kuhn 1962

 

che cos'è un'edizione scientifica digitale?

Cambio di paradigma

paradigms [...] I take to be universally recognized scientific achievements that for a time provide model problems and solutions to a community of practitioners
 
 

Qual è lo scopo di una “edizione”?

 

 

  • L’esigenza di conservare l’opera
  • L’esigenza di trasmettere l’opera
  • L’esigenza di trovare un pubblico per l’opera
  • L’esigenza di rispettare la volontà dell’autore
  • L’esigenza di conservare i manufatti dell’artista
  • L’esigenza di testimoniare l’evoluzione dell’opera

Qual è lo scopo di una “edizione”?

 

Un'edizione su Google Books book può essere un'edizione digitale di interesse di un critico letterario, di uno studioso di filologia e letteratura?

Digital editions already at first glance display additional, specific, characteristic aspects. Some of them can be gained by transforming printed editions into electronic texts and digital publications.

Here we may talk about accessibility, searchability, usability and computability.

  

Edizione scientifica digitale

 

La “filologia materiale” degli anni ‘30: Pasquali, De Benedetti, Contini Scrittura come “processo” e testo come “sistema”

 

Contini: l’opera come “perenne approssimazione al valore” (1974)

 

 

 

Edizione scientifica digitale

 

 … è utile ribadire che […] la natura del testo è condizionata dai modi della sua produzione e riproduzione, che insomma il testo non è una realtà fisica ma un concetto limite.” (Segre, 1981)

 

 

 

Edizione scientifica digitale

 

La conservazione digitale non è un semplice processo di conservazione degli oggetti fisici, ma un processo di conservazione della capacità di riprodurre gli oggetti… [di fatto] non si può provare di aver conservato un oggetto fintanto che che non venga ricostruito in una forma che ne permetta l’uso da parte di esseri umani o  di programmi di elaborazione automatica”. (Thibodeau 2002)

 

 

 

Essa è “rappresentazione” e non mera trascrizione del parlato, ne fornisce cioè un modello concettuale. In modo simile, il passaggio dall’analogico al digitale descrive un processo di rappresentazione


Anche nella codifica di un testo è necessario esprimere un modello concettuale, ovvero astratto, di quel testo
 

“La scrittura è metalinguistica” (Olson 1997)

The existence of the paradigm sets the problem to be solved; often the paradigm theory is implicated directly in the design of apparatus able to solve the problem.

The medium is the message (?)

Digital scholarly editions are not just scholarly editions in digital media: digital ≠ digitized

(Sahle 2016)

1

The medium is the message (?)

A digital edition can not be printed without a loss of information and/or functionality

(Sahle 2016/2: 149)

The medium is the message (?)

i cataloghi

la critica

Un’edizione critica è, come ogni atto scientifico, una mera ipotesi di lavoro, la più soddisfacente (ossia economica) che colleghi in sistema i dati” (Contini) .

 

L’uso del termine ‘dati’ in ambito filologico, per indicare sia i materiali oggetto di studio (fonti primarie e secondarie), sia quelli prodotti dallo studioso, non è così fuori luogo come possa sembrare a prima vista in ambito digitale, e non fa altro che confermare ulteriormente la natura di sistema informativo dell’edizione critica

Giorgio Inglese scrive “si può ben dire che ogni testo ponga un proprio problema più e meno complesso – di accertamento filologico e di presentazione al lettore. Un’edizione critica è appunto il tentativo di risolvere questo problema”

Testo comunemente detto
NORME: Grammatica, retorica, etc


Rappresentazione digitale del testo. NORME: grammatica rispetto la sintassi del codice


Testo di output che un software restituisce. Processo biderezionale e dinamico


Testo profondo che scrive e ci scrive: con esso integiamo e ci viene anche restituito un certo output NORME: si tratta anche di un momento autopoietico

Testo in sé

Testo-codice

Testo processato

 

Testo che ci scrive

 

  • Interrogazione
  • Visualizzazione

 

 

Quali sono i linguaggi di programmazione che possiamo utilizzare?

 

Perché ci sono gli standard e a cosa servono?

Cosa si intende per codifica?

 

  •  Codifica di livello 0 o di basso livello. Riguarda la rappresentazione binaria della sequenza ordinata dei caratteri (la codifica dei caratteri, UnicodeUTF8)

 

  • Codifica di alto livello. Arricchisce il testo codificato al livello zero con informazioni di tipo strutturale

La codifica digitale è una “rappresentazione” e una “traduzione” di un oggetto in/attraverso un altro linguaggio (in questo caso un meta-linguaggio, Lotman 1973)


In entrambi i casi (codifica e traduzione) il circolo ermeneutico per continuare a vivere deve essere periodicamente rinnovato

 

Lo scopo della codifica

Cosa si intende per codifica?

  • Il ruolo della codifica come "disciplina comprendente una serie di conoscenze culturali e tecniche che consentono di memorizzare un documento
  • I linguaggi di markup - XML/TEI (Text Encoding Initiative)

Cosa si intende per codifica?

Le informazioni incorporate in un testo sono denominate, dall'inglese, alternativamente "codifica" (encoding), "marcatura" (markup), o, con un brutto calco, "taggatura" (tagging)

Cosa si intende per codifica?

Un linguaggio di markup è un linguaggio che consente di descrivere dati tramite dei marcatori (tag). Un esempio molto popolare di linguaggio di markup è l’HTML, che consente di descrivere pagine per il Web. Il linguaggio HTML utilizza un insieme predefinito di tag per descrivere gli elementi di una pagina Web (es.: <head></head>, <body></body>, ecc.).

Che cos'è la codifica?

La codifica informatica di un testo è la rappresentazione di un testo su un supporto digitale in un formato comprensibile da un elaboratore elettronico.

 

Tale definizione sottende però una serie di questioni teoriche (ma anche pratiche!). Innanzitutto il concetto di rappresentazione del testo (a che livello? da quale punto di vista?), e in secondo luogo il problema della comprensione, vale a dire un sistema di comunicazione condiviso dall'uomo e dalla macchina.

 

Elena Pierazzo, La codifica dei testi letterari, Carocci, 2005 (1 Capitolo)

Che cos'è la codifica?

In ambito letterario la differenza esistente fra il codice dell'Autore e quello del Lettore ha portato Cesare Segre a definire qualsiasi testo un diasistema, cioè il "risultato del compromesso tra il sistema del testo e il sistema del copista"

Che cos'è la codifica?

La codifica di un testo, quindi, può essere definita come una rappresentazione di un testo su un supporto digitale, in funzione di un determinato punto di vista, secondo un codice condiviso in modo sostanziale dall'uomo e dall'elaboratore elettronico cui tale codifica è destinata.

A cosa serve la codifica?

Senza una marcatura semantica o strutturale, si possono effettuare solo ricerche molto semplici sui testi

A cosa serve la codifica?

La codifica gioca un ruolo importante per la rappresentazione e modellizzazione del documento in quanto, ogni volta che un atto di comunicazione ne viene attuato, si opera una selezione e una organizzazione dell'informazione da trasmettere.

A cosa serve la codifica?

Analizzare significa innanzittutto scomporre, selezionare.

 

La codifica, quindi, è un mezzo per rendere esplicita un'interpretazione del testo (G. Gigliozzi, 1997)

XML-TEI

XML RELATED TECHNOLOGIES

XML-SCHEMA

XPATH

XQUERY

XSLT

  • Tool - mappe, timeline, etc

Cosa fare dopo aver codificato un testo?

Modello

teorico

astratto

 

Processo di

codifica

Risorse

digitali

Analisi

del testo

Riassumendo:

 

  • I sistemi di codifica permette lo scambio di informazioni attraverso la rappresentazione delle informazioni testuali.
  • La codifica è un'attività scientifica e di ricerca, ma a sua volta può supportare la ricerca.
  • Rendono esplicito alla macchina cosa è implicito per la persona.
  • La definizione del markup e il processo di codifica è uno degli aspetti che caratterizza la nuova forma di editore.
  • La scelta del markup non è neutra ed è frutto di interpretazione permessa soltanto da un'analisi e conoscenza del testo.

 

 

 

Winter School - Pavia

By Tiziana Mancinelli

Winter School - Pavia

Xpath - Xslt - Xquery

  • 565