Chi rimpiangerà i vecchi tempi sarà inesorabilmente
schiacciato dalla voglia di robot che dilagherà nei giovani.
Giuseppe Gigliozzi si è laureato in Lettere con una tesi sui personaggi di Pirandello e svolse un lavoro di dottorato in Filologia Moderna all'Università "La Sapienza" di Roma, presentando la tesi "Scrittore/lettore".
Gigliozzi è docente presso il Dipartimento di linguistica e studi letterari alla Facoltà di Lettere dell'Università degli Studi di Roma "La Sapienza".
Autore di molti libri e saggi sulla letteratura italiana del ventesimo secolo e di studi sulla teoria letteraria e sull'applicazione della tecnologia informatica alle discipline classiche.
Fu direttore del settore informatico del dipartimento di linguistica e studi letterari, socio del comitato tecnico ed accademico del CISADU.
Collaborò con vari giornali e riviste, oltre che con la RAI, per la quale ha realizzato numerosi programmi per la divisione Telesoftware di Televideo.iani, per la memorizzazione, lo scambio e l'analisi di testi letterari.
Giuseppe Gigliozzi diresse di un contratto del Dipartimento degli studi Italiani e dell'IBM Italia, dedicato all'analisi delle strutture narrative e allo sviluppo di SEB, un sistema esperto per l'analisi dei passaggi di uno specifico genere letterario.
E, inoltre, direttore del progetto universitario "Memorizzazione e codifica di testi letterari" e coordinatore della convenzione tra l'Università di Parigi X - Nanterre, il Centro CNR - Opera del vocabolario Italiano, Firenze e il Dipartimento degli studi italiani, per la memorizzazione, lo scambio e l'analisi di testi letterari.
La scrittura connette il campo umanistico
a quello tecnologico e scientifico.
Mi pare assolutamente evidente che questa, come poche altre frontiere, sembrano poter offrire sbocchi professionali agli studenti di Lettere.
Questo perché la formazione culturale di un "letterato" unita a una buona conoscenza dei problemi teorici e metodologici che stanno dietro al fenomeno informatica, costruiscono uno dei miscugli più ricercati.
La ricetta è: competenza tecnica unita alla capacità di collocare il fenomeno da trattare nel proprio contesto, di analizzarlo e di trasformarlo in un efficiente oggetto informatico. Come dire: la tecnica è alla portata di tutti, l'analisi raffinata un po' meno.
Anche nel progetto Til sono stati chiamati a collaborare diversi laureati, come sono organizzati? "nell'ambito della ricerca i più "vecchi" (dottori di ricerca, dottorandi o laureati) stanno svolgendo una funzione di tutor nei riguardi dei più giovani codificatori. Sono di fatto l'anello di collegamento tra la redazione scientifica e chi fisicamente fa il lavoro. E fuori della ricerca quali sono i possibili inserimenti? "Fuori della ricerca, nel mondo del lavoro, le occupazioni tipiche di questi giovani sono le collaborazioni con le case editrici, con la RAI, con le software house." L'utilità delle biblioteche virtuali, che ormai sono molte in tutto il mondo è incontestabile: si frantumano i tradizionali rigidi spaccati tra campi di studio così diversi, con effetti sulla spazialità, su noi stessi, sulla ricerca. Ci sono però difficoltà nuove che si devono capire: "vanno ricercate su due ordini diversi di motivi.
Il nostro progetto si confronta con due tipi di difficoltà: se io digitalizzo un testo, lo faccio ovviamente per poter compiere sul testo elettronico una serie di operazioni che sarebbe impossibile o antieconomico fare utilizzando il testo originale. Dobbiamo garantire la "conformità" del testo elettronico all'originale.
Pensiamo solo alla complessità delle informazioni contenute in un testo letterario (semantiche, filologiche, grammaticali, sintattiche, ecc.) e capiremo quanto complesso sarà il nostro lavoro di descrizione.
Non meno importante il problema della portabilità dei documenti, che vuol dire indipendenza dalle piattaforme hardware e software.
Non dobbiamo, infatti, rischiare che i nostri dati muoiano assieme a una determinata macchina o assieme a un certo programma, ma dovremo essere sempre in grado di conservare l'informazione, qualunque sia il supporto tecnico.
Tutte e due queste opzioni si soddisfano per mezzo di un linguaggio di marcatura che dichiari esplicitamente e in maniera univoca l'informazione che intendiamo conservare, assieme al modo con il quale conserviamo la nostra informazione
Di cosa ci siamo occupati finora?
Rappresentazione dell'informazione
Edizione digitale
Oggi accenniamo all'analisi del testo
Sistemato il testo non ci resta che esplorare, se ci riesce, i meccanismi che lo muovono. Meccanismi che non appartengono più semplicemente a quello che si appoggia fisicamente sul foglio di carta (o nei settori di un dischetto), ma che da questa carta si protende verso spazi non ancora interamente sondati.
Qui cominicamo seriamente a occuparci del "libro che si legge", lasciando da parte "il libro che si tira" e - ulteriormente nostra scommessa - cogliamo occuparcene in modo scientifico, traducendo il regno della polisemia nell'unico linguaggio dell'informatica.
Deve essere ormai chiaro: qualunque operazione compiamo, ponendosi nello spazio del trattamento dell'informazione, si carica delle caratteristiche di una transcodifica che deve essere portata a termine con la consapevolezza dei pericoli che essa comporta.
Ogni traduzione implica il rischio di perdita (o almeno di trasformazione) di informazione.
Quando il testo si stacca dal foglio diventa qualcosa di manipolabile, un individuo di cui dobbiamo riconoscere gli elementi e le relazioni
Siamo noi che dobbiamo insegnargli a "leggere"
Il laboratorio del nuovo apprendista stregone
[dal lat. mediev. algorithmus o algorismus, dal nome d’origine, al-Khuwārizmī, del matematico arabo Muḥammad ibn Mūsa del 9° sec.
In informatica, insieme di istruzioni che deve essere applicato per eseguire un’elaborazione o risolvere un problema. 3. In logica matematica, qualsiasi procedimento «effettivo» di computo di una funzione o di decisione di un insieme (o predicato), cioè qualsiasi procedimento che consenta, con un numero finito di passi eseguiti secondo un insieme finito di regole esplicite, di ottenere il valore della funzione per un dato argomento, o di decidere se un dato individuo appartiene all’insieme (o soddisfa il predicato).
Il procedimento, chiamato anche text retrival - consente di estrarre tutte le parole presenti in un’opera stabilendo il numero esatto in cui ogni voce ricorre. La produzione di indici e frequenze permette di riflettere sull’uso di una parola e di avanzare ipotesi interpretative: può quindi dirci “banalmente” quante volte un elemento appare nel testo e dove.
Questo tipo di operazioni possono essere compiute senza nessun tipo di linguaggi di marcatura: esistono programmi che permettono il recupero del testo e la rappresentazione dei risultati di indici e concordanze.
Per determinare conoscenze lessicali nel senso discusso nelle due lezioni precedenti
Classe grammaticale, accezioni
CONCORDANZE
Per identificare aspetti ‘collocazionali’
COLLOCAZIONI
In Pinocchio, la forma BUONO occorre 11 volte.
Domande che si pone un lessicografo:
Quali parti del discorso?
Quali sensi?
Usati in quali contesti?
Soluzione: le CONCORDANZE
CONCORDANZA = forma + contesto
You can tell a word from the company it keeps” (Firth, 1957)
La competenza lessicale non consiste solo di conoscenza sintattica, morfologica, e semantica
Ma anche di conoscenza in parte arbitraria su quali parole si combinano di preferenza
Voyant Tools is a web-based text reading and analysis environment. It is a scholarly project that is designed to facilitate reading and interpretive practices for digital humanities students and scholars as well as for the general public.
What you can do with Voyant: