L'archive dématérialisée :
les enjeux de la recherche et
de la diffusion à l'ère numérique

Professeur Léon Robichaud

Département d'histoire

Université de Sherbrooke

Ateliers de recherche et de rédaction
à la maîtrise en histoire
Octobre 2016

Plan de la conférence

  1. À propos du conférencier
  2. Une tentative de définition
  3. Les débats
  4. Les défis
  5. La réconciliation?
  6. Conclusion

1. À propos du conférencier

 

  • Formation en histoire
  • Très traditionnel au départ : relations de pouvoir en milieu rural, pluriactivité agricole,...
  • Cours en méthodes quantitatives
  • Développement des compétences en informatique
    • Exposition Montréal,
      ville fortifiée au XVIIIe
      siècle
    • Centre Canadien
      d'Architecture

Recherche historique

  • Théorie
    • Formation et évolution des formes urbaines et des structures sociales
  • Pratique
    • Chaînes de titre de la propriété
    • Reconstitution du bâti
    • Analyse de la population :
      professions, accès à la
      propriété
  • Dossiers papier inefficaces
  • Infrastructure numérique
    nécessaire pour gérer et
    relier l'information

Défi de la recherche

  • Imprécision des sources
  • Précision des logiciels
  • Requiert une critique de la source
  • Requiert une interprétation de l'information
  • Data vs Capta
  • Transparence dans les décisions

Quelques autres projets

  • COLLECTIF. Sherbrooke, histoire et patrimoine. Projet d'intégration dans le cadre du cours HST 279, L'informatique appliquée à l'histoire. Adresse URL : http://patrimoine.espaceweb.usherbrooke.ca [en ligne depuis 2013, ajouts annuels]

  • DUFOUR, Anne-Marie, Léon Robichaud et Denis Tremblay. « Inventaire architectural de la Ville de Montréal », Le patrimoine architectural de Montréal. Adresse URL : http://patrimoine.ville.montreal.qc.ca/inventaire/ [en-ligne depuis 2003, refonte en 2004 suite à des changements au niveau de la politique du patrimoine].

  • FONDATION DU PATRIMOINE RELIGIEUX. Inventaire des lieux de culte du Québec. Adresse URL : http://www.lieuxdeculte.qc.ca [en-ligne depuis 2003].

  • LAUZON, Gilles, Madeleine Forget, Léon Robichaud, Alan M. Stewart et Denis Tremblay. « Inventaires patrimoniaux du Vieux-Montréal », Site officiel du Vieux-Montréal. Adresse URL : http://vieux.montreal.qc.ca/inventaire/inventaire.htm [en-ligne depuis 1998, refonte en 2005].

  • LE GLAUNEC, Jean-Pierre et Léon Robichaud. Histoires d'esclaves dans le monde atlantique français. Adresse URL : http://www.marronnage.info/ [en ligne depuis 2009].

  • ROBICHAUD, Léon. Adhémar : base de données sur le bâti, la population et la propriété à Montréal, 1642-1805. Adresse URL : http://cca.qc.ca/adhemar [en-ligne depuis 1996, refonte en 2000].

  • WILLIAMS, Robin, Gregory Johnson et Léon Robichaud. Virtual Historic Savannah. Adresse URL : http://vsav.scad.edu [version base de données en-ligne depuis 2002].

  • LINTEAU, Paul-André, Mario Robert et Léon Robichaud. Chronologie de l'histoire de Montréal. Adresse URL: http://chronomontreal.uqam.ca

  • LINTEAU, Paul-André et Léon Robichaud. Bibliographie des études sur l'histoire de Montréal. Adresse URL: http://bibliomontreal.uaqm.ca

2. Une tentative de définition

  • Discipline?
  • Pratique?
  • Extension?

Une discipline?

  • Pas une discipline en soi
    • Utiliser un microscope électronique en biologie ne crée pas une nouvelle discipline
  • La nécessaire collaboration n'en font pas une interdiscipline non plus

Une pratique?

  • N'est pas limité à l'empiricisme
  • Nécessite une réflexion théorique sur
    • l'impact de la numérisation
    • l'impact des communications
    • la relation humain-ordinateur
  • La recherche de phénomènes imprévus
    à partir d'analyses exploratoires
    sans hypothèse préalable ne signifie pas
    que la démarche ne s'appuie pas sur un
    cadre théorique
  • Mais à la base, c'est une pratique qui s'appuie
    sur des cadres théoriques classiques ou nouveaux

Une extension?

  • Les humanités numériques sont une approche de la connaissance humaniste fondée sur l'utilisation d'outils informatiques pour l'analyse et la diffusion de corpus numériques.
  • En s'appuyant sur la dématérialisation des documents et sur la déconstruction de l'information, les humanités numériques traitent à la fois de l'atomisation, de l'agrégation et de la mise en relation des données.
  • L'utilisation de ces outils vise à dépasser les contraintes des méthodes plus traditionnelles en sciences humaines.

Un phénomène inscrit
dans un contexte historique

  • Les cadres de l'informatique traditionnelle
    • Balistique
    • Cryptographie
    • Ensembles fermés
    • Positivisme

De la machine à calculer

aux humanités numériques

  • Récit canonique
    • de la concordance des textes de Thomas d'Aquin
    • au web 2.0
  • Sauver les sciences « molles»?
  • Manque de sensibilité aux réalités des sciences humaines?

L'histoire de

l'informatique appliquée à l'histoire

  • Un parcours distinct
  • De la mécanographie (Furet et Daumard) aux grands ordinateurs
    • L'optimisme des années 1960
  • La micro-informatique et l'ordinateur dans le bureau
    • Les chiffriers électroniques
    • Les bases de données personnelles
  • Internet, le web et l'accessibilité
    • Aux sources, aux ouvrages, aux données, aux collègues
  • Un parcours loin d'être linéaire

3. Les débats

Les dangers du mépris réciproque

Dans les médias

  • Les scandales
    • Tableaux blancs
  • Les positions tranchées
    • Apprendre à programmer à l'école
      (pourquoi pas apprendre la musique)
  • Éviter les solutions uniques et homogènes
  • Les humains ne sont pas homogènes

Dans le Los Angeles Review of Books

  • Entrevues avec des praticiens
    • Variété de personnages
    • Enjeux de classe, de genre, de race
    • Intégration de groupes marginaux
  • Critique des opposants
    • « Tools of neoliberalism »
    • Positivisme
    • Traditionalisme
    • Anti-théorique

Quantifier, mais pourquoi?

  • Mépris réciproque
    • « seul est quantifiable ce qui est de peu de sens ou d'importance »?
    • « l'imprécision non-quantifiée témoigne d'un manque de rigueur »?
  • Utilité pour régler des mythes historiques ou résoudre des débats historiographiques
    • Démographie historique corrige le discours de l'ordonnance de Jean Talon sur le mariage des garçons et des filles en Nouvelle-France

Programmer ou ne pas être

  • Une nécessité à une certaine époque
  • De nombreux outils ne requièrent pas
    une base en programmation
  • La programmation permet de
    personnaliser et d'améliorer les outils
  • Exemple du mépris de part et d'autre
    • Programmer serait une compétence
      technique sans envergure
      intellectuelle
    • Ne pas savoir programmer serait le
      reflet d'une incapacité à réfléchir de manière logique et rationnelle

More hack; less yack

  • Apogée de l'approche anti-théorique
    des HN?
  • Plutôt un slogan pour rendre les
    événements collaboratifs plus efficaces
    B. Nowviskie, « On the Origin of Hack and Yack », JDH,
    http://journalofdigitalhumanities.org/3-2/on-the-origin-of-hack-and-yack-by-bethany-nowviskie/
  • A-t-on vraiment besoin de critiques
    prétentieuses de part et d'autres?

Cul-de-sac rhétorique?

  • Dépasser les attaques superficielles
  • Éviter l'optimisme ridicule
  • Éviter le rejet borné

4. Les défis

  • Comprendre la technologie
  • Demeurer les maîtres d'oeuvre
    de l'histoire

Une étiquette trop lourde à porter?

  • L'importance de l'identité de l'historien
  • Une étiquette à connotation négative
    (comme féministe?)
  • Un vestige du « ce n'est pas de
    l'histoire »
  • Personne ne vous accolera l'étiquette
    « humanités numériques » parce que
    vous faites un Powerpoint
  • Distinction demeurera entre les
    praticiens et théoriciens « durs » des HN par rapport aux gens qui s'appuient sur les technologies pour bonifier  leurs recherches et leurs analyses
  • Le cas de la calibration d'un appareil de résonance magnétique fonctionnelle (fMRI) avec un saumon
  • Être prudent
  • Ne pas se priver d'outils qui peuvent faire avancer les connaissances
  • Pour évaluer, il faut comprendre

Éviter le syndrome de la boîte noire

Alex Madrigal, «Scanning Dead Salmon in fmri Machine Highlights Risk of Red Herrings, Wired (Sept. 2009), https://www.wired.com/2009/09/fmrisalmon/

  • Comment les systèmes traitent-ils les données?
  • Est-ce que l'intégrité des données est maintenue?
  • Est-ce que les résultats reflètent les données initiales?
  • Une boîte noire ne permet pas de comprendre les processus.
  • Avantage des projets libres

Comprendre le traitement des données

  • De grands corpus existent
  • Attrayants pour les informaticiens
  • Historiens comprennent les sources
    et leurs limites
  • Éviter que de non-historiens définissent
    nos corpus

Conserver la maîtrise d'oeuvre

Tout ça pour ça?

  • Investissement important
    • Argent
    • Matériel
    • Logiciel
    • Expertise
  • Résultats correspondant aux ressources?
    • Parfois, preuve par la négative : pourquoi pas?
    • Résultats clairs et reproductibles
  • Si on partage les données, l'effort ne sera jamais en vain

5. La réconciliation?

Apprivoiser un outil utile

  • Dépasser les fonctions de base
  • Adapter les logiciels pour nos besoins
  • Ne pas rester coincé dans les options choisies par les entreprises

Un rapport général à la technologie

Une courbe d'apprentissage
trop abrupte?

  • Des outils complexes
  • Des méthodes différentes
  • Des interfaces peu conviviales

Définir un besoin

  • Qu'est-ce qui vous rendrait la vie plus facile?
    • Gérer les tables des matières?
    • Gérer les références?
  • Qu'est-ce qui rendrait vos recherches plus efficaces?
    • Un enregistrement numérique au lieu d'un magnétophone à cassette ou d'un magnétoscope VHS
    • Un logiciel de lexicométrie pour compléter la lecture humaine

Développer une stratégie

  • Identifier le bon outil
  • Apprivoiser l'outil
  • Tester dans un cadre sécuritaire
  • Intégrer à sa pratique

Archive dématérialisée: le texte

  • Images des documents
  • Transcription des manuscrits
  • Reconnaissance optique des caractères (océrisation) des imprimés
  • L'importance des métadonnées
  • Le potentiel de l'analyse de texte
  • Lecture à distance, big data, data mining
  • Désambiguïsation
  • La conversion en base de données
  • Data ou capta

Archive dématérialisée.
La carte et la photo aérienne

  • Numérisation matricielle
  • Collections en ligne (Old Maps Online, Données ouvertes de la Ville de Montréal)
  • Géorectification (MapWarper, Georeferencer)
  • Les systèmes d'information géographique

En français, SVP?

  • L'anglais, langue dominante
  • Humanistica, association francophone
    des HN, http://www.humanisti.ca/

  • Accueillera le Congrès international Digital Humanities, Montréal, 8 au 11 août 2017

  • Société canadienne des humanités numériques, http://csdh-schn.org/

  • Revue canadienne : Digital Studies / Le champ numérique, http://www.digitalstudies.org

  • Bonne présence québécoise francophone du côté des études littéraires et de la linguistique : HyperRoy (NT2)

  • Reste faible du côté histoire

Conclusion

  • Rigueur
  • Transparence
  • Reproductibilité

Merci

Présentation créée avec l'application Slides

http://slides.com

https://slides.com/technohistoire/hn/live

Léon Robichaud @technohistoire

L'archive dématérialisée, version Sherbrooke

By Léon Robichaud

L'archive dématérialisée, version Sherbrooke

Conférence présentée dans le cadre des ateliers de maîtrise du Département d'histoire de l'Université de Sherbrooke

  • 483