GeoArxiv

13 mars 2024

Archivage & Valorisation des codes sources

[Rey-Coyrehourcq 2015]

Historique de GeoArxiv

(1) Une prise de conscience

- état de l'art sur la simulation en SHS : français & anglo-saxons ~1950 / ~1990

- code source des années 1990  : disparu

- absence d'état de l'art sur les pratiques (CC)

- absence de protocole d'archivage

(2) Extension des recherches

=> desintérêt disciplinaire presque choquant

- extension du champ disciplinaire

- échanges avec des pionnies anglo-saxons et francophones sur leurs pratiques

- 1ère récupération de codes sources papiers et numériques

(3) Naissance du projet GeoArxiv

- création d'un GT avec des pionniers & des collègues

[Cuyala 2014]

- 1ère collectes de documents & listings, multiplication des ITW

(4) Extension du projet

- collaboration avec d'autres projets : TTT

- 1er stage

- recherche de financements ?

- appel à collecte

Objectifs de GeoArxiv

Récolter une histoire des pratiques en Françe

Récolter les matériaux : cours, codes sources tout support confondus (listings, etc.)

Emulation ou Réecriture de programmes

Valoriser

Péréniser

Site internet du projet : interview, codes sources, fonds numérisés, etc.

Portail HAL des pionniers

Cataloguage et archivage (physique et numérique) des matériaux

Actions

Pionniers Interviews Listings Codes Transcription Synthèse
Colette Cauvin C; 2015;2020 O O C; 2015 ; 2020 2015
Sylvie Rimbert C; 2021 N N partielle
Michel Pruvot 2020 ? via Colette non
Jacky Hirsch 2022;2023 ? (O) 2022 non
Michèle Sanglier 2017; 2023 O O 2017;2023 partielle
Patrice Langlois 2023 O O 2023 non
Pierre Dumolard C; 2023 N N C; 2023 non
François DD C; 2019 N N C; 2019 oui
Yves Guermond C; 2023 N N C non
Luc De Golbery 2024 O O 2024 non
Alain Reynauld C; L; 2023 O O C; L; 2023 non
Denise Pumain O O
Lena Sanders O O
Philippe LC 2020 N ? 2020 (sans audio) partielle
...

Récolte à la source

Trajectoire ind. + collective des laboratoires

Actions

Récolte indirecte des sources

  • Supports magnétiques/optiques  ou matériels "abandonnés" dans les laboratoires
  • Publications & littérature grise (notes manuscrites, cahier de laboratoire, rapports, etc.) :
    •  éléments de contexte (matériel, logiciels) ;
    • listings et codes sources associés

 

ex: bout de code sources "Amoral"

ex: materiels dispo à MTG dans les CRouen

ex: ~100 disquettes de géocités

Actions

préserver, quelques défis

  • pas de méthodologie standard, ni de législation pour les archives des chercheurs en France
  • peu d'intérêts de la part des institutions, des structures pour le/leur passé (startup nation)
  • période récente milieu XXème peu attrayante, y compris du point de vue des métiers de l'archive
  • des AAP existent mais pour des grosses campagnes de numérisations (ex Colex Persée)
  • BU / SCD ont de moins en moins la compétence et la place pour ce type de fonds spécialisés

Actions

préserver du logiciel, quelques défis supplémentaires

https://www.softwareheritage.org

POC sur le fond de CC en 2021

  • des réseaux existent (art & métiers) mais ils sont plus tournés vers le matériel que le logiciel (exception du jeu vidéo peut-être qui bénéficie des faveurs de la bnf)
  • une tendance croissante à la reconnaissance du logiciel comme matériel de recherche, avec des dépôts, mais ... pas encore de vision patrimoniale & mixte de celui-ci ...
  • la nécessité d'avoir des compétences techniques et logicielles + matériel pour extraire les données

Corpus test

Géographie Quantitave au LIVE à Strasbourg / ~ 1970

Pionniers Interviews Listings Codes
Colette Cauvin 2015;2020 O O
Sylvie Rimbert 2021 N N
Michel Pruvot 2020 ? (O)
Jacky Hirsch à venir ? (O)
...
  • Pôle important dès 1970 pour l'introduction de l'informatique en géographie
  • Pratique avec les centres de calculs de 1970 - quasi auj.

Colette C. a stocké et inventorié beaucoup de matériel des équipes, y compris au format numérique !

Corpus test

  • des créations originales (ex IsoDist*, Gipsy, Koropleth, etc.)
  • des adaptations / modifications (ex : Darcy*, Azmap, etc.)

=> toujours une trajectoire temporelle complexe : plusieurs auteurs, plusieurs systèmes, plusieurs langages ...

Auteur Période Version Sys. Lang.
Waldo Tobler 1965-1977 V0 Mainf. Fortran
Jacky Hirsch 1983 V1 Mainf. Fortran
Bruno Guérin 1999 V2 Micro C/C++
Gilles Vuidel 2020 V3 Web Java
  • des codes gardés mais non usités
Auteur Période Version Sys. Lang.
CC et JH 1992 V0 Mainf. Fortran
Bruno Guérin 1999 V1 Micro C/C++
Gilles Vuidel 2011 V2 Web Java

Using latex/bib standard

@software

@softwareversion

@softwaremodule

@softwarefragment

computer software

hérite champs manquants  via [crossref]

specific version of computer software

specific module of computer software

algorithm / part or fragment of code

+ [swhid] , [repository], [introducedin], [license] fields

Codification bibtex

@Software{Tobler1965,
  author   = {Tobler Waldo},
  date     = {1965},
  title    = {Darcy},
  location = {Santa Barbara and Edmonton and Strasbourg},
  note     = {Original version. 1965-1977. Fortran.},
  abstract = {Methode "régression bidimensionnelle"},
  related  = {Tobler1994, Tobler1977},
}
@SoftwareVersion{Hirsch1983,
  author   = {Hirsch, J. and Serradj, A. and Badariotti, D. and Briandet, F.},
  title    = {Logiciel de comparaison spatiale, Darcy, Darcylas},
  date     = {1983},
  note     = {Version for specific supercomputer or workstation. Fortran.},
  related  = {Tobler1965, Tobler1977, Cauvin1984a, Cauvin1984d},
  abstract = {Method "régression bidimensionnelle"},
  location = {Laboratoire Image Ville Environnement - UMR 7362 CNRS/UNISTRA – Strasbourg},
}
@SoftwareVersion{Guerin1999,
  author   = {Guerin, Bruno},
  title    = {Logiciel de comparaison spatiale, DarcyPPC},
  date     = {1999},
  note     = {Version for micro. C/C++.},
  related  = {Tobler1965, Tobler1977, Hirsch1983, Cauvin1984a, Cauvin1984d},
  abstract = {Method "régression bidimensionnelle"},
  location = {Laboratoire Image Ville Environnement - UMR 7362 CNRS/UNISTRA – Strasbourg},
}

Exemple sur Darcy :

- @Tobler1965 / original

- @Hirsch1983 / V1

- @Guerin1999 / V2

- @Vuidel2020 / V3

Codification bibtex

Exemple sur Darcy ( 1 fiche  inventaire sur 32 au total )

lien vers le fichier bibtex ~ 100 entrées

Codification bibtex

- [related] : (a) mélange des types de refs : articles & programmes & listings ... (b) relation unilatérale ou bilatérale lors du référencement ?

  • des manques pour la pérénisation :

- système cible

- [ crossref ] :  pas adapté si info hétérogènes entre les versions ...

  • Difficultés rencontrées lors de la transcription :

- double référence avec propriétés différentes : listing numérisé & code exec. ? si oui, comment ?

- support physique lors de la collecte, si existant  ?

- format (binaire, texte, etc.)

- système de développement

- données et paramètres associés

- langage(s)  ?

[notes]

[related] ?

- stockage physique, si existant (listings)  ?

[location] ?

Perspectives

Intégrer un groupe de travail pour aller plus loin ?

Fond FDD

  • 1 carton de documents sur la modélisation / systémique (selectionné par FDD), à Rouen
  • 1 interview de 3h et une synthèse 40p validée avec FDD
  • 2 jours de prises de vues photo des livres à l'appartement de FDD et plusieurs soirées à les cataloguer dans un Tableur enfin basculé vers Zotero :
  • 1 demi-journée pour rappatrier les cartons de livres + archives scientifiques de FDD à Condorcet
  • 1 journée à scanner la moitié de ces documents
  • 1 bibliographie partielle au format zotero

GeoArxiv-FDD

By sebastien rey coyrehourcq

GeoArxiv-FDD

  • 24