GeoArxiv
13 mars 2024
Archivage & Valorisation des codes sources
[Rey-Coyrehourcq 2015]
Historique de GeoArxiv
(1) Une prise de conscience
- état de l'art sur la simulation en SHS : français & anglo-saxons ~1950 / ~1990
- code source des années 1990 : disparu
- absence d'état de l'art sur les pratiques (CC)
- absence de protocole d'archivage
(2) Extension des recherches
=> desintérêt disciplinaire presque choquant
- extension du champ disciplinaire
- échanges avec des pionnies anglo-saxons et francophones sur leurs pratiques
- 1ère récupération de codes sources papiers et numériques
(3) Naissance du projet GeoArxiv
- création d'un GT avec des pionniers & des collègues
[Cuyala 2014]
- 1ère collectes de documents & listings, multiplication des ITW
(4) Extension du projet
- collaboration avec d'autres projets : TTT
- 1er stage
- recherche de financements ?
- appel à collecte
Objectifs de GeoArxiv
Récolter une histoire des pratiques en Françe
Récolter les matériaux : cours, codes sources tout support confondus (listings, etc.)
Emulation ou Réecriture de programmes
Valoriser
Péréniser
Site internet du projet : interview, codes sources, fonds numérisés, etc.
Portail HAL des pionniers
Cataloguage et archivage (physique et numérique) des matériaux
Actions
Pionniers | Interviews | Listings | Codes | Transcription | Synthèse |
---|---|---|---|---|---|
Colette Cauvin | C; 2015;2020 | O | O | C; 2015 ; 2020 | 2015 |
Sylvie Rimbert | C; 2021 | N | N | partielle | |
Michel Pruvot | 2020 | ? | via Colette | non | |
Jacky Hirsch | 2022;2023 | ? | (O) | 2022 | non |
Michèle Sanglier | 2017; 2023 | O | O | 2017;2023 | partielle |
Patrice Langlois | 2023 | O | O | 2023 | non |
Pierre Dumolard | C; 2023 | N | N | C; 2023 | non |
François DD | C; 2019 | N | N | C; 2019 | oui |
Yves Guermond | C; 2023 | N | N | C | non |
Luc De Golbery | 2024 | O | O | 2024 | non |
Alain Reynauld | C; L; 2023 | O | O | C; L; 2023 | non |
Denise Pumain | O | O | |||
Lena Sanders | O | O | |||
Philippe LC | 2020 | N | ? | 2020 (sans audio) | partielle |
... |
Récolte à la source
Trajectoire ind. + collective des laboratoires
Actions
Récolte indirecte des sources
- Supports magnétiques/optiques ou matériels "abandonnés" dans les laboratoires
- Publications & littérature grise (notes manuscrites, cahier de laboratoire, rapports, etc.) :
- éléments de contexte (matériel, logiciels) ;
- listings et codes sources associés
ex: bout de code sources "Amoral"
ex: materiels dispo à MTG dans les CRouen
ex: ~100 disquettes de géocités
Actions
préserver, quelques défis
- pas de méthodologie standard, ni de législation pour les archives des chercheurs en France
- peu d'intérêts de la part des institutions, des structures pour le/leur passé (startup nation)
- période récente milieu XXème peu attrayante, y compris du point de vue des métiers de l'archive
- des AAP existent mais pour des grosses campagnes de numérisations (ex Colex Persée)
- BU / SCD ont de moins en moins la compétence et la place pour ce type de fonds spécialisés
Actions
préserver du logiciel, quelques défis supplémentaires
https://www.softwareheritage.org
POC sur le fond de CC en 2021
- des réseaux existent (art & métiers) mais ils sont plus tournés vers le matériel que le logiciel (exception du jeu vidéo peut-être qui bénéficie des faveurs de la bnf)
- une tendance croissante à la reconnaissance du logiciel comme matériel de recherche, avec des dépôts, mais ... pas encore de vision patrimoniale & mixte de celui-ci ...
- la nécessité d'avoir des compétences techniques et logicielles + matériel pour extraire les données
Corpus test
Géographie Quantitave au LIVE à Strasbourg / ~ 1970
Pionniers | Interviews | Listings | Codes |
---|---|---|---|
Colette Cauvin | 2015;2020 | O | O |
Sylvie Rimbert | 2021 | N | N |
Michel Pruvot | 2020 | ? | (O) |
Jacky Hirsch | à venir | ? | (O) |
... |
- Pôle important dès 1970 pour l'introduction de l'informatique en géographie
- Pratique avec les centres de calculs de 1970 - quasi auj.
Colette C. a stocké et inventorié beaucoup de matériel des équipes, y compris au format numérique !
Corpus test
- des créations originales (ex IsoDist*, Gipsy, Koropleth, etc.)
- des adaptations / modifications (ex : Darcy*, Azmap, etc.)
=> toujours une trajectoire temporelle complexe : plusieurs auteurs, plusieurs systèmes, plusieurs langages ...
Auteur | Période | Version | Sys. | Lang. |
---|---|---|---|---|
Waldo Tobler | 1965-1977 | V0 | Mainf. | Fortran |
Jacky Hirsch | 1983 | V1 | Mainf. | Fortran |
Bruno Guérin | 1999 | V2 | Micro | C/C++ |
Gilles Vuidel | 2020 | V3 | Web | Java |
- des codes gardés mais non usités
Auteur | Période | Version | Sys. | Lang. |
---|---|---|---|---|
CC et JH | 1992 | V0 | Mainf. | Fortran |
Bruno Guérin | 1999 | V1 | Micro | C/C++ |
Gilles Vuidel | 2011 | V2 | Web | Java |
Using latex/bib standard
@software
@softwareversion
@softwaremodule
@softwarefragment
computer software
hérite champs manquants via [crossref]
specific version of computer software
specific module of computer software
algorithm / part or fragment of code
+ [swhid] , [repository], [introducedin], [license] fields
Codification bibtex
@Software{Tobler1965,
author = {Tobler Waldo},
date = {1965},
title = {Darcy},
location = {Santa Barbara and Edmonton and Strasbourg},
note = {Original version. 1965-1977. Fortran.},
abstract = {Methode "régression bidimensionnelle"},
related = {Tobler1994, Tobler1977},
}
@SoftwareVersion{Hirsch1983,
author = {Hirsch, J. and Serradj, A. and Badariotti, D. and Briandet, F.},
title = {Logiciel de comparaison spatiale, Darcy, Darcylas},
date = {1983},
note = {Version for specific supercomputer or workstation. Fortran.},
related = {Tobler1965, Tobler1977, Cauvin1984a, Cauvin1984d},
abstract = {Method "régression bidimensionnelle"},
location = {Laboratoire Image Ville Environnement - UMR 7362 CNRS/UNISTRA – Strasbourg},
}
@SoftwareVersion{Guerin1999,
author = {Guerin, Bruno},
title = {Logiciel de comparaison spatiale, DarcyPPC},
date = {1999},
note = {Version for micro. C/C++.},
related = {Tobler1965, Tobler1977, Hirsch1983, Cauvin1984a, Cauvin1984d},
abstract = {Method "régression bidimensionnelle"},
location = {Laboratoire Image Ville Environnement - UMR 7362 CNRS/UNISTRA – Strasbourg},
}
Exemple sur Darcy :
- @Tobler1965 / original
- @Hirsch1983 / V1
- @Guerin1999 / V2
- @Vuidel2020 / V3
Codification bibtex
Exemple sur Darcy ( 1 fiche inventaire sur 32 au total )
lien vers le fichier bibtex ~ 100 entrées
Codification bibtex
- [related] : (a) mélange des types de refs : articles & programmes & listings ... (b) relation unilatérale ou bilatérale lors du référencement ?
- des manques pour la pérénisation :
- système cible
- [ crossref ] : pas adapté si info hétérogènes entre les versions ...
- Difficultés rencontrées lors de la transcription :
- double référence avec propriétés différentes : listing numérisé & code exec. ? si oui, comment ?
- support physique lors de la collecte, si existant ?
- format (binaire, texte, etc.)
- système de développement
- données et paramètres associés
- langage(s) ?
[notes]
[related] ?
- stockage physique, si existant (listings) ?
[location] ?
Perspectives
Intégrer un groupe de travail pour aller plus loin ?
Fond FDD
- 1 carton de documents sur la modélisation / systémique (selectionné par FDD), à Rouen
- 1 interview de 3h et une synthèse 40p validée avec FDD
- 2 jours de prises de vues photo des livres à l'appartement de FDD et plusieurs soirées à les cataloguer dans un Tableur enfin basculé vers Zotero :
- 1 demi-journée pour rappatrier les cartons de livres + archives scientifiques de FDD à Condorcet
- 1 journée à scanner la moitié de ces documents
- 1 bibliographie partielle au format zotero
GeoArxiv-FDD
By sebastien rey coyrehourcq
GeoArxiv-FDD
- 24