đ„ c2LabHAL
Â
Comparez les listes de publications dâun labo issues dâOpenAlex, Scopus et Pubmed avec sa collection HAL
đ Origines du projet
Depuis 2022, création de multiples scripts python pour télécharger des listes de publications à partir de Scopus, WOS, OpenAlex ou Pubmed :
- Pour faire les baromÚtres de la science ouverte des 42 labos sous tutelle Nantes Université
- Pour diverses études bibliométriques
- Pour les enquĂȘtes APC
- Pour faire des listes de publications à déposer pour les collÚgues en charge des dépÎts HAL
Dans le cadre des développements de l'application SoVisu+ (consortium CRISalid), besoin de réfléchir aux fonctionnalités liées à HAL
â idĂ©e dâun bac Ă sable pour tester quelques idĂ©es
- Quels statuts HAL afficher ?
- Quelles fonctionnalités utiles aux chercheurs peut-on imaginer ?
- Quelles sources de données complémentaires interroger ? Unpaywall, Crossref, champs OpenAlex inexplorés ?

đ§ C2LabHAL v0
- Mars 2025 : découverte de https://streamlit.io qui permet de créer une petite application avec un simple fichier python
-
CrĂ©ation dâune v0 de https://c2labhal.streamlit.app à partir de :
- mes scripts pour télécharger des .csv sur les bases source
- utilisation du code du HAL_collection_checker développé par Henri Bretel qui permet de définir un statut HAL (« dans la collection », « dans HAL mais pas dans la collection », « hors HAL », etc.) à partir du DOI et du titre (avec des calculs sur le taux de similarité du titre).
- DĂ©but avril : tests de lâappli par les collĂšgues de lâĂ©quipe HAL de Nantes UniversitĂ© et ceux de la liste bibliometrie@groupes.renater.fr
- Mars 2025 : découverte de https://streamlit.io qui permet de créer une petite application avec un simple fichier python
-
CrĂ©ation dâune v0 de https://c2labhal.streamlit.app à partir de :
- mes scripts pour télécharger des .csv sur les bases source
- utilisation du code du HAL_collection_checker développé par Henri Bretel qui permet de définir un statut HAL (« dans la collection », « dans HAL mais pas dans la collection », « hors HAL », etc.) à partir du DOI et du titre (avec des calculs sur le taux de similarité du titre).
- DĂ©but avril : tests de lâappli par les collĂšgues de lâĂ©quipe HAL de Nantes UniversitĂ© et ceux de la liste bibliometrie@groupes.renater.fr
 đ  C2LabHAL v0.1
Suite à ces échanges, plusieurs évolutions :
- RequĂȘtes sur Unpaywall et OA.works sur le modĂšle proposĂ© par Maxence Larrieu dans ce notebook fait dans le cadre dâun HALathon en 2022 : https://github.com/ml4rrieu/halathon
- Ajout dâactions dĂ©duites Ă partir des diffĂ©rents champs (Ă affiner)
- Ajout des auteurs (sur demande dâun directeur de labo)
- Ajout des publishers (Elsevier, MDPI, etc.) utiles pour repérer les APC
- Ajout du statut oa unpaywall : bronze, gold, hybrid etc.
- ParallĂ©lisation des requĂȘtes pour limiter les temps dâattente
Exemples dâactions dĂ©duites selon les sources interrogĂ©es
Statut HAL | Type de dépÎt | Condition de dépÎt | Action |
---|---|---|---|
Dans la collection HAL du labo | file |  | â DĂ©pĂŽt HAL OK |
Dans HAL mais hors de la collection HAL du labo |  |  | đ·ïž VĂ©rifier l'affiliation dans HAL |
Hors HAL |  |  | đ„ CrĂ©er la rĂ©fĂ©rence dans HAL |
Hors HAL |  | publishedVersion | đ DĂ©poser le PDF Ă©diteur |
- Saisissez dans un formulaire :
- le nom de la collection HAL du labo (ex. : MIP)
- son id OpenAlex (ex. : i4392021216)
- pour les abonnĂ©s Ă Scopus : lâid Scopus (ex. : 60105638) et la clĂ© API Elsevier.
- la requĂȘte Pubmed qui couvre le mieux les publications du labo.
- Choisissez les années.
- Optionnel : Récupérez la liste des auteurs (uniquement pour les publications avec DOI, source : Crossref pour le moment).
- Optionnel : Comparez cette liste dâauteurs avec une liste de chercheurs interne pour avoir une colonne avec les membres du labo uniquement.
- Cliquez sur RechercherâŠ
- PatientezâŠ
- Le fichier .csv est prĂȘt !

âïž C2LabHAL comment ça marche ?
LâintĂ©rĂȘt de le dĂ©cliner Ă lâĂ©chelle dâun Ă©tablissement : simplification extrĂȘme de lâinterface - on choisit un labo dans la liste, lâannĂ©e de dĂ©but, lâannĂ©e de fin, et câest tout !
Â
https://c2labhal-nantes.streamlit.app
Â
Â
 đ«  C2LabHAL-nantes, une premiĂšre dĂ©clinaison locale !
labos_list = [
{
"collection": "CAPHI",
"scopus_id": "60105490",
"openalex_id": "I4387152714",
"pubmed_query": "(CAPHI[Affiliation]) OR (\"CENTRE ATLANTIQUE DE PHILOSOPHIE\"[Affiliation]) OR (\"EA 7463\" [Affiliation]) OR (EA7463[Affiliation]) OR (UR7463[Affiliation]) OR (\"UR 7463\"[Affiliation])"
},
{
"collection": "CFV",
"scopus_id": "60105524",
"openalex_id": "I4387153064",
"pubmed_query": "(CFV[Affiliation]) OR (\"EA 1161\"[Affiliation]) OR (Viete[Affiliation])"
},
{
"collection": "CREAAH",
"scopus_id": "60105602",
"openalex_id": "I4387153012",
"pubmed_query": ""
},

C'est dĂ©clinable trĂšs facilement pour nâimporte quelle universitĂ© : il suffit dâavoir la liste des collections HAL, identifiants Scopus et OpenAlex et les requĂȘtes pubmed et de les ajouter au fichier Python.
https://github.com/guillaumegodet/c2LabHAL
Â
Guillaume GODET
Chef du service Bibliométrie
Département SystÚme d'Information et Appui à la Recherche
BU Nantes Université
guillaume.godet@univ-nantes.fr
Â
N'hĂ©sitez pas Ă me contacter pour plus d'informations ! đ
Â
đ Contact
deck
By guillaume godet
deck
- 319