đŸ„Ž c2LabHAL

 

Comparez les listes de publications d’un labo issues d’OpenAlex, Scopus et Pubmed avec sa collection HAL

🚀 Origines du projet

Depuis 2022, création de multiples scripts python pour télécharger des listes de publications à partir de Scopus, WOS, OpenAlex ou Pubmed :

  • Pour faire les baromĂštres de la science ouverte des 42 labos sous tutelle Nantes UniversitĂ©
  • Pour diverses Ă©tudes bibliomĂ©triques
  • Pour les enquĂȘtes APC
  • Pour faire des listes de publications Ă  dĂ©poser pour les collĂšgues en charge des dĂ©pĂŽts HAL

Dans le cadre des développements de l'application SoVisu+ (consortium CRISalid), besoin de réfléchir aux fonctionnalités liées à HAL
→ idĂ©e d’un bac Ă  sable pour tester quelques idĂ©es

  • Quels statuts HAL afficher ?
  • Quelles fonctionnalitĂ©s utiles aux chercheurs peut-on imaginer ?
  • Quelles sources de donnĂ©es complĂ©mentaires interroger ? Unpaywall, Crossref, champs OpenAlex inexplorĂ©s ?

🔧 C2LabHAL v0

  • Mars 2025 : dĂ©couverte de https://streamlit.io qui permet de crĂ©er une petite application avec un simple fichier python
  • CrĂ©ation d’une v0 de https://c2labhal.streamlit.app à partir de :
    • mes scripts pour tĂ©lĂ©charger des .csv sur les bases source
    • utilisation du code du HAL_collection_checker dĂ©veloppĂ© par Henri Bretel qui permet de dĂ©finir un statut HAL (« dans la collection », « dans HAL mais pas dans la collection », « hors HAL », etc.) Ă  partir du DOI et du titre (avec des calculs sur le taux de similaritĂ© du titre).
  • DĂ©but avril : tests de l’appli par les collĂšgues de l’équipe HAL de Nantes UniversitĂ© et ceux de la liste bibliometrie@groupes.renater.fr
  • Mars 2025 : dĂ©couverte de https://streamlit.io qui permet de crĂ©er une petite application avec un simple fichier python
  • CrĂ©ation d’une v0 de https://c2labhal.streamlit.app à partir de :
    • mes scripts pour tĂ©lĂ©charger des .csv sur les bases source
    • utilisation du code du HAL_collection_checker dĂ©veloppĂ© par Henri Bretel qui permet de dĂ©finir un statut HAL (« dans la collection », « dans HAL mais pas dans la collection », « hors HAL », etc.) Ă  partir du DOI et du titre (avec des calculs sur le taux de similaritĂ© du titre).
  • DĂ©but avril : tests de l’appli par les collĂšgues de l’équipe HAL de Nantes UniversitĂ© et ceux de la liste bibliometrie@groupes.renater.fr

 🌟  C2LabHAL v0.1

Suite à ces échanges, plusieurs évolutions :

  • RequĂȘtes sur Unpaywall et OA.works sur le modĂšle proposĂ© par Maxence Larrieu dans ce notebook fait dans le cadre d’un HALathon en 2022 : https://github.com/ml4rrieu/halathon
  • Ajout d’actions dĂ©duites Ă  partir des diffĂ©rents champs (Ă  affiner)
  • Ajout des auteurs (sur demande d’un directeur de labo)
  • Ajout des publishers (Elsevier, MDPI, etc.) utiles pour repĂ©rer les APC
  • Ajout du statut oa unpaywall : bronze, gold, hybrid etc.
  • ParallĂ©lisation des requĂȘtes pour limiter les temps d’attente

Exemples d’actions dĂ©duites selon les sources interrogĂ©es

Statut HAL Type de dépÎt Condition de dépÎt Action
Dans la collection HAL du labo file   ✅ DĂ©pĂŽt HAL OK
Dans HAL mais hors de la collection HAL du labo     đŸ·ïž VĂ©rifier l'affiliation dans HAL
Hors HAL     đŸ“„ CrĂ©er la rĂ©fĂ©rence dans HAL
Hors HAL   publishedVersion 📄 DĂ©poser le PDF Ă©diteur
  • Saisissez dans un formulaire :
    • le nom de la collection HAL du labo (ex. : MIP)
    • son id OpenAlex (ex. : i4392021216)
    • pour les abonnĂ©s Ă  Scopus : l’id Scopus (ex. : 60105638) et la clĂ© API Elsevier.
    • la requĂȘte Pubmed qui couvre le mieux les publications du labo.
  • Choisissez les annĂ©es.
  • Optionnel : RĂ©cupĂ©rez la liste des auteurs (uniquement pour les publications avec DOI, source : Crossref pour le moment).
  • Optionnel : Comparez cette liste d’auteurs avec une liste de chercheurs interne pour avoir une colonne avec les membres du labo uniquement.
  • Cliquez sur Rechercher

  • Patientez

  • Le fichier .csv est prĂȘt !

⚙ C2LabHAL comment ça marche ?

L’intĂ©rĂȘt de le dĂ©cliner Ă  l’échelle d’un Ă©tablissement : simplification extrĂȘme de l’interface - on choisit un labo dans la liste, l’annĂ©e de dĂ©but, l’annĂ©e de fin, et c’est tout !

 

https://c2labhal-nantes.streamlit.app

 

 

Â đŸ«  C2LabHAL-nantes, une premiĂšre dĂ©clinaison locale !

labos_list = [
    {
        "collection": "CAPHI",
        "scopus_id": "60105490",
        "openalex_id": "I4387152714",
        "pubmed_query": "(CAPHI[Affiliation]) OR (\"CENTRE ATLANTIQUE DE PHILOSOPHIE\"[Affiliation]) OR (\"EA 7463\" [Affiliation]) OR (EA7463[Affiliation]) OR (UR7463[Affiliation]) OR (\"UR 7463\"[Affiliation])"
    },
    {
        "collection": "CFV",
        "scopus_id": "60105524",
        "openalex_id": "I4387153064",
        "pubmed_query": "(CFV[Affiliation]) OR (\"EA 1161\"[Affiliation]) OR (Viete[Affiliation])"
    },
    {
        "collection": "CREAAH",
        "scopus_id": "60105602",
        "openalex_id": "I4387153012",
        "pubmed_query": ""
    },

C'est dĂ©clinable trĂšs facilement pour n’importe quelle universitĂ© : il suffit d’avoir la liste des collections HAL, identifiants Scopus et OpenAlex et les requĂȘtes pubmed et de les ajouter au fichier Python.

https://github.com/guillaumegodet/c2LabHAL

 

Guillaume GODET
Chef du service Bibliométrie
Département SystÚme d'Information et Appui à la Recherche
BU Nantes Université
guillaume.godet@univ-nantes.fr

 

N'hĂ©sitez pas Ă  me contacter pour plus d'informations ! 😊

 

📞 Contact

deck

By guillaume godet