Nicolas Rochet
Décembre 2025
J1
J1 pm
J2
Extraire des connaissances
à partir d'un vaste ensemble de données
Les données & méthodes d'analyses sont choisies en fonction du problème
V
S
Déployer &
mettre en production
Structurer les données
Principes d'éthiques
Etude du besoin
Auditer les données
Veille scientifique et technique
Implémenter
algorithmes & modèles
Packaging du code
Livraison
Rapport
Communiquer
Collecte de données
Préparation de donnes
Traitement
des données
Déploiement
Exploration des données
Modelisation
Identification de pattern
Besoin
Problème à résoudre
Réalité
Communication
Visualisation
Rapport
produit/service
Prise de décisions
données
nettoyées
Algorithmes
Adopter les principes d'ethic-by-design !
idée
definition
du
projet
Preuve
de
Concept
développement & déploiement
retours
utilisateur
veille éthique
Intégration & Déploiement continu (CI/CD)
Auto-hébergement
Service pré-déployés
Meilleur contrôle des données
Plus de souveraineté
Nécessite plus de compétences
Nécessité d'assurer la maintenance & scalabilité
Nécessité de gérer la cyber sécurité
Meilleure maitrise des coûts
Moins de contrôle sur les aspects éthiques
Facturation au service couteuse sur le long terme
Nécessite peu de compétences
Bonne scalabilité
Certains aspects pris en charge
Python récent + paquets classiques en data science
Environnement de développement intégré (IDE)
Gestionnaire de paquets
Environnement vitrtuel
IA pour l'assistance au code ?
Dépot Git
Paquets classiques en data science
numpy & pandas
scikit learn
stats model
matplotlib
seaborn
plotly
...
Installez les librairies additionnelles au fur et a mesure
pip install <paquet>conda install <paquet>Votre environnement pour produire du code
...
Jupyter lab
Visual Studio Code
PyCharm
Installation
mise à jour
gestion des dépendances
suppression
...
pip
Installation
conda
pipx
poetry
...
garantit que vous utilisez uniquement les versions ciblés des paquets
facilite le partage des paquets aux mêmes versions
facilite la gestion de tous vos projets
conda
virtualenv
...
Créez un dépot local
Invitez vos collaborateurs
Initialisez votre projet par un template
...
Créez un dépot distant
Poussez votre 1er commit !
Chaque collaborateur le récupère en local
Chaque développeur crée une branche par tache
... pousse et demande la revue et la fusion
... développe du code et enregistre des commit
Le code fonctionnel est ajouté à la branche principale
De nombreux services proposent en proposent
Auto complétion
Génération de code
Debug & revue de code
Donner le bon contexte
Itérer pour avoir des prompts efficaces
Ecrire des commentaires
Créer un nouveau chat pour
chaque feature
Les outils les mieux classés sur SWE-bench !
devstral
...
Donner une structure à votre projet
Intégrer les fichiers utiles : templates, fichier de configuration
C'est à vous de la penser : ne déléguez pas cette partie à l'IA !
Conseil
Générez un template
Architecture des dossiers
Installer les librairies
Fichiers de configuration
Fichier de Todo
Peuplez les scripts de commentaires
Définir les tests
Planifiez et préparez le suivi de projet
Collectez & explorez vos données
Mettez en place une pipeline de préparation de données
Mettez en place une pipeline de modélisation
Evaluez & discutez vos résultats
Découpez votre projet de tâches élémentaires parmi les étapes :
Réitérez !
Notebook / rapport
Déploiement ?
Outil ?
Dash board
Application
Local ? En ligne ?
Qualité du rendu ?
Quelle interface graphique ?
Quel backend ?
Commencez par des notebooks d'exploration
Enregistrez l'historique de vos itérations
Reformatez chaque brique reproductible en fonction ou classe !
Modularisez votre code
Un notebook par thématique
Discutez des résultats
Créer une pipline automatisable
CODE
MODELES
TRAITEMENTS
METRIQUES
Mettez en place une chaîne de CI/CD
Pull request / merge request
Faites la revue de code
Codez des tests unitaires
Mettez en place d'autres actions automatiques
l'IA est plutot bonne pour ça !
Vérification de la qualité du code
Agent IA ?
l'IA peut vous assister
Pylint
Organisez votre projet comme un package python
Utilisez des conteneurs
Rendez votre projet déployable
systèmes informatique autonome qui interagit avec son environnement pour accomplir des objectifs spécifiques.
...
Depuis quelques années les progrès de la recherche ont abouti à des IAs capables de générer des données réalistes
vidéos
dessins
illustrations
photo realistes
...
Code
paragraphes
questions / réponses
Listes
résumés
...
Les Large Language Models (LLM)
voix
musique
...
assistant vocaux
Posts
Depuis quelques années les progrès de la recherche ont abouti à des IAs capables de générer des données réalistes
vidéos
dessins
illustrations
photo realistes
...
Code
paragraphes
questions / réponses
Listes
résumés
...
Les Large Language Models (LLM)
voix
musique
...
assistant vocaux
Posts
De très gros réseaux de neurones
Entrainés très longuement sur des jeux de données gigantesques ...
... à prédire chaque prochain token d'un texte
Conception & Entraînement
"L'apprentissage automatique est une branche de l'IA
Bonnes capacités de généralisation
Mais pas pour tous les problèmes !
Le réseau entrainé a appris des représentations généralisables
Inférence
Génération de texte token par token
Ré-entrainement sur des données spécifiques
Sélectionner un ensemble de documents à donner en contexte
fine tuning
En tant qu'expert de la data science programmant en python ...
contexte : prompt
Retrieval Augmented Generation (RAG)
Petit
Moyen
Grand
1.5b - 5b
> 100b
10b - 15b
Pages des modèles de Hugging Face
IoT
Big Data
Data centers
Entrainement des IA
internet : appels aux APIs
5G
ordinateurs
téléphones
Une grande quantité de donnée !
serveurs
Inférence (utilisation)
Données générées
ecrans
370 BMW
Consommation annuelle du Danemark !
coût pour GPT-3 : des millions de $
120 foyers américains pendant 1 an
Interagir avec 25 prompts
0.5 L
en application depuis mai 2018 !
Des régulations se développent également par pays
les systèmes d'IA sont classifiés suivant 4 niveaux de risques pour les utilisateurs
applicable in 2025
IAs considérée comme une menace pour les personnes
impact négatif limité sur la vie des personnes
8 domaines sensibles identifés
Certaines applications de l'IA gen
IA qui devront satifsfaire à des exigences de transparence
devront être enregistrée sur le portail de l'UE
services en ligne, assistant vocaux, etc ...
IA de jeux vidéos, anti-spam, ...
manipulation sociale
classement social
pas d'impact significatif sur les persionne
Pour entraîner ou spécialiser vos modèles
...
...
Données fermées
Documents d'entreprises
services payants
Campagne de collecte
data brokers
Attention à la qualité et la représentativité des données !
Code
No code/low code
RapidMiner
Plateformes IA/Data
...
Mettre en place des outils pour suivre l'évolution tout au long du cycle de vie
Mesurer des métriques pour suivre la performance
Mesurer des métriques pour suivre les biais
Gérer les différentes versions des pipelines
...
Data warehouse
Data lake
Data Mesh
Big Data
SQL
NoSQL
Graphe
Vecteur
TimeSeries
Différentes stratégies possibles
...
Un service d'IA prédéployé
Une IA ouverte
ou
+ API
Un hébergeur (modèle)
+
...
Intégrez une fonctionnalité IA dans votre logiciel
+
Serveur de calcul
Un hébergeur 'classique'
ou
Mettre en place la structure du code
Assurer l'intégration et le déploiement continu
Produire le code (backend, front end)
Contribuer à la maintenance et mise à jour