Atelier :
découverte de l'IA générative
Nicolas Rochet
Juin 2025
Qui suis je ?


Data for Good

Activité participative
Partagez votre positionnement sur l'IA
Connectez vous pour participer :
https://app.wooclap.com/XXXX
IA générative
Ne vous servez pas de l'IA comme un bouton !
L'IA n'est pas un bouton
Une définition ?
L'étude et le design d'agents intelligents
Meilleure
que le hasard
Autant qu'un humain
Performances
Programmes
4 définitions
'Agir' comme un humain
'Agir' rationnellement
'Réfléchir' rationnellement
'Réfléchir' comme un humain
The automation of activities that we associate with human thinking, activities such as decision making, problem sloving, learning, ...
Bellmann, 1978
The art of creating machines that perform functions that require intelligence when performed by people.
Kurzweil 1990
Computationnal Intelligence is the study of the design of intelligents agents .
Poole et al. 1998
The study of mental faculties through the use of computationnal models
Charniak & Mc Dermott, 1985
Une définition simplifiée
Ensemble de théories et techniques qui confèrent à des machines la capacité d'accomplir des tâches attribuées aux être intelligents
Une brève histoire de l'IA
50
>2011
93-2011
87-93
80-87
74-80
56-74
Naissance
de l'IA
1er hiver
L'age d'or
2e age d'or
2e hiver
maturité
discrète
Essor du
Deep Learning
>2019
Explosion
IA gen
Disciplines de l'IA

Quelques domaines d'applications
Traitement de
l'image et du son
Traitement
du
langage naturel
Systèmes de
recommandation
Systèmes
prédictifs
Aide à la
décision
Robotique
Optimisation
& planification
Systèmes
de
recommandations
Produits / Services
Contenu
Personnes
Parcours
Evénements
...
Systèmes
prédicifs
Données
catégorielles
Données
spatio-temporelles
Météo
Pollution
...
Trafic
Age
Sexe
Données
physiologiques
Molécules
Données
avec des caractéristiques
Pannes
Aide à la
décision
Aide au
diagnostic
Détection
d'anomalie
Maintenance prédictive
Segmentation profils
Matching
Identifier des tendances
...
Flotte de véhicules
Optimisation & planification
Jeux
Poker
Echecs
Go
Shogi
Dota 2
Starcraft 2
Chaîne de
montage
Gestion de ressources
Matériel
Humains
Supply chain
Optimisation et planification


AlphaZero de DeepMind
OpenAI Bot pour Dota 2
Traitement de
l'image et du son
Description
d'une scène visuelle
Identification des objets
d'une scène visuelle
Colorisation d'images
Détection de pose
Transfert de style
Synthèse de sons
Capture de mouvements
Amélioration de photos
...
Reconnaître et décrire une scène visuelle


Identification des objets
d'une scène visuelle
Description
d'une scène visuelle


colorisation
Modifier une image/vidéo
Corriger des anomalies dans l'image
Image & video in painting
...
super resolution
améliorer la résolution d'une image (super resolution)

transfert de style (2015)
Modifier le style dans une image/vidéo
transfert de style vidéo et sur les simulation (2019)
Modifier une image/vidéo

... avec des intentions très discutables


Appliquer une perturbation à l'image pour la manipuler
... voire potentiellement dangereuses
Le trucage par les "deep fake"
ces mêmes méthodes peuvent aussi détecter les deep fake
Retouche & modification d'images
Retouches d'images avec Open AI Glide
Edition paramétrable de photos avec StyleFlow
Générer de l'image

Design génératif (Dream Catcher)
Générer des visages
(NVIDIA face generator)
dessin d'images réalistes
Dessiner une image réaliste à partir d'une ébauche
... et de videos
Changer l'exposition lumineuse d'une vidéo
(Google AI)
Edition de vidéos
Capture de poses et mouvements

Motion capture - Radical
Motion capture dans les vidéos
simulations réalistes deformables
Déformer des simulations en temps réel
génerer des environnements virtuels
Générer du son
... ou copier une voix !
Copier une voix à partir de 5 sec d'enregistrement !
Génération de vidéo


... aux modèles multimodaux
Multimodal input-out put models
Audio
Image
Video
Text
Input
Audio
Image
Video
Text
Output
Mod_les
Traitement
du
langage naturel
Synthèse vocale
Reconnaissance
du locuteur
Résumé
Traduction
Sous titrage
Synthèse de texte
Agents conversationnels
...
Reconnaissance
vocale
Analyse sémantique
Ecrire des ouvrages



Générer de la voix
synthèse vocale multi langue
Modèles de langages généralisés
Nouveaux modèles très "gros" basés sur le mécanisme d'attention (post 2018)
Capables d'effectuer plusieurs tâches avec de relatives bonnes performances :
réponse aux questions
résumé
génération de texte
traduction
...
... encore des questions éthiques
Des questions éthiques se posent concernant
Les biais dans les données
Les biais dans les modèles (entrainement, évaluation)
...
2017
2020
2019
2018
CoVE
BERT
ELMo
T5
Modèles de langages généralisés
CVT
ULMFiT
GPT
CamenBERT
FlauBERT
ALBERT
RoBERTa
GPT-3
ELECTRA
XLNet
BART
GPT-4
Bard
> 2023
...
LLama 3
Les IA génératives
Depuis quelques années les progrès de la recherche ont abouti à des IA capable de générer des données réalistes
Vers des capacités multi-taches
"Raisonnement"
Traduction
Résoudre des problèmes mathématiques
Des images
vidéos
dessins
illustrations
photo realistes
paysages
portraits
...
Du texte
Code
paragraphes
questions / réponses
Listes
résumés
...
Des sons
voix
musique
...
Les Large Language Models (LLM)
Résumer du texte
Répondre à des questions
Robotique



Robot Nao
Robot simulateur de patient Pediatric HAL
Robotique




Robot chirurgien
Shademan et al., 2016
Robots kiva
Quelques domaines métiers
INDUSTRIE
FINANCE
COMMERCE
MEDECINE
ARTISTIQUE
MEDIA
TRANSPORT
...
Maintenance
prédictive
Robots
Gestion de flux
Scoring de crédit
Détection de fraude
Trading automatique
Marketing prédictif
Analyse de sentiment
Découverte de traitements
Prédictions de succès ou récidive
Anticipation de pannes
Robots cuisiniers
Robots
Design génératif
Synthèse de sons
Synthèse d'image
Gestion de ressources
Aide au diagnostic
Véhicules autonomes
Résumé automatique
Ecriture automatique
Recommandation de produits
Recommandation de
contenus
légendage
Démystification
Disciplines de l'IA

Chat GPT n'est pas l'IA générative !

l'IA générative n'est pas l'IA !
Chat GPT n'est pas l'IA générative !

2017
2020
2019
2018
CoVE
BERT
ELMo
T5
CVT
ULMFiT
GPT
CamenBERT
FlauBERT
ALBERT
RoBERTa
GPT-3
ELECTRA
XLNet
BART
GPT-4
Bard
> 2023
...
LLama 3

l'IA générative n'est pas l'IA !
IA générative
deep learning
machine learning
IA
Il existe d'autres types d'IAs
que celle basée sur le machine learning


L'algorithme du plus court chemin :
à la base du GPS
Un algorithme de système expert
L'IA générative se base sur le machine learning
L'IA générative ne sais pas tout faire

Il est important de savoir ce qu'elle a sous le capot
L'IA générative fait des erreurs
Hallucinations
Biais
L'IA générative se base sur le machine learning
L'IA générative fait des erreurs

L'apprentissage
automatique
est
une
branche
de
l'IA
Challenge : la généralisation
L'IA générative se base sur le deep learning
Une énorme quantité
de données












Des algorithmes capables de généralisation
entraînement
Mais pas pour tous les problèmes !

Exemple : l'IA générative n'est pas bonne pour les jeux

Le chat joue un coup interdit !

Les IAs génératives
IAs génératives ?
Depuis quelques années les progrès de la recherche ont abouti à des IAs capables de générer des données réalistes
Des images
vidéos
dessins
illustrations
photo realistes
...
Du texte
Code
paragraphes
questions / réponses
Listes
résumés
...
Les Large Language Models (LLM)
Des sons
voix
musique
...
"Raisonnement"
Traduction
Résoudre des problèmes mathématiques
Résumer du texte
Répondre à des questions
Vers des IAs aux capacités multi-tâches
Conduire un véhicule
Analyse de sentiments

Des capacités de 'raisonnement'
De très gros réseaux de neurones
Entrainés très longuement sur des jeux de données gigantesques ...
... à prédire chaque prochain token d'un texte
Le réseau apprend des représentations complexes (embeding)
Exemple simplifié de la génération de texte
Conception & Entraînement
"L'apprentissage automatique est une branche de l'IA
Bonnes capacités de généralisation




Le réseau entrainé a appris des représentations généralisables
Exemple simplifié de la génération de texte
Inférence
Génération de texte token par token
Ré-entrainement sur des données spécifiques
Sélectionner un ensemble de documents à donner en contexte


fine tuning
En tant qu'expert de la data science programmant en python ...
contexte : prompt
Retrieval Augmented Generation (RAG)
+
Différentes "tailles" de modèles

On rencontre souvent 3 tailles
Petit
Moyen
Grand
1.5b - 5b
> 100b
10b - 15b
Capacités croissante
Pages des modèles de Hugging Face
Comment bien choisir son IA ?
La nécessité de bien choisir
Différents critères : éthique, performance
Conseils pour bien choisir
Ai-je toujours besoin d'IA
Prix
Fonctionnalités
Transparence de la solution
Hébergement des données
Critères de choix
Performances
Un ensemble de métriques à étudier
Suivre leur évolution au fur et a mesure des utilisation
Evaluation et suivi d'indicateurs
https://www.vellum.ai/llm-leaderboard
Benchmarks & leaderboard
Les sites de benchmark
Les outils utilisant l'IA générative
Modèles vs logiciels
Gestion d'images
Leurs capacités
Retouches
Image-to-image
Prompt-to-image
Etendre l'extérieur d'une image
Générer un image à partir d'une image
Générer un image à partir d'une instruction textuelle
Ajouter/supprimer des éléments
Changer de style
Améliorer la résolution
IAs génératives de texte
Les plus connues (mais non les seules)
IAs génératives de texte
Les modèles de fondation ouverts (les plus connus)

Falcon
Claude

Llama 3

Large Langage Model Meta AI
Assistants de code
Les modèles de fondation ouverts (les plus connus)
Refact.ai
Claude Code

Hands on Ai
IAs génératives d'images
DALL-E

Stable diffusion
MidJourney
Groupe CompViz

Les plus connues
IAs génératives d'images
Générer des diagrammes



IAs génératives de vidéos


IA génératives de sons
Exemple : Stable audio

Générer du son à partir d'une instruction texte (prompt)
Assistants
Dust
Les agents IA
Concepts/Cas d'usage/démo
Bebchmark
A tour of some tools for Machine Learning
Plateforms & comunities
Code frameworks


To build & deploy AI models

Classical
Machine Learning
Deep learning
Large Langage Models (LLM)
Demos
Pre-trained models & notebooks code
Using Spaces to build a prototype
Generate Music
Segment object and video


SaaS
A sample of solutions
...
...
Generative AI
Solutions + calcul providers
No-Code
Sovereign AI
...
...
To be called with an API
With a Graphical User Interface (GUI)
Perspectives
Les promesses vs les revers
Les promesses
Les dangers
Problème de sécurité
Hallucinations
Biais
Desinformation
Saturation de l'attention:
Ex des IA slope
... mais pas autant que dans l'imaginaire
Les progrès de ses dernières années en IA sont impressionnants !
MAIS on est encore loin d'une Intelligence Artificielle Générale ou d'une Intelligence humaine


Extrait du film
Ex Machina
Extrait du film Her

Impacts et enjeux de l'IA
Société
Organisations
Individus
Nuisance écologique
Suppression d'emplois
Induire ou renforcer des inégalités
Invasion de la
vie privée
risques
progrès
Faible prise de conscience
Risque de
dépendance technologique
Amélioration des
conditions de travail
Amélioration du niveau de vie
Assistance de l'humain
Résoudre des problèmes systémiques
Accompagner les progrès de la science
Aspects réglementaires & éthiques
Réglementation
RGPD
AI Act
OWASP
Chartes éthiques
Internationales
Nationales
Portée par des groupes
Labels
Considérations éthiques
Nécessité d'encadrer l'IA par de l'éthique
Impact environnemental croissant des IAs
Biais des données et modèles
Découverte de l'IA générative
By Nicolas Rochet
Découverte de l'IA générative
Atelier de découverte de l'IA générative
- 24


