9 Avril 2026
Nicolas Rochet
Mathématiques
Informatique
"Domain
knowledge"
Discipline utilisant des méthodes scientifiques, algorithmes et systèmes d'information pour extraire des connaissances à partir de données structurées ou non structurées
Science de l'information
Ensemble de théories et techniques qui confèrent à des machines la capacité d'accomplir des tâches attribuées aux être intelligents
50
>2011
93-2011
87-93
80-87
74-80
56-74
Naissance
de l'IA
1er hiver
L'age d'or
2e age d'or
2e hiver
maturité
discrète
Essor du
Deep Learning
>2019
Explosion
IA gen
IA GENERALE
Systèmes Experts
RAISONNEMENT
REPRESENTATION DES CONNAISSANCES
Planification
NEURO SYMBOLIQUE
Apprentissage profond
APPRENTISSAGE AUTOMATIQUE
INTELLIGENCE SOCIALE
Modèles Génératifs
LLMs
VLMs
SYSTEMES MULTI AGENTS
Prise de décision
Apprentissage par renforcement
ROBOTIQUE
VISION PAR ORDINATEUR
TRAITEMENT DU LANGAGE
RESOLUTION DE PROBLEMES
Traitement de
l'image et du son
Traitement
du
langage naturel
Systèmes de
recommandation
Systèmes
prédictifs
Aide à la
décision
Robotique
Optimisation
& planification
INDUSTRIE
FINANCE
COMMERCE
MEDECINE
ARTISTIQUE
MEDIA
TRANSPORT
Maintenance
prédictive
Robots
Gestion de flux
Scoring de crédit
Détection de fraude
Trading automatique
Marketing prédictif
Analyse de sentiment
Découverte de traitements
Prédictions de succès ou récidive
Anticipation de pannes
Robots cuisiniers
Robots
Design génératif
Synthèse de sons
Synthèse d'image
Gestion de ressources
Aide au diagnostic
Véhicules autonomes
Résumé automatique
Génération de contenu
Recommandation de produits
Recommandation de
contenus
légendage
Assistance à la veille
IA générative
deep learning
machine learning
IA
2017
2020
2019
2018
CoVE
BERT
ELMo
T5
CVT
ULMFiT
GPT
CamenBERT
FlauBERT
ALBERT
RoBERTa
GPT-3
ELECTRA
XLNet
BART
GPT-4
Bard
> 2023
LLama 3
L'algorithme du plus court chemin :
à la base du GPS
Un algorithme de système expert
Le chat joue un coup interdit !
Supervisé
...
Auto supervisé
Non supervisé
Semi Supervisé
Apprentissage par renforcement
"machine learning is the most popular domain of AI
0
data
label
Une partie seulement des données sont labelisées
Transformers
...
Large Langage Models (LLM)
Vision Transformers (ViT)
Architecture reprise dans différents types de modèles
Modèles de raisonnement
Modèles multimodaux
...
Depuis l'année 2018 les progrès de la recherche ont abouti à des IAs capables de générer des données réalistes
vidéos
dessins
illustrations
photo realistes
...
Code
paragraphes
questions / réponses
Listes
résumés
...
Les Large Language Models (LLM)
voix
musique
...
assistant vocaux
Posts
L'architecture des Transformers
Générer/modifier des images
Architecture reprise dans différents types de modèles
Des capacités qui permettent de réaliser des tâches de plus en plus complexes
Extraction d'information
Résumer des infomations
Retranscrire du texte
Décrire une image
Produire un raisonnement
Résoudre des problèmes mathématiques
Coder des logiciels
...
...
Des capacités croissantes qui permettent de réaliser des tâches de plus en plus complexes
Petit
Moyen
Grand
1.5b - 5b
> 100b
10b - 15b
Pages des modèles de Hugging Face
De très gros réseaux de neurones
Entrainés très longuement sur des jeux de données gigantesques ...
... à prédire chaque prochain token d'un texte
Conception & Entraînement
"L'apprentissage automatique est une branche de l'IA
Bonnes capacités de généralisation
Mais pas pour tous les problèmes !
Le réseau entrainé a appris des représentations généralisables
Inférence
Génération de texte token par token
Ré-entrainement sur des données spécifiques
Sélectionner un ensemble de documents à donner en contexte
fine tuning
En tant qu'expert de la data science programmant en python ...
contexte : prompt
Retrieval Augmented Generation (RAG)
De très gros réseaux de neurones pré-entrainés capables d'être utilisés pour différentes tâches
On leur ajoute quelques composants
Un prompt système
Des gardes fous et protections
Un entraînement supplémentaire : apprentissage par renforcement à partir de feedback humain (RLHF)
Ils sont à la base de pleins d'applications connues
Chatbot
IA pour l'image/vidéo
IA pour le raisonnement
...
Articuler une succession d’étapes de raisonnement, pour mieux orienter le modèle dans la génération de réponses
Résoudre un problème de maths
Réaliser de la veille
A la base de nombreux modèles de raisonnement aujourd'hui !
DeepSeek
GPT 4o
Claude Sonnet
...
Utile pour certaines tâches:
Choisir le bon modèle/service pour sa tâche
Avant de commencer
Benchmark de performance
Taille du modèle
Inspecter les conditions d'utilisations
In programme capable d'interagir avec son environnement, utiliser des données, pour accomplir des tâches
Quelques exemples
IA fermées
IA open source
...
code
desktop
Notebook LM
Ils mesurent des indicateurs sur différents aspects des modèles d'IA
Toujours évaluer les IAs par des métriques !
Générique
Spécialisés
les hallucinations
Donner des informations incorrectes
Inventer une source qui n'existe pas
Donner une réponse incorrecte a un problème
Le chat joue un coup interdit !
La qualité des données conditionne celle du modèle
Ces modèles sont statistiques par nature !
Les réseaux de neurones sont des boites noire :
manque d'interprétabilité
Les gros modèles nécessitent d'importante puissance computationnelle
Possible dépendance à des fournisseurs (cloud) souvent peu éthiques
from kaggle
L'apprentissage par renforcement (RLHF) encourage les réponses qui s'accordent avec les croyances de l'utilisateur (plutôt que la vérité)
prompt
réponse
feedback
RLHF
IoT
Big Data
Data centers
Entrainement des IA
internet : appels aux APIs
5G
ordinateurs
téléphones
Une grande quantité de donnée !
serveurs
Inférence (utilisation)
Données générées
ecrans
370 BMW
Consommation annuelle du Danemark !
coût pour GPT-3 : des millions de $
120 foyers américains pendant 1 an
Interagir avec 25 prompts
0.5 L
Investiguer les biais (données & modèles)
Respecter la vie privée
Connaître les impacts sur les utilisateurs
éviter les boites noires
Minimiser l'empreinte ecologique :
à l'entraînement
Favoriser l'ouverture :
Données d'entraînement, modèles, code
Comprendre les décisions des modèles
à l'usage
en application depuis mai 2018 !
Des régulations se développent également par pays
les systèmes d'IA sont classifiés suivant 4 niveaux de risques pour les utilisateurs
En application cette année !
IAs considérée comme une menace pour les personnes
impact négatif limité sur la vie des personnes
8 domaines sensibles identifés
Certaines applications de l'IA gen
IA qui devront satifsfaire à des exigences de transparence
devront être enregistrée sur le portail de l'UE
services en ligne, assistant vocaux, etc ...
IA de jeux vidéos, anti-spam, ...
manipulation sociale
classement social
pas d'impact significatif sur les persionne
Des normes pour choisir vos outils ou garantir la qualité de services utilisant l'IA
Ethique
Environnemental
Sécurité
Depuis Novembre 2017
Il existe de nombreuses chartes et principes hétérogènes mais je recommande l'approche de LabelIA
Auto hébergement
Software as a Service
Prêt à l'emploi
Préocupations éthiques
Personnalisation limitée
Nécessité de construire une infrastructure
Maintenance : partielle ou totale
Pas de maintenance
Meilleur controle de vos données
Open source & Open data permettant la personnalisation
ou
Une IA ouverte déployée par un tiers
...
Fournisseurs européens
5.L'intégrer dans votre logiciel
2. Choisir un modèle ouvert
4. Ré-entrainer le modèle
3. Le déployer dans une infrastructure
1. Identifier un cas d'usage
4. Spécialiser un modèle
avec des données spécifiques
Bases de données
Machine de calcul
API
Les technologies évoluent vers plus de facilitation de mise en place
Faites appel a un.e expert.e !
Les questions à se poser
Quelles garanties de sécurité sont mises en place ?
Quelles données sont utilisées ?
Ou sont elle hébergées ?
Les recommandations
Services européens
Pas de données brutes ni d'interaction
Pour quel usage ?
Uniquement ceux nécessaires
Certifications & normes ?
Les failles de sécurité des IAs
L'exfiltration de données
Les IAs qui tiennent des propos dangereux
Les agents IA qui peuvent faire des actions nuisibles
...
Des gardes fous
Faire des audits de sécurité
Filtrer les réponses
Mettre en place une charte d'utilisation
Collecte de données
Structuration de données
Transformations de donnée
Exploration de donnnées
Modèlisation
Entraaînement
Pipelines & automatisations
Documentation
Inférence
Fine tuning
specialisation
Déploiement
Gouvernance
Mutualisation
Propose un méthode pour implémenter l'IA responsable dans les organisations
...
IMAGES
LANGUAGE
SERIES DE NOMBRES
SONS
METIERS
photos
voix
bruits
avis
commentaires
conversations
météo
capteurs
meta données
site web
applications
logiciels
tweets
ventes
stock
logistique
vidéos
Réseaux sociaux
amis
partages
likes
abonnements
musique
forums
META DONNEES
Application Programming Intefrace
accessible et téléchargeables publiquement
Extraction de données à partir de documents structurés ou non
Requêtes à un service pour automatiser l'extraction
Volume
Variété
Clustering d'articles
Veille et revue de littérature
Extraction d'information
Résumé
Classification de documents
OCR
Fouille de données
Analyse de données
Visualisation exploratoire
Analyse de tendances
Langage parlé
Transcription automatique
Reconnaissance du locuteur
L'assistant de recherche personnalisé de Google
Complétement ouvert : data, model, code !
Trouve des informations
Analyse des données
Résume
Analyse de réseaux sociaux
Graphes de diffusion
Détection de communautés
Analyse de la désinformation
Analyse de sentiments
Analyse de discours & morphologique
Extraction de thèmes
Segmentation
Analyse sémantique
Extraction de terminologies
Extraction d'entitées nommées
Extraction de relations
Distribution de la sémantique
Grands Modèles de Langages
Analyse d'image/vidéo
Segmentation
Détection d'objets
Génération/retouche
Générer du son à partir d'un prompt
...
Plateforme d'IA vocale
multifonction & multi langue
Générer de la musique
...
Dans la plupart des plateformes musicales
Combinent des outils de traitement du texte, de l'image et de la vidéo
un système informatique autonome qui interagit avec son environnement pour accomplir des objectifs spécifiques.
...
Connecte des logiciels & agents IAs pour créer des chaîne de traitements automatisés
Des infrastructures informatiques indispensables
...
Entraîner des modèles d'IA
Stocker et organiser les données
Déployer des IA
Gérer le code
Dans le cloud
Sur vos machines
0. Constituez des groupes
Construisez collectivement votre feuille de route pour la mise en place d'outils data/IA
1. Faites l'inventaire de vos besoins
2. Réfléchissez aux outils et infrastructures à déployer
(collecte de données, hébergement des modèles)
3.Partagez vos conclusions
Departement / Community
Individus / groupe / laboratoire