9 Septembre 2025
1
2
3
Ensemble de théories et techniques qui confèrent à des machines la capacité d'accomplir des tâches attribuées aux être intelligents
50
>2011
93-2011
87-93
80-87
74-80
56-74
Naissance
de l'IA
1er hiver
L'age d'or
2e age d'or
2e hiver
maturité
discrète
Essor du
Deep Learning
>2019
Explosion
IA gen
Machine learning is a field of artificial intelligence that uses statistical techniques to give computer systems the ability to "learn" (e.g., progressively improve performance on a specific task) from data, without being explicitly programmed
From Arthur Samuels (source : Wikipedia)
Traitement
du
langage naturel
Systèmes
prédictifs
Robotique
Traitement de
l'image et du son
Systèmes de
recommandation
Optimisation
& planification
Aide à la
décision
INDUSTRIE
FINANCE
COMMERCE
MEDECINE
ARTISTIQUE
MEDIA
TRANSPORT
Maintenance
prédictive
Robots
Gestion de flux
Scoring de crédit
Détection de fraude
Trading automatique
Marketing prédictif
Analyse de sentiment
Découverte de traitements
Prédictions de succès ou récidive
Anticipation de pannes
Robots cuisiniers
Robots
Design génératif
Synthèse de sons
Synthèse d'image
Gestion de ressources
Aide au diagnostic
Véhicules autonomes
Résumé automatique
Génération de contenu
Recommandation de produits
Recommandation de
contenus
légendage
Assistance à la veille
2017
2020
2019
2018
CoVE
BERT
ELMo
T5
CVT
ULMFiT
GPT
CamenBERT
FlauBERT
ALBERT
RoBERTa
GPT-3
ELECTRA
XLNet
BART
GPT-4
Bard
> 2023
LLama 3
IA générative
deep learning
machine learning
IA
L'algorithme du plus court chemin :
à la base du GPS
Un algorithme de système expert
Entrainement (généraliste) + spécialisation
Inférence
Déploiement & Intégration (via API)
Distinguer model des logiciels
Parler des modele de fondation et de leur dérivés
Depuis quelques années les progrès de la recherche ont abouti à des IAs capables de générer des données réalistes
vidéos
dessins
illustrations
photo realistes
...
Code
paragraphes
questions / réponses
Listes
résumés
...
Les Large Language Models (LLM)
voix
musique
...
assistant vocaux
Posts
De très gros réseaux de neurones
Entrainés très longuement sur des jeux de données gigantesques ...
... à prédire chaque prochain token d'un texte
Conception & Entraînement
"L'apprentissage automatique est une branche de l'IA
Bonnes capacités de généralisation
Mais pas pour tous les problèmes !
Le réseau entrainé a appris des représentations généralisables
Inférence
Génération de texte token par token
Ré-entrainement sur des données spécifiques
Sélectionner un ensemble de documents à donner en contexte
fine tuning
En tant qu'expert de la data science programmant en python ...
contexte : prompt
Retrieval Augmented Generation (RAG)
Petit
Moyen
Grand
1.5b - 5b
> 100b
10b - 15b
Pages des modèles de Hugging Face
Whisper
Un des modèles le plus performant (environ 8% de WER)
Multilangue (98 langage supporté)
dont le français
Le chat joue un coup interdit !
from kaggle
IoT
Big Data
Data centers
Entrainement des IA
internet : appels aux APIs
5G
ordinateurs
téléphones
Une grande quantité de donnée !
serveurs
Inférence (utilisation)
Données générées
ecrans
370 BMW
Consommation annuelle du Danemark !
coût pour GPT-3 : des millions de $
120 foyers américains pendant 1 an
Interagir avec 25 prompts
0.5 L
Ils mesurent des indicateurs sur différents aspects des modèles d'IA
Toujours évaluer les IAs par des métriques !
en application depuis mai 2018 !
Des régulations se développent également par pays
les systèmes d'IA sont classifiés suivant 4 niveaux de risques pour les utilisateurs
applicable in 2025
IAs considérée comme une menace pour les personnes
impact négatif limité sur la vie des personnes
8 domaines sensibles identifés
Certaines applications de l'IA gen
IA qui devront satifsfaire à des exigences de transparence
devront être enregistrée sur le portail de l'UE
services en ligne, assistant vocaux, etc ...
IA de jeux vidéos, anti-spam, ...
manipulation sociale
classement social
pas d'impact significatif sur les persionne
Propose un méthode pour implémenter l'IA responsable dans les organisations
Outils pré-déployés en ligne
Outils à installer sur vos propres infrastructures
Outils Open source
Outils à installer
localement
Zone Europe
Hors Europe
Mise à l'échelle difficile
Plus de maintenance
Plus souverain
Outils pré-déployés
en ligne
Outils à déployer sur vos propres infrastructures
Meilleure souveraineté
Outils à installer
localement
Prêt à l'emploi
Difficile mutualisation
Plus de maintenance
Temps & couts de déploiement
Protection des données
Mettre en avant votre expertise métier + IA
Mettre en avant votre spécialisation pour le français
Mettre en avant votre approche éthique
Retranscription de réunions
Reconnaissance du locuteur
Résumé et identification de points clés
Amélioration de l'audio
Performance et robustesse
Facilité d'utilisation
niveau de souveraineté et d'éthique
Contrainte de mise en place
Uniquement les solutions qui présentaient un niveau de performance, d'utilisabilité ou d'éthique suffisant
Cas d'usage
Technologies
Challenges
Assistance à la retranscription textuelle d'enregistrements vocaux
Algorithmes d'IA de speech-to-text
Bonnes performances avec du français professionnel (jargon)
Performance et robustesse plutôt bonnes avec les modèles récents
Protection des données sensibles
Permet la séparation des locuteur et marquage temporel + la retranscription
Multilangue (dont le français)
Possibilité d'ajout d'add on pour une meilleure prise en compte du jargon
Brique logicielle en ligne spécialisée pour l'analyse de réunions
Basé sur le modèle open source Whisper
Facilité d'utilisation 5/5
Version gratuite avec 10h/mois
Facturation pay-as-you-go ou formule entreprise
Audio & vidéo
Performance et robustesse 4/5
Bonne performance a priori (94% accuracy)
Pas de tests prouvant ces performances
niveau de souveraineté et d'éthique : 4,5/5
Entreprise Française respectant le RGPD
Norme de sécurité :
HIPAA & SOC 2
Données vocales conservées ?
Facilité de mise en place 5/5
Utilisable directement en ligne
Intégration possible dans vos infrastructures (via une API)
Brique logicielle pour la prise de notes et de résumé des points imporants
Multilangue (dont le français)
Brique logicielle en ligne spécialisée pour la retranscription et l'analyse de réunion
Performance et robustesse ?
Pas de benchmark de performances
Contrainte de mise en place 4/5
API & SDK de retranscription intégrable facilement
Pas possible l'utiliser sur vos infrastructures (pas d'API)
Données vocales conservées ?
niveau de souveraineté et d'éthique : 3.5/5
Entreprise Allemande respectant le RGPD
Usage de service américains
Facilité d'utilisation 4.5/5
Utilisable via plateforme en ligne
Abonnement 10$/mois
Intégrations (dont) Teams, Zoom, Google Meet
Fichiers audio & vidéo
Multilangue (dont le français)
Approche fortement orientée pour les métiers de la retranscription
Facilité d'utilisation 4.5/5
Utilisable via plateforme en ligne
Livraison en moins de 24h
Fichiers audio & vidéo
Niveau de souveraineté et d'éthique : 4/5
Certification RGPD + ISO 27001 et ISO 9001
Données vocales conservées ?
Performance et robustesse 4.5
85 à 100% de précision : contrôle de qualité par des locuteurs natifs
Facilité de mise en place 5/5
Utilisable directement en ligne
Intégration possible dans vos infrastructures (via une API)
Souveraineté maîtrisée !
En utilisant des modèles open source, il est possible de construire votre propre outil !
Nécessite des compétences techniques
Mise en place
Maintenance
A héberger dans votre propre infrastructure (serveur de calcul + d'interface)
Couts de départ élevés
Coûts moindre sur le long terme
Permet de faire évoluer l'outil
Modèle très performant et très utilisé
Différentes tailles de modèles
Fortement multi-langue
Modèle très récent (Juillet 2025) et bon en francais
Cout plus bas que ses concurrents
Petit modèles (Mini et Small) utilisables localement
Bientôt une intégration a la plateforme Mistral ?
Malgré un modèle très performant, le niveau d'éthique est très insuffisant
Hébergement de données aux US
Horodatage d'évènements
Multilangue (dont le français)
De bons résultats même dans les langues mal désservies
Brique logicielle en ligne spécialisée pour la retranscription
Laboratoire spécialiste ayant développé
leur propre modèle : Scribe
Aspects éthiques préocupants !
Facilité d'utilisation 5/5
Différents plans de facturation graduels
Fichiers audio & vidéo
Facilité de mise en place 5/5
Utilisable directement en ligne
Intégration possible dans vos infrastructures (via de multiples API)
Modèle Scribe à l'état de l'art
(a priori le plus performant)
Performance et robustesse 5/5
niveau de souveraineté et d'éthique : 1/5
Non respect a prioridu RGPD
Par défaut, données personnelles hébergées au US et fort risque d'utilisation
Modération automatisée et humaine
Technologies
Challenges
Identifier qui parle et à quel moment
Algorithmes d'IA
Tâche difficile lorsque plusieurs locuteurs parlent en même temps
Performance et robustesse encore variables
Protection des données sensibles
Cas d'usage
Permet la séparation des locuteur et marquage temporel + la retranscription
Brique logicielle en ligne spécialisée pour l'analyse de réunions
(Utilise pyannote pour la séparation des locuteurs)
Plateforme disponible pour l'utilisation prêt à l'emploi, mais plutôt destinée à des profils familiers avec la tech
Spécialisé dans la reconnaissance et segmentation des locuteurs
Outil basé sur un programme open source issu de travaux de la recherche en traitement du langage
Intègre aussi une brique logicielle de retranscription
Facilité d'utilisation 5/5
Version gratuite
Facturation pay-as-you-go ou formule entreprise
Audio & vidéo
Performance et robustesse 4/5
A priori, un des meilleurs pour la segmentation des locuteurs
Pas de tests prouvant ces performances
niveau de souveraineté et d'éthique : ?
Pas d'informations précises sur leur politique de traitement de données
Utilise (en partie) des briques open source
Données vocales conservées ?
Facilité de mise en place 5/5
Utilisable directement en ligne
Possibilité d'utiliser le code open source de pyannote et les API pour la segmentation du locuteur
Technologies
Challenges
Résumer un texte et en faire ressortir les points importants
Algorithmes d'IA
Dépendant de la bonne performance de la retranscrtiption audio
Performance et robustesse encore variables
Protection des données sensibles
Cas d'usage
Brique logicielle pour la prise de notes et de résumé des points imporant
Multilangue (dont le français)
Brique logicielle en ligne spécialisée pour l'analyse de réunions
Possède une brique d'anlayse de contenu
Brique logicielle pour la gestion de réunion
avec beaucoup d'intégrations (vers des logiciels connus)
Technologies
Challenges
Résumer un texte et en faire ressortir les points importants
Algorithmes d'IA
Dépendant de la bonne performance de la retranscrtiption audio
Performance et robustesse encore variables
Protection des données sensibles
Cas d'usage
Outil combinant plusieurs fonctionnalités pour les réunion :
Réduction de bruit
Notes et résumé automatique
Correction de l'accent du locuteur
Cas d'usages et cible plutôt orientée pour les call centers
Performance et robustesse ?
Pas de benchmark de performances mais une brique provenant de la recherche
Contrainte de mise en place 4/5
code & API intégrable facilement
Facilité d'utilisation 4.5/5
Utilisable via plateforme en ligne
Abonnement
Intégration aux outils de réunion
Outil assez polyvalen
niveau de souveraineté et d'éthique : ?
Entreprise américaine : données hébergées hors UE
Outil proposant plusieurs fonctionnalités pour l'amélioration de l'audio des réunions :
suppression de bruits, de sons parasites,
de silences, de bégaiement
Cas d'usage plutôt orienté pour la gestion des podcasts
Tableau récapitulatif & comparatif des outils sélectionnés
Testez, si possible pour chaque cas d'usage les solutions qui vous intéressent
Partagez vos commentaires de manière collaborative, sur ce document :
Pour chacun des outils testés, indiquez votre préférence
Classement de chaque outil par la médiane des scores individuels