Data Driven Decision making

Nicolas Rochet

Définition & objectifs

Evaluer, tester, optimiser des processus existants

Découvrir et mettre en place de nouvelles stratégies

Prendre des décisions organisationnelles basées sur l'extraction de connaissances appropriées issues de l'analyse de données

Exemples

Evaluer, tester, optimiser des processus existants

Découvrir et mettre en place de nouvelles stratégies

Réduire les couts

Automatiser des tâches

Aide à la décision

Identifier des processus peu efficaces

Identifier des disfonctionnements organisationnels

Innover

Proposer de nouveaux produits/services ...

Améliorer le ciblage clients/concurrents

Diversifier son activité

...

A/B Testing

Communication

Data story telling

Tableau de bord

Data Visualisation

Analyse de données

Systèmes d'information

Statistiques

IA

Langages informatiques

Base de données

Différents domaines

Data Science

Pilotage

Reporting

Data mining

Business

Intelligence

Décision

API(s)

Big Data

Decision Science

Origines & évolutions

Analyse de données utilisée par les statisticiens en l'absence

de théories a priori

Essor technique

Systèmes d'information

Puissance de calcul

Développement de méthodes décisionnelles data-driven dans les grosses structures

Essor de la recherche en

Analyse de données

Se répand dans

la plupart des organisations

Etapes

Définir les besoins & objectifs

Identifier les sources de données

Collecter, architecturer, préparer ces données

Explorer & analyser les données

Communiquer les insights

Mettre en place des actions

Evaluer leur efficacité

révéler des connaissances cachées

évaluer le processus ciblé

VS

3

2

4

5

6

1

7

Les questions clés

Quels métiers impliqués ?

Quels objectifs ?

Quelles données ?

disponibles

a acquérir

equipe data

équipe communication

+ tous les métiers conçernés !

décisionnaires

Categories de données

IMAGES

LANGUAGE

SERIES DE NOMBRES

SONS

METIERS

photos

voix

bruits

avis

commentaires

conversations

météo

capteurs

meta données

site web

applications

logiciels

tweets

ventes

stock

logistique

vidéos

Réseaux sociaux

amis

partages

likes

abonnements

...

musique

vers le Big Data

VARIETE

VOLUME

VELOCITE

VERACITE

Fouille de données

ou

data mining

Définition

La fouille de données est l'art d'extraire des connaissances à partir d'un vaste ensemble de données sans hypothèses de départ

Modèles

Patterns
(ou comportements)

Une structure caractéristique qui se manifeste dans un petit nombre d'observations

Un modèle est un résumé global
des relations entre variables, permettant de comprendre des phénomènes, et d’émettre des
prévisions

Ex: segmentation client

Ex: modèle prédictif de ventes

Data mining et KDD

Le data mining est une "étape" d'un processus général d'information: le Knowledge Discovery in Databases

Sources de données

Fouille de données

Mise en forme des connaissances

Exploitation & Déploiement

Base de données

Entrepôt de donnée

Fichiers

Logiciels

Documents papier

Structuration

Modèles

Connaissances

Enrichissement

Informatique Décisionnelle

ou

Business Intelligence

 

Définition

Domaine de l'informatique qui désigne les moyens, les outils et les méthodes qui permettent de collecter, consolider, modéliser et restituer les données d'une organisation  pour l'aide à la décision

De nombreux outils

Différents métiers

Communiquants

Décideurs

Managers

Logiciels Data Viz

Plateforme SaaS

Système d'information

Métiers de la data

Domaines d'applications

Identifier des patterns

Former des groupes

Identifier des comportements

Améliorer la relation client

Comportement d'achats

Segmentation client

Détection de fraude

Marketing ciblé

Optimisation rayonage

Aide à la décision

Identifier des relations

...

Identifier des communautés dans un réseau

Erreur de mesures

Recommander

Systèmes

de

recommandations

Produits / Services

Contenu

Personnes

Parcours

Evénements

...

Système prédictifs

...

Comportements

Tendances

consommation électrique

comportement d'achats

évolution du stock

cours boursier

Evolutions

analyse de risques

churn

Classement

scoring client

fraude

détecter des attaques

marketing prédictif

performances sportives

production

pannes

déplacements

Applications issues des derniers progrès de l'IA

Traitement de
l'image et du son

Traitement

du

langage naturel

Robotique

Optimisation

& planification

Traitement de
l'image et du son

Description

d'une scène visuelle

Identification des objets

d'une scène visuelle

Colorisation d'images

Détection de pose

Transfert de style

Synthèse de sons

Capture de mouvements

Amélioration de photos

...

Reconnaître et décrire une scène visuelle

Identification des objets

d'une scène visuelle

Description

d'une scène visuelle

colorisation

Modifier une image

Nettoyer et améliorer des photos - 2019

transfert de style - 2015

Modifier une image/vidéo

transfert de style vidéo - 2019

Modifier une image/vidéo

... avec des intentions très discutables

Appliquer une perturbation à l'image pour la manipuler

... voire potentiellement dangereuses

Le trucage par les "deep fake"

ces mêmes méthodes peuvent aussi détecter les deep fake

génération d'image

Générer de l'image

design génératif

Générer du son

Traitement

du

langage naturel

Synthèse vocale

Reconnaissance
du locuteur

Résumé

Traduction

Sous titrage

Synthèse de texte

Agents conversationnels

...

Reconnaissance
vocale

Analyse sémantique

Ecrire des ouvrages

Générer de la voix

synthèse vocale multi langue

Flotte de véhicules

Optimisation & planification

Jeux

Poker

Echecs

Go

Shogi

Dota 2

Starcraft 2

Chaîne demontage

Gestion de ressources

Matériel

Humains

Supply chain

Optimisation et planification

AlphaZero de DeepMind

OpenAI Bot pour Dota 2

Robotique

Robot Nao

Robot simulateur de patient Pediatric HAL

Robotique

Robot chirurgien

Shademan et al., 2016

Robots kiva

Par secteurs d'activité

INDUSTRIE

FINANCE

COMMERCE

MEDECINE

ARTISTIQUE

MEDIA

TRANSPORT

...

Maintenance

prédictive

Robots

Gestion de flux

Scoring de crédit

Détection de fraude

Trading automatique

Marketing prédictif

Analyse de sentiment

Découverte de traitements

Prédictions de succès ou récidive

Anticipation de pannes

Robots cuisiniers

Robots

Design génératif

Synthèse de sons

Synthèse d'image

Gestion de ressources

Aide au diagnostic

Véhicules autonomes

Résumé automatique

Ecriture automatique

Recommandation de produits

Recommandation de

contenus

légendage

Optimisation de rayonage

Mettre en place une équipe

Une myriade de données disponibles

IMAGES

LANGUAGE

SERIES DE NOMBRES

SONS

METIERS

produits

photos

voix

bruits

avis

commentaires

conversations

météo

capteurs

meta données

site web

applications

logiciels

tweets

ventes

stock

logistique

vidéos

Réseaux sociaux

amis

partages

likes

abonnements

...

... et a acquérir

Données a rendre exploitables

numeriser

structurer

nettoyer

Stocker

Open Data

Achat de données

data broker

scraping de données

web

réseaux sociaux

Enquêtes

questionnaires

jeux

Un myriade d'outils

RapidMiner

KNIME

SPSS

Weka

R

Python

Spark

Tableau Software

...

...

Plateformes Data Science

Logiciels BI

Ecosystème Data Science

SAP

SAS

Utilisabilité

 Ecosysteme Hadoop

Google Cloud AI

AWS

Microsoft Azure

Scikit learn

Tensorflow

Pandas

+

Potentialité

Mise en place des métiers

Ethicien

Data Scientist

Data Architecte

Data Manager

Chercheur

Data visualiser

Data Analyste

Etapes projet

Managers

Décideurs

Communiquants

DPD

Designer

Exemples de cas d'usages

(de stratégie Data Driven)

Accès au données

Niveau de décision data-driven

Ressources humaines

Ressources techniques

Les "géants" du web

Les "géants" du web

Optimisation de la consommation

Batiments

Data centers

Optimisation de l'expérience client

Personalisation des services

Publicités ciblées

Marketing prédictif

Optimisation du management

Pilotage du temps de travail

Evaluation des managers

A/B testing

...

Optimisation de la logistique

flotte de véhicule

livraisons

Gestion de stock

Systèmes prédictifs

ventes

Analyse de sentiments

comportements

Evaluation de la performance

Gestion des ressources

Recommandations

Les grand groupes

Accès au données

Niveau de décision data-driven

Ressources humaines

Ressources techniques

Optimisation de la consommation

Batiments

Data centers

Optimisation de l'expérience client

Personalisation des services

Publicités ciblées

Marketing prédictif

Optimisation du management

Pilotage du temps de travail

Evaluation des managers

A/B testing

...

Optimisation de la logistique

flotte de véhicule

livraisons

Gestion de stock

Systèmes prédictifs

ventes

Analyse de sentiments

comportements

Evaluation de la performance

Gestion des ressources

Recommandations

Les grand groupes

Accès au données

Niveau de décision data-driven

Ressources humaines

Ressources techniques

PME

Optimisation de la consommation

Batiments

Data centers

Optimisation de l'expérience client

Personalisation des services

Publicités ciblées

Marketing prédictif

Optimisation du management

Pilotage du temps de travail

Evaluation des managers

A/B testing

...

Optimisation de la logistique

flotte de véhicule

livraisons

Gestion de stock

Systèmes prédictifs

ventes

Analyse de sentiments

comportements

Evaluation de la performance

Gestion des ressources

Recommandations

PME

Accès au données

Niveau de décision data-driven

Ressources humaines

Ressources techniques

TPE & Start-ups

Decision data driven concentrées en général sur un secteur d'activité

TPE & Start-ups

Accès au données

Niveau de décision data-driven

Ressources humaines

Ressources techniques

Service public

Service public

Parcours Sup

Police Predictive

Scoring des professeur

Prédiction des récidives

Ciblage des électeurs

Ciblages des campagnes de communications

...

A vous de jouer !

Cas n°1

Catégorie

Ressources humaines

Identité

Secteur d'activité principal

ONG

Ecologie

Service Public

2 à 3 temps pleins

centaines de bénévoles

Liberté d'éxécution

Validation requise par le conseil d'administration

Niveau d'enjeux

Moyen: Augmenter le nombre d'adhérents

Cas n°2

Catégorie

Ressources humaines

Identité

Secteur d'activité principal

Liberté d'éxécution

Niveau d'enjeux

Elevé: Améliorer le ciblage client

TPE

Fournisseurs de services dans le photo voltaïque

TPE & Start-ups

4 temps pleins

possiblité de prestataires

Grande autonomie mais pilotage dirigé par le CEO

Cas n°3

Ressources humaines

Catégorie

Secteur d'activité principal

Liberté d'éxécution

Niveau d'enjeux

Elevé: Identifier de nouveaux marchés

Conseil en E-reputation

2 temps pleins

Grande autonomie mais pilotage dirigé par le CEO

PME

3 temps partiels

Cas n°4

Catégorie

Ressources humaines

Identité

Secteur d'activité principal

Fabricant véhicule

Transport

6 temps pleins

prestataires possibles

Liberté d'éxécution

Faible :

Décisions à faire valider par manageurs & décideurs

Niveau d'enjeux

Tres elevé: Amorcer une transition globale de toute l'organisation

Grand Groupe

Cas n°5

Catégorie

Ressources humaines

Identité

Secteur d'activité principal

Pole Emploi

Assistance

1 temps pleins

prestataires possibles

Liberté d'éxécution

Moyenne :

Décisions à faire valider par managers et usagers

Niveau d'enjeux

Moyen: Moderniser le service à l'usager

Service Public

Cas n°6

Catégorie

Ressources humaines

Identité

Secteur d'activité principal

Entreprise multimédia

Jeux vidéos

10 temps pleins

prestataires possibles

Liberté d'éxécution

Faible :

Décisions à faire valider par usagers, managers et decideurs

Niveau d'enjeux

Moyen: Améliorer l'expérience utilisateur

Géants du web

Data Driven Decisions

By Nicolas Rochet

Data Driven Decisions

Stratégies décisionnelles basées sur l'analyse de donnée

  • 99