Brève Introduction à de la Data Science

Nicolas Rochet

2022

Déprécié : voir mon cours intitulé

The universe of data science

Définition résumée

Mathématiques

Informatique

"Domain

knowledge"

Discipline utilisant des méthodes scientifiques, algorithmes et systèmes d'information pour extraire des connaissances à partir de données structurées ou non structurées

Science de l'information

Processus

Collecte de données

Préparation de donnes

Traitement
des données

Déploiement

Exploration des données

Modelisation

Identification de pattern

Besoin

Problème à résoudre

Réalité

Communication

Visualisation

Rapport

produit/service

Prise de décisions

données

nettoyées

Algorithmes

Data mining

Acquisition

des données

Préparation des

données

Traitement des données

Déploiement

Besoin /

Problème à résoudre

Compréhension des données

Modelisation

Identification de pattern

Evaluation

Compréhension du

domaine

Inspiré de la méthode CRISP

Mathématiques

Statistiques

Probabilités

Algèbre

Analyse

tendance centrale

Probabilité conditionnelle

Fonctions

Optimisation

Variables

Equations

Visualisations

covariance

modelisation

Théorème de Bayes

corrélation

Espace vectoriel

Plongement

Calcul matriciel

Distributions

Echantillonage

Tests d'hypothèses

intervalle de confiance

Théorème central limite

régularisation

Differentielles

...

Théorie des graphes

Théorie des jeux

Théorie de la décision

Mathématiques

Informatique

Systèmes d'information

Calcul

Programmation

Algorithmie

Structures de données

Langages

Base de données

CPU

GPU

TPU

Frameworks

Bonnes pratiques

Controle de version

Terminal

Conteneur

Orchestrateur

Cloud computing

Machine virtuelle

Outils du data scientist

Pour se former ...

Plateformes

...

Blogs & portails

Articles scientifiques

Cours & livres

Wikipedia

Cartographie de quelques frameworks

Scikit-learn

TensorFlow

Torch / PyTorch

H2O.ai

Spark MLlib

Weka

CNTK

Microsoft Azure ML

Amazon Machine Learning

...

Google Cloud AI

SAS

Python

Scala

Julia

Kaggle

Pandas

Plateformes

Frameworks

Langages

R

Matlab

ETL

Matériel

GPU

TPU

Cloud

CPU

...

Ecosystème Hadoop

Stockage distribué

calcul distribué

Base de données

SMALL & BIG DATA

CALCUL

Microsoft Azure ML

Amazon Machine Learning

Google Cloud AI

OVH

SQL

No SQL

Graphe

Time Series

Introduction à la Data Science

By Nicolas Rochet

Introduction à la Data Science

Tour d'horizon des principes fondamentaux

  • 146