Brève Introduction à de la Data Science
Nicolas Rochet
2022
Déprécié : voir mon cours intitulé
The universe of data science
Définition résumée
Mathématiques
Informatique
"Domain
knowledge"
Discipline utilisant des méthodes scientifiques, algorithmes et systèmes d'information pour extraire des connaissances à partir de données structurées ou non structurées
Science de l'information

Processus
Collecte de données
Préparation de donnes
Traitement
des données
Déploiement
Exploration des données
Modelisation
Identification de pattern
Besoin
Problème à résoudre
Réalité
Communication
Visualisation
Rapport
produit/service
Prise de décisions
données
nettoyées
Algorithmes
Data mining
Acquisition
des données
Préparation des
données
Traitement des données
Déploiement
Besoin /
Problème à résoudre
Compréhension des données
Modelisation
Identification de pattern
Evaluation
Compréhension du
domaine
Inspiré de la méthode CRISP
Mathématiques
Statistiques
Probabilités
Algèbre
Analyse
tendance centrale
Probabilité conditionnelle
Fonctions
Optimisation
Variables
Equations
Visualisations
covariance
modelisation
Théorème de Bayes
corrélation
Espace vectoriel
Plongement
Calcul matriciel
Distributions
Echantillonage
Tests d'hypothèses
intervalle de confiance
Théorème central limite
régularisation
Differentielles
...
Théorie des graphes
Théorie des jeux
Théorie de la décision
Mathématiques
Informatique
Systèmes d'information
Calcul
Programmation
Algorithmie
Structures de données
Langages
Base de données
CPU
GPU
TPU
Frameworks
Bonnes pratiques
Controle de version
Terminal
Conteneur
Orchestrateur
Cloud computing
Machine virtuelle
Outils du data scientist
Pour se former ...
Plateformes
...
Blogs & portails
Articles scientifiques
Cours & livres
Wikipedia
Cartographie de quelques frameworks
Scikit-learn
TensorFlow
Torch / PyTorch
H2O.ai
Spark MLlib
Weka
CNTK
Microsoft Azure ML
Amazon Machine Learning
...
Google Cloud AI
SAS
Python
Scala
Julia
Kaggle
Pandas
Plateformes
Frameworks
Langages
R
Matlab
ETL
Matériel
GPU
TPU
Cloud
CPU
...
Ecosystème Hadoop
Stockage distribué
calcul distribué
Base de données
SMALL & BIG DATA
CALCUL
Microsoft Azure ML
Amazon Machine Learning
Google Cloud AI
OVH
SQL
No SQL
Graphe
Time Series
Introduction à la Data Science
By Nicolas Rochet
Introduction à la Data Science
Tour d'horizon des principes fondamentaux
- 146