Machine learning Design Patterns

 

 

 

 

 

 

 

Nastasia Saby

@saby_nastasia

Des exemples de systèmes sur lesquels j'ai travaillé :

- Prédire des pannes

- Détecter des anomalies

- Modèles commerciaux

- etc

 

 

Big Data Science Montpellier                       @saby_nastasia

En informatique, et plus particulièrement en développement logiciel, un patron de conception (souvent appelé design pattern) est un arrangement caractéristique de modules, reconnu comme bonne pratique en réponse à un problème de conception d'un logiciel. Il décrit une solution standard, utilisable dans la conception de différents logiciels.

Big Data Science Montpellier                       @saby_nastasia

Bonnes pratiques ?

Big Data Science Montpellier                       @saby_nastasia

Big Data Science Montpellier                       @saby_nastasia

Feature Stores est un ML design pattern

Big Data Science Montpellier                       @saby_nastasia

Mais c'est génial !

Big Data Science Montpellier                       @saby_nastasia

Une chose n'existe que quand elle est nommée.

Big Data Science Montpellier                       @saby_nastasia

Mettre les concepts dans des cases.

Big Data Science Montpellier                       @saby_nastasia

Apprendre des trucs et astuces.

Big Data Science Montpellier                       @saby_nastasia

Data représentation

Je vais te donner des astuces pour représenter tes données

Big Data Science Montpellier                       @saby_nastasia

Feature Cross

Prédire l'affluence de la location de vélos

Big Data Science Montpellier                       @saby_nastasia

Heure du jour et jour de la semaine

Big Data Science Montpellier                       @saby_nastasia

Mais je connais ça ! Intéressant d'y mettre un nom.

Big Data Science Montpellier                       @saby_nastasia

Autre exemple du livre : Embeddings

Big Data Science Montpellier                       @saby_nastasia

Problem representation

Je vais te donner des astuces pour représenter le problème.

Big Data Science Montpellier                       @saby_nastasia

Reframing

Big Data Science Montpellier                       @saby_nastasia

Prédire le temps à passer sur une tâche

Big Data Science Montpellier                       @saby_nastasia

Régression ou classification : c'est là la question

Big Data Science Montpellier                       @saby_nastasia

  • Si une distribution est large => classification

 

  • Si une distribution est serrée => régression

Ça clarifie.

Big Data Science Montpellier                       @saby_nastasia

Autres exemples : Rebalancing, neutral class

Big Data Science Montpellier                       @saby_nastasia

Model training

Je vais te donner des astuces pour entraîner.

Big Data Science Montpellier                       @saby_nastasia

Transfer learning

Analyse de sentiments sur des pneus

Big Data Science Montpellier                       @saby_nastasia

Analyse de sentiments en général

Big Data Science Montpellier                       @saby_nastasia

Analyse de sentiments en général + analyse de sentiments des pneus

Big Data Science Montpellier                       @saby_nastasia

Jamais utilisé, mais en effet on peut dire que le transfer learning est un design pattern.

Big Data Science Montpellier                       @saby_nastasia

Autres exemples : Useful overfitting, hyperparameters tuning

Big Data Science Montpellier                       @saby_nastasia

Déployer

Je vais te donner des astuces pour déployer.

Big Data Science Montpellier                       @saby_nastasia

Batch VS Online : recommendation

Big Data Science Montpellier                       @saby_nastasia

Traitement par lots

Big Data Science Montpellier                       @saby_nastasia

Traitement par unité

Reproducibility

Je vais te donner des astuces pour reproduire un vieux comportement.

Big Data Science Montpellier                       @saby_nastasia

Workflow pipeline

Big Data Science Montpellier                       @saby_nastasia

Model versionning

Big Data Science Montpellier                       @saby_nastasia

Monitoring

Big Data Science Montpellier                       @saby_nastasia

Code versionning

Big Data Science Montpellier                       @saby_nastasia

Data versionning

Big Data Science Montpellier                       @saby_nastasia

Réentraîner à chaque fois

Plus de l'ordre de sauver ma life

Responsible AI

Je vais te donner des astuces pour être plus responsable.

Big Data Science Montpellier                       @saby_nastasia

Devenu super important

Heuristic benchmark

Big Data Science Montpellier                       @saby_nastasia

Fairness et explainability

Big Data Science Montpellier                       @saby_nastasia

Big Data Science Montpellier                       @saby_nastasia

Le problème des micro-travailleurs, les annotateurs

Made with Slides.com