Bonnes pratiques dans le monde de la data
MLOps (du cafouillage au bricolage)
Nastasia Saby
@saby_nastasia
Des exemples de systèmes sur lesquels j'ai travaillé :
- Prédire des pannes
- Détecter des anomalies
- Modèles commerciaux
- etc
AlpesCraft @saby_nastasia
Il était une fois une histoire de data qui m'a appris à promouvoir des techniques craft et qui m'a permis d'en découvrir de nouvelles.
AlpesCraft @saby_nastasia
La mission était la suivante :
Mettre en production un modèle de machine learning au départ expérimental
#MLOps
AlpesCraft @saby_nastasia
Tout commence par une guerre
Data Ings
Data Scientistes
AlpesCraft @saby_nastasia
Ginette est data ingénieure et pense qu'on fait un programme de data science comme n'importe quel autre programme en informatique
AlpesCraft @saby_nastasia
Lucette est data scientiste et n'a jamais mis en production quoi que ce soit. Elle se dit que ça doit pas être bien sorcier.
AlpesCraft @saby_nastasia
Easy-peasy l'industrialisation du machine learning
AlpesCraft @saby_nastasia
No test, no versionning, no monitoring !
AlpesCraft @saby_nastasia
Tu veux dire no futur en fait ! (~_~;)
AlpesCraft @saby_nastasia
doc_old_copie(1).py, c'est pas possible ! (~_~;)
AlpesCraft @saby_nastasia
Oui, mais tu sais moi j'ai déjà beaucoup de choses à penser.
AlpesCraft @saby_nastasia
?
Comment vendre le versionning ?
AlpesCraft @saby_nastasia
Comment vendre le versionning ?
AlpesCraft @saby_nastasia
Tu versionnes déjà en fait. Je te propose juste de le faire automatiquement.
Comment vendre le versionning ?
On va faire simple, enfin essayer.
AlpesCraft @saby_nastasia
Comment vendre le versionning ?
Si tu collabores avec d'autres personnes, c'est plus simple.
AlpesCraft @saby_nastasia
Comment vendre le versionning ?
On en a besoin pour la prod.
Argument du "pas le choix"
AlpesCraft @saby_nastasia
Comment vendre le versionning ?
En conclusion
- Présenter le concept
- Faire le plus simple possible
- Avancer la notion de besoin concret pour la prod
AlpesCraft @saby_nastasia
Comment vendre les tests ?
?
AlpesCraft @saby_nastasia
Comment vendre les tests ?
Pourquoi c'est compliqué ?
Le code est déjà prêt quand vous voulez ajouter des tests.
AlpesCraft @saby_nastasia
Comment vendre les tests ?
Les tests permettront d'éviter des régressions pour les prochaines mises en prod
AlpesCraft @saby_nastasia
Comment vendre les tests ?
Y'a pas que les tests unitaires dans la vie
Ouvrir les horizons !
AlpesCraft @saby_nastasia
Comment vendre les tests ?
En conclusion
- Présenter d'autres formes de tests pour susciter l'appétence des tests
- Avancer l'argument de la prod
AlpesCraft @saby_nastasia
Comment faire comprendre l'importance des données ?
?
AlpesCraft @saby_nastasia
Comment faire comprendre l'importance des données ?
La data détient la vérité, la data détient la vérité, la data détient la vérité, la data détient la vérité, ...
Répéter
AlpesCraft @saby_nastasia
Comment faire comprendre l'importance des données ?
Je te l'avais dit ;).
Laisser les gens se planter
AlpesCraft @saby_nastasia
Comment faire comprendre l'importance des données ?
En conclusion
- Répéter
- Laisser les personnes se planter
AlpesCraft @saby_nastasia
Comment vendre le monitoring de modèles ?
?
AlpesCraft @saby_nastasia
Comment vendre le monitoring de modèles ?
Le modèle est le programme, le modèle est le programme, le modèle est le programme, le modèle est le programme, ...
Répéter
AlpesCraft @saby_nastasia
Comment vendre le monitoring de modèles ?
On fait ça pour les sous !
AlpesCraft @saby_nastasia
Comment vendre le monitoring de modèles ?
En conclusion :
- Répéter
- Business impact
- Production
AlpesCraft @saby_nastasia
Un outil, différents points de vue : le notebook
AlpesCraft @saby_nastasia
Les notebooks, c'est inmaintenable ! (~_~;)
AlpesCraft @saby_nastasia
Oui, mais les notebooks c'est tellement pratique pour faire de la data viz et de la data exploration.
AlpesCraft @saby_nastasia
Solutions : un mix des deux à différentes phases de vie
Séparation poc et prod
AlpesCraft @saby_nastasia
- Argument de la prod encore
- Besoins de chacun respectés
AlpesCraft @saby_nastasia
Être flexible pour avancer.
AlpesCraft @saby_nastasia
Lucette et Ginette se comprennent maintenant et fusionnent pour devenir Gilou.
AlpesCraft @saby_nastasia
Euh, mais les données qu'on reçoit, c'est n'importe quoi !
AlpesCraft @saby_nastasia
C'est parti pour des tests unitaires de données pour vérifier la qualité de celles-ci.
Demo Time.
AlpesCraft @saby_nastasia
Au secours, on a un bug de modèle !
AlpesCraft @saby_nastasia
Versioning du modèle
AlpesCraft @saby_nastasia
Le versionning de code ne suffit pas pour remonter dans le temps.
Il nous faut du versionning de données.
Demo Time.
AlpesCraft @saby_nastasia
Réentraîner à chaque déploiement est bon pour la santé.
AlpesCraft @saby_nastasia
L'intégration continue s'agrandit
Le versionning s'agrandit
AlpesCraft @saby_nastasia
Sur ma machine, ça (le modèle) marche !
AlpesCraft @saby_nastasia
La vraie vie, c'est ça qui compte ! Mesurez l'impact de votre modèle dans la vraie vie.
AlpesCraft @saby_nastasia
La mission est finie. Tout est au mieux dans le meilleur des mondes possibles
En vrai, c'est juste mieux qu'avant.
AlpesCraft @saby_nastasia
Comment vendre des techniques craft en résumé ?
AlpesCraft @saby_nastasia
Conclusions :
- Aspect business
- Aspect production, déploiement
Sinon :
- Répéter
- Montrer d'autres manières de réaliser un concept pour susciter le désir en général
- Accepter de laisser les potes se planter
AlpesCraft @saby_nastasia
Quelles techniques craft on peut apprendre dans la data ?
AlpesCraft @saby_nastasia
Conclusions :
- Ouvrir ses horizons sur les tests, versionning et monitoring
- Ouvrir ses horizons sur l'intégration continue en général
AlpesCraft @saby_nastasia
Bonnes pratiques dans le monde de la data
By nastasiasaby
Bonnes pratiques dans le monde de la data
- 737