Massimo 810 PRO
IT + Culture = <3
Commandes
df_orders
Produits commandés
df_orderitems
Produits
df_products
Paiements des commandes
df_orders
Revendeurs
df_sellers
Avis
df_sellers
Geolocalisation
df_sellers
(n, 1)
(1, 1)
(1, 1)
(n,1)
(1,n)
Clients
df_customers
(1, 1)
Pour 93 358 clients. 2 801 peuvent être qualifiés de réguliers
3%
96 478 commandes livrées sur
99 441 commandes totale
-2.98%
73 catégories de produits distincts vendues, avec principalement des accessoires de maison, de PC, de beauté ou de loisir.
CA 2017 pour les commandes livrées = 6.9M R$
Commandes passées du 09/2016 au 08/2018.
Si le panier moyen du client régulier est légèrement inférieur a celui du client lambda (-8.68%), sa lifetime value est nettement supérieure (+86.8%).
Panier moyen :
glob. : 159.86 R$
reg. : 145.98 R$
Dépense moyenne :
glob. : 165.2 R$
reg. : 308.6 R$
3% de clients reguliers
6.14% des commandes
75% des clients réguliers procèdent à leur deuxième achat dans les 126 jours qui suivent leur premier achat.
50% des clients réguliers procèdent à leur deuxième achat dans les 30 jours qui suivent leur premier achat.
Nombre de jours entre la date du dernier achat et la date d'extraction des données (supposée).
Nombre de commandes par client sur la période considérée (1 ou >1)
Dépense cumulée par client
Q0 < 113j
Q3 > 345j
Q0 < 64 R$
Q4 > 183R$
1
2
3
4
5
6
7
8
On a testé trois types d'algorithmes :
Ceux qui fonctionnent par recherche de centroides
Ceux qui fonctionnent par étude de densité de régions de points.
Ceux qui établissent des hiérarchies dans les similarités pour créer des clusters de clusters.
K-means
DBSCAN
CAH
interprétables
meilleurs silhouette score
dépenses
nombre de commandes
récence
avis moyen
nombre d'items moyens par commande
nombre de vouchers utilises
montant des vouchers utilises
75% : Masse de clients satisfaits qui consomment le panier moyen
3% : MVC (Most Valuable Customers, i.e nos fidèles)
20% : Clients plutôt mécontents
2% : Les "couponneurs"
dépenses
nombre de commandes
récence
avis moyen
nombre d'items moyens par commande
coude d'inertie à k=6, mais silhouette score plus élevé pour k = 7
"À réactiver" : récence moyenne de 123 jours
Les mécontents ont un avis moyen de 1.7, quand celui de la masse passée est de 4.73.
Distingue "Gros paniers" (items > 2) des "paniers moyens" (items = 2)
Nombre d'articles plus élevé chez les "Gros paniers", mais dépense moyenne plus faible que les "Fortunés".
k = 7 offre un clustering plus précis dont les métriques sont plus meilleures que pour k = 6.
Ce clustering permet de distinguer des catégories de clients en fonctions de :
- la récence
- la satisfaction
- la quantité d'articles dans leurs paniers
- le montant de leur panier
- leur régularité
Au premier mois, 84% des labels sont maintenus (à la permutation près). Au deuxième, on est a 71%, puis 59% au troisième.
Un K-Means avec k=7, maintenu tous les deux mois, peut permettre d'identifier les ambassadeurs·rices de marque, les clients à réactiver pour les transformer en clients réguliers, ou encore les mécontents et mécontentes.
Une telle clusterisation peut donc permettre d'orienter les stratégies de communication du client pour adresser le bon message à la bonne personne.
Tester une clusterisation en K-Median pour comparer à K-Means.
Distinguer les montants de réduction réels des entiers (carte cadeau VS. bons de réduction).
Associer à chaque cluster un montant total dépensé. Ceci permettra de leur associer un poids au-delà de leurs effectifs.
Étudier les raisons éventuelles des avis négatifs en étudiant les délais de livraison.
Feature additionnelle : nb jours entre commande et livraison
By Massimo 810