Présentation par Loïc BRANSTETT, Sévérino DA SILVA et Jérôme HOEN
Le 11/05/2019
Sommaire
Présentation du projet
Les données
key | fare_amount | pickup_datetime | pickup_longitude | pickup_latitude | dropoff_longitude | dropoff_latitude | passenger_count |
---|---|---|---|---|---|---|---|
2009-06-15 17:26:21 | 4.5 | 2009-06-15 17:26:21 UTC | -73.844311 | 40.721319 | -73.84161 | 40.712278 | 1 |
2010-01-05 16:52:16 | 16.9 | 2010-01-05 16:52:16 UTC | -74.016048 | 40.711303 | -73.979268 | 40.782004 | 1 |
2011-08-18 00:35:00 | 5.7 | 2011-08-18 00:35:00 UTC | -73.982738 | 40.76127 | -73.991242 | 40.750562 | 2 |
2012-04-21 04:30:42 | 7.7 | 2012-04-21 04:30:42 UTC | -73.98713 | 40.733143 | -73.991567 | 40.758092 | 1 |
2010-03-09 07:51:00 | 5.3 | 2010-03-09 07:51:00 UTC | -73.968095 | 40.768008 | -73.956655 | 40.783762 | 1 |
Le nettoyage
Extraction des données
Visualisation des données
Visualisation des données
Heatmap de corrélation des variables
Exploitations des données
Distance de Manhattan:
Distance Euclidienne:
Exploitations des données
Distance Euclidienne:
Exemple de RandomForestRegressor
Conclusion
Questions ?
FIN