V. CARPE, S. EL AMRI, N. MENEUX, A. OBERTELLI, V. OSTERTAG, P. VALENTIN
PROMO 2018
20 JUIN 2016
Slide 1.2
Group G1D - Probabilités et Statistiques
Slide 1.3
Group G1D - Probabilités et Statistiques
Etude, modélisation et simulation d'une station de vélib'
Approfondir nos connaissances sur le cours
Trouver la taille idéale d'une station
Trouver le nombre idéal de vélos par station
Certaines stations sont plus fréquentées que d'autres, déséquilibrant ainsi notre système et rendant la tâche difficile
Slide 1.4
Group G1D - Probabilités et Statistiques
Chaque station doit :
Avoir au moins un emplacement pour déposer un vélib'
Avoir au moins un vélib' lors de la venue d'un usager
Toutes les 6 heures, le nombre d'emplacements et de vélib' sont réinitialisés
Probabilité d'avoir toujours un emplacement libre pendant 6 heures
Probabilité d'avoir toujours un vélo libre pendant 6 heures
Slide 2.1
Group G1D - Probabilités et Statistiques
Slide 2.2
Group G1D - Probabilités et Statistiques
Établir des propriétés sur ces deux lois qui seront utiles dans notre modélisation
Notions abordées :
Variable aléatoire, moyenne, écart-type
Loi exponentielle
Loi poisson
Notations :
Nombre de vélos arrivés pendant l'intervalle
Probabilité que k vélos soient arrivés pendant
Temps entre l'arrivée de deux vélos
T
Slide 2.3
Group G1D - Probabilités et Statistiques
L'espérance d'une variable aléatoire correspond au résultat qu'on s'attend le plus à trouver.
Soit X une variable aléatoire.
Si cette dernière est continue, on a alors :
Si elle est discrète :
Slide 2.4
Group G1D - Probabilités et Statistiques
Dans notre cas, en utilisant la deuxième définition, on obtient :
Intervalle de temps
Paramètre de
Interprétation
Il y a
vélos arrivant pendant cet intervalle de temps en moyenne.
Slide 2.5
Group G1D - Probabilités et Statistiques
L'écart-type mesure la dispersion d'une variable aléatoire.
Nous l'avons calculé à partir de la définition :
Ce qui donne :
Slide 2.6
Group G1D - Probabilités et Statistiques
Interprétation :
68% du temps, on a un nombre de vélib' arrivant dans cet intervalle
95% du temps, on a un nombre de vélib' arrivant dans cet intervalle
99% du temps, on a un nombre de vélib' arrivant dans cet intervalle
Nombre de vélib'
Slide 2.7
Group G1D - Probabilités et Statistiques
Cette loi discontinue permet de décrire le nombre de fois qu'un événement se produira si l'on connait la moyenne de la fréquence d'apparition de ce dernier.
(1781 - 1840)
Mathématicien, physicien et géomètre
Connu pour ses très nombreux travaux (près de 400 publiés) et plus particulièrement pour la loi portant son nom.
Slide 2.8
Group G1D - Probabilités et Statistiques
est donc une loi de poisson de paramètre
Résultats trouvés cohérents avec les valeurs vues en cours.
Soit
le nombre moyen d’occurrences, on a alors la probabilité suivante
que l'événement se produise k fois :
Slide 2.9
Group G1D - Probabilités et Statistiques
La fonction de répartition d'une variable est la probabilité d'obtenir l'événement {X<x}
Soit X, une variable aléatoire :
Dans le projet, on obtient :
Interprétation
La probabilité que deux vélos arrivent espacés d'une durée inférieure à
est de
Slide 2.10
Group G1D - Probabilités et Statistiques
Cette loi permet de modéliser la durée de vie d'un phénomène sans usure.
Soit X une variable aléatoire et t une durée. On a :
T suit bien une loi exponentielle et nous retrouvons bien la fonction de répartition indiquée dans le cours
Slide 2.11
Group G1D - Probabilités et Statistiques
On retrouve bien :
Espérance obtenue avec sa définition continue
Slide 2.12
Group G1D - Probabilités et Statistiques
Durée telle que
et
Slide 2.13
Group G1D - Probabilités et Statistiques
Flux d'arrivées et de sorties de vélos représenté par une loi de Poisson de
et
de paramètres
Plus d'arrivées de vélos que de sorties.
Si :
Plus de sorties de vélos que d'arrivées
Le temps d'attente moyen pour un usager pour obtenir un vélo quand la station est vide est de
Slide 3.1
Group G1D - Probabilités et Statistiques
et
Slide 3.2
Group G1D - Probabilités et Statistiques
Nous allons tenter de générer des méthodes suivant les lois de Poisson et exponentielle vues précédemment
Notions abordées :
Générateur de nombres aléatoires
Méthodes de simulation modernes
Outils informatiques
Slide 3.3
Group G1D - Probabilités et Statistiques
Génération par phénomènes imprévisibles
Comme les dés, la roulette, un tirage au sort, ...
Inconvénient : Souvent biaisées, pas assez sûres.
Génération par algorithme
Bien que déterministes, les programmes possèdent des opérations assez imprévisibles, utilisables pour cela.
Utilisation de phénomènes physiques
La radioactivité, les bruits thermiques, la mécanique quantique, ... permettent cela.
Méthode la plus efficace mais ardue à mettre en place
Slide 3.4
Group G1D - Probabilités et Statistiques
Nicholas Metropolis
(1915 - 1999)
Physicien
A inventé en 1947 cette méthode avec Stanislaw Ulam
Employée pour le calcul d'intégrales et les simulations probabilistes.
Principe :
On place aléatoirement des points sur un espace défini où se trouve la courbe.
La valeur de l'aire sous la courbe (l'intégrale) est proportionnelle au nombre de points sous la courbe.
Slide 3.5
Group G1D - Probabilités et Statistiques
Point placé aléatoirement
Slide 3.6
Group G1D - Probabilités et Statistiques
Elle suivra une loi exponentielle de paramètre lambda.
Possibilité de générer un nombre U aléatoirement entre 0 et 1
Outil à notre disposition
Nous sommes arrivés à la loi :
Si u=1, on obtiendra une erreur. Il faudra retirer un nombre aléatoire dans ce cas.
Slide 3.7
Group G1D - Probabilités et Statistiques
Moyenne
(=19,7)
(=46)
(=2,1)
8,5 % des échantillons
10,8 % des échantillons
Slide 3.8
Group G1D - Probabilités et Statistiques
//Génération de 1000 échantillons T avec une moyenne égale à 20s
t=-log(1-grand(1000,1,"def"))/0.05
//Recherche de la moyenne associée à T
E=0
for i=1:1000
E=E+t(I,1)
end
E=E/1000
disp(E)
Permet d'obtenir 1000 nombres aléatoires entre 0 et 1
Slide 3.9
Group G1D - Probabilités et Statistiques
Moyenne
(=3)
(=6,5)
(=1,3)
20,9% des échantillons
2,7% des échantillons
Slide 3.10
Group G1D - Probabilités et Statistiques
Valeurs théoriques
Valeurs empiriques
Slide 3.11
Group G1D - Probabilités et Statistiques
Slide 4.1
Group G1D - Probabilités et Statistiques
Slide 4.2
Group G1D - Probabilités et Statistiques
Vérifier les résultats obtenus lors d'études précédentes
Hypothèses :
On cherche à vérifier que le système est optimale pour :
(nombre de vélos dispo) soit égal à 22
(nombre d'emplacements dispo) soit égal à 22
soit égal à 6h
Slide 4.3
Group G1D - Probabilités et Statistiques
Interprétation :
Génération d'une suite d'instants d'arrivée
Génération d'une suite d'instants de sortie
Slide 4.4
Group G1D - Probabilités et Statistiques
Limitation du cadre temporel de l'expérience : on ne garde que les valeurs concernées
Balayage des valeurs conservées pour repérer les cas extrêmes
Slide 4.5
Group G1D - Probabilités et Statistiques
Slide 4.6
Group G1D - Probabilités et Statistiques
Démonstration sur Scilab
Slide 5.1
Group G1D - Probabilités et Statistiques
Slide 5.2
Group G1D - Probabilités et Statistiques
Déterminer les paramètres exprimés lors de la première partie du sujet.
Pour se faire, nous allons exploiter les données d'une station de vélib' du 31 mai 2013
Slide 5.3
Group G1D - Probabilités et Statistiques
Un estimateur permet d'évaluer un paramètre inconnu d'une loi de probabilité
La pertinence de l'estimation dépend de différents facteurs :
Slide 5.3
Group G1D - Probabilités et Statistiques
Un estimateur peut être trouvé à l'aide de cette méthode.
(1890 - 1962)
Botaniste et statisticien
Un des fondateurs de la statistique moderne.
Principe :
Slide 5.4
Group G1D - Probabilités et Statistiques
En utilisant cette méthode, on obtient :
échantillon k
nombre d'échantillons
C'est un estimateur sans biais et convergent.
Estimateur absolument convergent
Slide 5.5
Group G1D - Probabilités et Statistiques
Borne permettant d'affirmer le caractère efficace d'un estimateur trouvé.
Estimateur
Dans notre cas :
et
Notre estimateur est donc efficace.
Slide 5.6
Group G1D - Probabilités et Statistiques
Nous renseigne sur la précision qu'a notre estimateur. Cet intervalle contient toujours la valeur réelle du paramètre.
Notre intervalle est le suivant :
Slide 5.7
Group G1D - Probabilités et Statistiques
Démonstration sous Scilab
Slide 6.1
Group G1D - Probabilités et Statistiques