Une plateforme intégrée pour la construction et l'évaluation de modèles de simulation en géographie

(2010 - 2015)

Sous la direction de Denise Pumain

et la co-direction d'Anne Ruas

http://these.sebastienreycoyrehourcq.fr

UMR IDEES Rouen

Séminaire d'équipe

17 décembre 2015

Trajectoire

Maitrise informatique

(UPPA)

Master 2 Géomatique

(Paris 1, Paris 7, ENSG)

Modèles

Simpop

Thèse de géographie (Paris 1)

OpenMOLE

GeoDiverCity

SimPuzzle

SimFamilly

Modèle

SimpopLocal

Maitrise informatique

(UPPA)

Master 2 Géomatique

(Paris 1, Paris 7, ENSG)

Modèles

Simpop

Thèse de géographie (Paris 1)

Modèle

SimpopLocal

 + 20 fonctions différentes

modèle ~= modèle de simulation

simplification ou facilitation ?

modèle (fin) ou "contenu et fonctionnement interne" du modèle (moyen) ?

modélise pour une question

( voir les travaux de Phan, Varenne, Livet, etc. ) 

 

substrat informatique

empirie "second genre" != réalité

EqDiff

Objets

Stocks

émergence multiples fonctions

(performance ? parcimonie ? compression ? compréhension ? co-construction ? ... )

"reconstruction" du réel

dynamique complexe

" choix "

simulation

choix d'échelles et de représentations (processus, entités)

critères

paramètres

choix rapport à la

réalité

Modéliser, Simuler, pourquoi ?

plateforme

autonome

> LABORATOIRE VIRTUEL <

données

Fil rouge présentation

surprise = attendu vs résultats

résultats

Simulation en géographie ?

1950

1980

Hägerstrand, Marble, Pitts, etc.

 

Pumain, Sanders, etc.

Guermond, Langlois, etc.

Chamussy, Le Berre, Uvietta, etc.

 

Forrester

Pionniers

Charnières

1970

Wilson

Batty

Ackerman, Chorley, Hagget, Berry, etc .

Prigogine, Allen,

Sanglier, Haken, etc..

conceptuel

technique

1990

Couclelis,

Tobler,etc.

Epstein, Doran, etc.

Influences multiples et répétées du projet systémique (Von Bertallanfy et cie.)

systèmes ouverts, rétro-action, auto-organisation, équifinalité, bifurcation, etc.

[Pouvreau 2013]

plateforme

autonome

 ~ 1980 en France

Contexte scientifique

Mathématique des

SD non linéaires

Automates cellulaires

Analyses statistiques

Système d'Information Géographique

Systèmes

multi-agents

Visualisation

plateforme

autonome

" Boite à outils "

 ... pourtant sur certains aspects liés à l'exploration des simulations ...

Contexte scientifique

plateforme

autonome

écart

Pourquoi ?

- accès aux ressources de calculs ?

 

- cloisonnement disciplinaire ?

 

- arrivée de la micro informatique ?

 

- niveau informatique des géographes ?

 

- résultat décevants et/ou ressources insuffisantes ?

 

- etc.

[REY 2015 p 222 travail en cours ...]

constat qui touche (encore)

toute la géographie (et les SHS)

Contexte scientifique

Campagnes d'explorations modèles

 manuelles

Analyse de

sensibilité

Calibrage

Plan d'expériences

plateforme

autonome

automatisation

Toujours est-il qu'entre 1980 - 2010 ...

+fiabilité

-temps

-erreurs

mon projet

Une plateforme autonome

pour la construction et l'évaluation de modèles de simulation

en géographie

1993 - 2010

plateforme

autonome

Saut qualitatif

mon projet

étend

capitalise

générique

appliquée

accessible

intègre

respecte

les pratiques

facilite

les technologies

2010 

SimpopLocal

Clara Schmitt

Sébastien Rey-Coyrehourcq

plateforme

autonome

le cahier des charges initial

SimpopLocal

plateforme

autonome

Thèse de Clara Schmitt 

(2010 - 2014)

Une famille de

modèles parcimonieux

Théorie

Explications ?

SimpopLocal

Mécanismes

Création

Partage

Dynamique de Croissance  

Impact des innovations

QUESTION

Est-ce que les mécanismes d'innovations sont nécessaires et suffisants à la hiérarchisation du système ?

Dynamiques d'innovations

plateforme

autonome

( Gibrat 1931 )

SimpopLocal

Sortie du modèle de simulation

plateforme

autonome

Tinkering de M. Resnick 

autonomisation

acculturation

co-construction

 

 

SimpopLocal version Netlogo

Qualité des choix,

du raisonnement ?

exploration limitée (combinatoire, stochasticité)

calibrage manuel impossible (non linéarité) 

SimpopLocal

Une pratique de l'exploration certe nécessaire ...

" Face Validity "

plateforme

autonome

[Hermann 1967]

... mais insuffisante ! (même avec 4 mécanismes et 7 paramètres ... )

SimpopLocal

plateforme

autonome

expérimenter une première évolution des pratiques

Scenario 1

Scenario 2

phase exploration

phase conception / construction

"systématisation"

"face validity"

temps

temps

humain

robot

quoi ? comment  ?

La plateforme

Répondre à la question thématique posée

plateforme

autonome

Calibrer et explorer ces versions

Construire les versions

S'appuyer sur un cas d'utilisation : SimpopLocal

pour construire une plateforme autonome

Outils - génériques et accessibles -

Méthodologies  - construction, exploration -

Ressources informatiques - partage, calcul -

OpenMOLE

GeoDiverCity

Modèle

SimpopLocal

Un contexte doublement favorable

Collaboration Geographie-cités et Institut des Systèmes Complexes Paris Ile de France  

ERC GeoDiverCity

accès aux ressources ISC-PIF

investissement UMR

openMOLE

infra. calcul

carte-blanche projets sur temps long

accélérateur de connaissances

interdisciplinarité

co-constructions, innovations

D'une primo collaboration ...

GeoDiverCity

ISC-PIF

ERC

Sébastien

Rey

Mathieu

Leclaire

Romain

Reuillon

Cyril

Jayet

Benjamin Bernard

Thomas

Louail

Robin

Cura

Clara

Schmitt

Denise

Pumain

Arnaud

Banos

à une multiplication des collaborations

Collaborations cumulées 2010 - 2015

image/svg+xml travaille ou a travaillé sur le produit avec s'appuie sur

plateforme intégrée

plateforme

intégrée

plateforme

autonome

plateforme

intégrée

OpenMOLE

Composer des "chaînes de traitements"

parallélisables, reproductibles, flexibles, extensibles

( = workflows)


val i = Val[Double]
val res = Val[Double]

val exploration = 
ExplorationTask(i in (0.0 to 100.0 by 1.0))

val model =
  ScalaTask("val res = i * 2") set (
    inputs += i,
    outputs += (i, res)
  )

val env = LocalEnvironment(4)

exploration -< (model on env hook ToStringHook())

plan d'expérience, 

analyses sensibilités, etc. 

Netlogo, Gama, etc.

Scala, R, Python, etc.

plateforme

intégrée

E

M

T0

T1

OpenMOLE

Exemple du modèle " Fire " de Netlogo

plateforme

intégrée

[Reuillon 2013]

OpenMOLE

plateforme

intégrée

Exemple du modèle " Fire " de Netlogo

plateforme

intégrée

Quelles méthodologies pour la

construction et l'exploration ?

construction avec exploration manuelle

(1) inductive

(2) déductive

plateforme

intégrée

construction avec exploration systématique

simpopLocal

( dès juin 2010 )

(stratégie 1 inductive)

recherche de patterns a posteriori

plateforme

intégrée

workflow

distribue 

rapatrie

plan

d'expérience

  • 30 réplications 
  • 5 paramètres (5 Dim )
  • discrétisation en 10 pas

" Curse

Dimensionality "

3 Millions de graphiques 

grande incertitude, et calibrage a posteriori du modèle difficile

100 000 graphiques résumés

+ dim

plateforme

intégrée

(stratégie 1 inductive)

recherche de patterns a posteriori

dim 1

dim 2

dim 3

Mathieu
Leclaire

Romain Reuillon

Que voulez-vous mesurer observer et

prouver / réfuter 

exactement avec

SimpopLocal ?

logique d'exploration inverse

plateforme

intégrée

(stratégie 2 déductive)

recherche de patterns a priori

On évalue la capacité du modèle (structure, paramètres) à produire des données ou des faits stylisés (patterns) mobilisés a priori

modèle

(mécanismes, paramètres)

données et faits stylisés

formaliser la 

question posé !

plateforme

intégrée

(stratégie 2 déductive)

recherche de patterns a priori

déterminer et implémenter les fonctions objectifs

plateforme

intégrée

(stratégie 2 déductive)

recherche de patterns a priori

obj 1 - population max

obj 2 - distribution villes

obj 3 - temps

3 objectifs simultanés

= 10000 hab.

= 4000 ans

= lognormalité

valeurs paramètres

mécanismes 

condition initiale 

connaissances (relatives)

SimpopLocal

Objectifs

réplications

problème d'optimisation

paramètres

possible ?

impossible ?

comment ?

combien ?

bug ?

plateforme

intégrée

(stratégie 2 déductive)

recherche de patterns a priori

plateforme

intégrée

les algorithmes évolutionnaires

Algorithmes Evolutionnaires (AE) 

plateforme

intégrée

evaluation (t)

selection (t)

reproduction (t)

valeurs

paramètres

p 1

p 5

o2

simulation

score obj.

o3

o1

initialisation

( t         t +1 )

construire le framework MGO

 architecture "cake-pattern"

innovante

diverses implémentations 

AE

canoniques

composants

Framework MGO

 

framework autonome et compatible wf

OpenMOLE

plateforme

intégrée

Algorithmes Evolutionnaires (AE) 

T0

T1

garantir

flexibilité

code : https://github.com/openmole/mgo

faire dialoguer

MGO et OpenMOLE

~ 400 lignes de code !

accessible

appliqué

générique

solutions spécifiques simulation

algorithmes EA adaptés

robuste

support d'innovation

reproductible

Encapsulation

Simplification

plateforme

intégrée

~ 30 lignes

Workflow EA générationel ou steady state

Simplification

val inputDomains = 
  Seq(
    rMax -> (2.0, 50000.0),
    distanceDecay -> (0.0, 4.0),
    pCreation -> (0.0 -> 0.01),
    pDiffusion -> (0.0, 0.01),
    innovationImpact -> (0.0, 2.0)
  )


val evolution = 
  NSGA2 (
    mu = 200,
    termination = 1 hour,
    inputs = inputDomains,
    objectives = Seq(sumKsFailValue, medPop, medTime),
    epsilons = Seq(0.0, 10.0, 10.0),
    reevaluate = 0.01
  )



val (isl, ga) = IslandSteadyGA(evolution)(
    replication, 
    island = 5000, 
    termination = 200000, 
    sample = 50)

Genotype

(valeurs paramètres)

Algorithme E.

Ilots Algorithme E.

accessible

appliqué

generique

Résultats

Half a billion simulations: evolutionary algorithms and distributed computing for calibrating the SimpopLocal geographical mode 

EPB 2015

ouvre la voie à des

nouveaux AE

plateforme

intégrée

réconcilie construction et exploration systématique

Clara Schmitt,

Sébastien Rey-Coyrehourcq,

Romain Reuillon,

Denise Pumain

accessible aux géographes

méthode/outils  générique

totalement reproductible

https://openmole/openmole-market

- 500 Millions de simulations cumulées, 2000 processeurs sur 5 jours, 25 ans de calculs  -

au delà du calibrage

plateforme

intégrée

EA pour le calibrage sous contrainte multi-objectifs

EA pour l'exploration des comportements

PSE

CP-PROFILE

[Reuillon et al. 2015]

[Chérel et al. 2015]

paramètre x

critère

obs. x

obs. y

2013 : un "MUR" épistémologique

plateforme

intégrée

une approche uniquement technique et méthodologique de l'évaluation ?

 

 

insuffisant

[OSullivan 2004]

équifinalité et

auto-organisation

plateforme

intégrée

modèle

(mécanismes, paramètres)

données et faits stylisés

choix

choix

écart

Affronter le dragon "Validation"

Q équifinalité

Q dilemne observationnel

Q auto-organisation

[Batty 1976]

[Bertalanffy 1949]

[Ashby 1947]

Q sous-détermination

[Prigogine 1969]

[Quine 1953]

[Foerster 1960]

Connaissances ?

points faibles et arguments favoris des critiques de la simulation en SHS

( 1970 - 2015 )

Q substrat != réalité

[Varenne 2001, 2013, 2014]

[Bulle 2005]

[Phan 2010]

SimPuzzle

SimFamilly

Bifurcation épistémologique

Des discussions interdisciplinaires récentes ...

à celles d'ancrages plus anciennes ...

[Bulle 2005]

[Richardson 2002]

[Amblard 2006]

[Livet 2014]

[Phan 2010]

[OSullivan 2014]

[Grimm 2005, 2014]

[Millington 2012]

[Batty 2001, 2005]

[Augusiak 2014]

[Premo 2007, 2010]

[Naylor 1967, 1969, 1972]

[Hermann 1967]

y compris en géographie ...

[Forrester 1969 ]

[Batty 1976]

[Guetzkow 1972]

[Marble 1972 ]

[Sanders 2013]

[Dutton1971]

[Beshers 1965]

[Gilbert 2009]

[Varenne 2001, 2013, 2014]

...

[Rouchier 2013]

[Manzo 2005, 2014]

récurrences historiques

enjeux méthodologiques et techniques, passés et à venir

Investir pleinement la littérature de la "Validation"

histoire

épistémologie

[REY 2015, p 11 - 184]

Investir pleinement l'histoire de la simulation

Sortir de la " logique de preuve"

2) illustre la dimension sociale de la "Validation"

SimpopLocal

" sys. peuplement. néolithique "

[Pumain 2005]

cumulativité des connaissances en SHS

éléments de bilan épistémologique

[Rouchier 2013]

1) Multiplicité des points de vue sur un phénomène = connaissances

histoire

épistémologie

1

2

3

4

1

2

3

1

3

2

1

3

4

1

2

2

4

1

2

4

...

1

géographe(s)

archéologue(s)

M1

M2

M3

M4

M5

Quels moyens pour discuter, comparer

ces modèles concurrents proposés  ?

intra (eq. interne)

inter

(eq.

externe)

histoire

épistémologie

montrerrejoueranalyser, comparer les raisonnements / modèles (valides ou pas) avancés ?

3 objectifs

éléments de bilan épistémologique

v1

v1a

v1b

v2a

v2b

v2c

v2ab

v2aa

déroulé du raisonnement,

complexification modèle

introduction des critères d'évaluation

macro

temps

pop

temps

forme

trajectoire

durée vie des hypothèses,

[Besse 2000]

qualité dépendante du contexte

Sortir de la logique de preuve

logique de progression de sens (abduction)

dialogue

micro

Schéma construction actuel inadapté

biaisé

choix

histoire

épistémologie

variabilité hyp. implicite à la construction

temps

trop linéaire, abbatis-brûlis !

éléments de bilan épistémologique

Un troisième scénario ...

Multi-modelling

Un troisième scénario ...

valeurs paramètres

mécanismes 

condition initiale 

simulation

Objectifs

réplications

optimisation multi-modelling

paramètres

Un troisième scénario ...

autorise la "variation de structure" en vue d'obtenir les meilleurs modèles rapport aux objectifs fixés

Un troisième scénario ...

évaluation à t = 3

une intuition [ecqtg 2013] qu'il faudra encore mettre en oeuvre ...

Bilan épistémologique

histoire

épistémologie

mgo

exploration

simpoplocal

plugin visualisation

epistémologie, historiographie

discussions,

publications

activités thèse

Simpoplocal

Marius

héritage

héritage

[REY 2015, p 303 - 328]

(paul, clémentine, romain)

(clara, sébastien puis romain)

Growing Models from the Bottom Up. An Evaluation-Based Incremental Modelling Method (EBIMM) Applied to the Simulation of Systems of Cities

JASSS 18 (4) 9  - 2015

Clémentine Cottineau,

Romain Reuillon,

Paul Chapron

Denise Pumain

modèle from scratch,

plannification combinatoire mécanismes,

prise en compte des versions

plannification des critères

[Cottineau 2014]

confrontation

modèle de simulation Marius

Growing Models from the Bottom Up. An Evaluation-Based Incremental Modelling Method (EBIMM) Applied to the Simulation of Systems of Cities

JASSS 18 (4) 9  - 2015

Clémentine Cottineau,

Romain Reuillon,

Paul Chapron

Denise Pumain

[Cottineau 2014]

modèle de simulation Marius

[Cottineau 2014]

formaliser autrement les théories

Simpuzzle

https://github.com/ISCPIF/simpuzzle/

flexibilité

accessibilité

SimpopLocal

Marius

Indus

...

Clémentine Cottineau,

Romain Reuillon,

Paul Chapron,

Sébastien Rey-Coyrehourcq,

Denise Pumain

A modular modelling framework for hypotheses testing in the simulation of urbanisation

Systems (3) 4 - octobre 2015

Ps : Openshaw 1983 - 1988

[...]

We do so using a modular framework of model-building and evolutionary algorithms for the calibration of several model structures.

[...]

This project aims at tackling equifinality in systems dynamics by confronting different mechanisms with similar evaluation criteria.

[...]

It enables the identification of the best-performing models with respect to the chosen criteria by scanning automatically the parameter along with the space of model structures (as combinations of modelled dynamics).

Building an automated modeling system to explore a universe of spatial interaction models.

From Data Crunching to Model Crunching: The Dawn of a New Era.

"catalogue de théories"  - vs- 

"combinaison équations"

Expansion des axes

de développements

reproductibilité, passage à l'échelle

multi-modélisation

construction  et

évaluation 

automatique

MGO

Algorithmes

Visualisation

grille de calcul

- 31 - 

histoire

épistémologie

Piste de recherche

ou comment gérer l'après ERC ...

Péréniser, diffuser et rendre accessible des outils encore trop spécifiques

Développer de nouveaux algorithmes d'explorations pour les modèles

valeurs paramètres

mécanismes 

condition initiale 

réplications

paramètres

valeurs paramètres

mécanismes 

condition initiale 

réplications

paramètres

multi-modelling

Piste de recherche

ou comment gérer l'après ERC ...

Développer de nouveaux modèles s'appuyant sur cette plateforme !

Maintenir une veille active sur les aspects historiques et épistémologiques

S'impliquer dans la formation, et la diffusion du HPC (outils, accès) auprès des géographes

autre activités

- écriture et encadrements de stages

- veille, accompagnement, formations pour les étudiants et chercheurs

- participation aux autres projets du laboratoire

- développer de nouveaux axes de recherche

IA - Visualisation scientifique - Histoire et Epistémologie - Ingénierie logicielle

4 stages

2 sur SIG QGIS

2 plugin OpenMole

EIGHTIES

MAPS

MicMac

ANR TransMonDYn

formations

réseaux interdisciplinaires

~ 50 heures par an

quelques principes généraux

maintenir une veille active

diffuser les outils et les savoirs acquis

participer à la vie scientifique collective

universitaire ou professionelle

cultiver une ouverture interdisciplinaire

pratiquer et revendiquer une science ouverte

Seminaire IDEES

By sebastien rey coyrehourcq

Seminaire IDEES

  • 765