Les Ateliers Archéomatiques

Lundi 14 et Mardi 15 Mai 2018 - MSH Val de Loire

Sylvain Badey

R et Rstudio pour la manipulation statistique de données archéologiques.

Atelier Archéomatique 18.1

  • langage de programmation et  logiciel dédié aux statistiques et à la science des données
  • inventé en 1993
  • dérivé du langage S
  • logiciel libre, gratuit, multiplateforme
  • utilisé dans tous les secteurs scientifiques
  • nombreuses extensions (packages)
  • une interface graphique pour
  • créé en 2011
  • logiciel libre, gratuit et multiplateforme
  • complète R avec
    • un éditeur de script avec coloration syntaxique
    • un affichage simultané de la console R, des fichiers, des graphiques et de l'aide
    • la gestion des extensions
    • des outils (production de rapports,...)

Rstudio

  • Il est gratuit
  • Il est compatible avec tout (imports / exports)
  • Il est relativement facile a utiliser (et on trouve des tutos et de l'aide à profusion)
  • Tout le monde l'utilise !
  • Il permet d'automatiser et de reproduire les analyses statistiques récurrentes.
  • Il y a un package  pour tout !
  • Il sait tout faire !!
  • Les statistiques sont universelles
  • On a pas (peu) de passif avec d'autres logiciels de statistiques

en archéologie

R et Rstudio pour la manipulation statistique de données archéologiques.

17 réponses pour 18 participants !!

Réponses au questionnaire Framaforms.org

R et Rstudio pour la manipulation statistique de données archéologiques.

Comment avez vous connus l'existence de ces Ateliers Archéomatiques ?

Réponses au questionnaire Framaforms.org

R et Rstudio pour la manipulation statistique de données archéologiques.

Selon vous quel est votre usage des logiciels/interfaces/packages suivants

Réponses au questionnaire Framaforms.org

R et Rstudio pour la manipulation statistique de données archéologiques.

Avez vous un jeu de données pour l'atelier du mardi 15 mai ?

Réponses au questionnaire Framaforms.org

R et Rstudio pour la manipulation statistique de données archéologiques.

Découverte de R et Rstudio

Pourquoi utiliser R et Rstudio (en archéologie)

Premiers Pas

Premiers travaux

Analyses bivariées

Voyage dans le Tidyverse

diplyR => Manipuler / tidyR => Nettoyer

ggplot2 => Représenter

Installation de R et Rstudio

Installation

(cliquer sur les icônes pour accéder aux pages de téléchargement)

 

1) Installer d'abord R

 

2) Puis Rstudio

 

(approuvez tout ce que l'on vous demande.. ayez confiance !)

Découverte de RStudio

Premier contact

  • Présentation de l'interface
  • la console et l'invite de commande >
  • les objets
    • les objets simples
    • les Vecteurs
  • les fonctions
    • arguments
    • quelques fonctions
    • l'aide
    • l'autocomplétion

Découverte de RStudio

Présentation de l'interface

Console R

Source (script, données)

Environnement (+historique)

Répertoire (Files) Graphiques (Plot) Aide (Help)

Découverte de RStudio

Présentation de l'interface

Le panneau Source contient le script (alternance de #commentaires et d'instructions) que l'on enregistre pour  reproduire la démarche statistique.

La console permet d'exécuter les instructions contenues après le >. Le résultat apparait à la suite (calculs), dans le panneau Plots (graphiques) ou Environnement (création de variables).

Le panneau Environnement permet de visualiser les tableaux importés et les objets créés. L'historique (onglet History) permet de renvoyer les instructions dans le panneau source (script) ou la Console.

Le panneau Files permet de définir l'espace de travail: parcourir avec [...] puis  More > Set as working directory. Les autres onglets concernent les graphiques (Plots) les Packages et l'Aide (Help).

changer la position des panneaux

nouveau script.R

Importer CSV / XLS

Découverte de RStudio

EXERCICE

Créer un objet imc contenant l'Indice de masse corporelle de chaque individu interrogé.

 

Calcul de l'IMC:

Découverte de RStudio

EXERCICE

1) Créer un nouveau script

 

2) Copier la première ligne de commande qui commence par setwd(...)

Copier-Coller OU historique et [Shift + Entrée]

 

3) Commenter cette ligne

 

4) Enregistrer le script paleometallo.R

Découverte de RStudio

EXERCICE

1) Créer un nouveau script ceramologie.R

 

2) Définir le répertoire de travail

Note: C'est le même que pour les données précédentes

 

3) Importer le tableau Excel Amboise_ceram.xls

 

4) Commenter le script et l'enregistrer

Découverte de RStudio

EXERCICE

A la suite du script Paleometallo.R

 

Analyser la variable quantitative `longueur` du jeu de donnée `culot`

 

  • indicateurs de centralité
  • indicateurs de dispersion
  • représentations graphiques

Découverte de RStudio

EXERCICE

A la suite du script Paleometallo.R

 

Analyser la variable qualitative`morphologie` du jeu de donnée `culot`

 

  • faire un tri à plat
  • y at'il des données manquantes (NA) ?
  • représentations graphiques

Voyager dans le Tidyverse

Voyager dans le Tidyverse

readR

(prononcer rid-R)

Importer

Voyager dans le Tidyverse

tidyR

(prononcer taï-di-R)

Importer

Ranger

Voyager dans le Tidyverse

diplyR

(prononcer di-plaï-R)

Importer

Ranger

Transformer

Voyager dans le Tidyverse

ggplot2

Importer

Ranger

Transformer

Visualiser

Voyager dans le Tidyverse

l'opérateur pipe

AA18_1_aRcheologie

By Formation_SIG

AA18_1_aRcheologie

Introduction - présentation AA2018

  • 158
Loading comments...

More from Formation_SIG