{Les données structurées}

 

SNT Thème 1

{Comment manipuler les données ?}

{Repères historiques}

1. Je suis l'entreprise ayant inventé le premier disque dur. Je suis...

{Questions flash}

2. Je suis l’inventeur d’un système d’automatisation des métiers à tisser. Je suis...

{Questions flash}

3. Je suis un projet mené par un grand pays afin de rendre les données gouvernementales plus transparentes. Je suis...

{Questions flash}

4. Je suis le système qui remplace progressivement les disques durs. Je suis...

{Questions flash}

1. IBM

2. Basile Bouchon

3. L'Open Government Initiative

4. La mémoire flash 

{Réponses}

Act 2 p 9 : Que sont les données personnelles et les métadonnées ?

Questions :

  1. Identifier les données personnelles du Doc. 1.

Nom, adresse, adresse mail, numéro de Sécurité sociale

Questions :

2. Donner un exemple d’identification « indirecte ».

Le numéro de Sécurité sociale permet de retrouver quelqu'un par le biais du fichier de la sécurité sociale

{Les métadonnées : pourquoi est-ce important ?}

Questions :

3. Lister trois métadonnées qui ne sont pas liées à des données personnelles dans le Doc. 2.

Rock, 2014, piste 1

Questions :

4. Expliquer à quoi servent les métadonnées.

Les métadonnées apportent des informations complémentaires relatives à un  fichier qui sont utiles pour exploiter les données qu'il contient : indexation, recherche, tri...

Questions :

5. Répondre à la question posée dans le titre  de l'activité.

Les données qui identifient des personnes sont des données personnelles et les données qui donnent des informations sur des fichiers de données sont des métadonnées.

Act 3 p 10 : Comment structurer les données ?

Act 4 p 11 : Quels sont les enjeux et les risques du Big Data ?

Un autre enjeu majeur est l'usage commercial des données personnelles.

Vidéo : Le business des données personnelles 

Act 5 p 12 : Comment exploiter des données ?

L'Open Data à la loupe

Act 6 p 13 :   Qu’est-ce que le cloud ?  

Ce qu'il faut savoir sur le cloud

Complément :   

Dans une base de données relationnelle, une clé primaire est la donnée qui permet d'identifier de manière unique un enregistrement (objet de la base) dans une table.

Exemple : 

Dans l'activité 3, quel descripteur joue le rôle de clé primaire ?

Le numéro de station

Statistiques d’un radar

  • Sur le réseau du lycée, dans le répertoire Classe_2D2, dans le dossier à votre nom, créez un dossier SNT
  • Dans le répertoire de votre classe, dans le dossier _travail, dans le dossier SNT, se trouve le fichier stats_radar_mars_2019.ods.
  • Copiez-collez ce fichier vers le dossier SNT dans le dossier à votre nom.

Le fichier stats_radar_mars_2019.ods contient les statistiques des relevés des excès de vitesse
enregistrés par un radar fixe au cours du mois de mars 2019 sur une route nationale dont la vitesse maximale
autorisée est de 90 km/h.

1. Quels sont les descripteurs (en-tête de colonne) de cette table de données ? 

Date Horaire Immatriculation Pays

Marque

 

vitesse retenue

2. Combien d’infractions ont été enregistrées ?

5500

3. Trier les données par ordre chronologique : sélectionner la colonne A puis Données |Tri croissant et Étendre la sélection.

 4. Sélectionnez les colonnes A à F et sélectionnez Données I  Autofiltre . Que se passe-t-il ?

Apparition d'un menu déroulant pour chaque colonne.

 5. Combien de valeurs différentes prend le descripteur "Pays" ?

Avec l'AutoFiltre

13

 6. Construire le relevé statistique de la répartition entre français et étrangers (ensemble) puis faire un diagramme circulaire. Vous pourrez utiliser la commande NB.SI pour déterminer l’effectif des deux catégories.

=NB.SI(D2:D5501;"France")

=ARRONDI(NB.SI(D2:D5501;"France")/5500*100;0)

 7. Quel est le pourcentage de véhicules de marque française (Peugeot, Citroën et Renault) parmi les véhicules en excès de vitesse.

=NB.SI(E2:E5501;"Peugeot")+NB.SI(E2:E5501;"Renault")+NB.SI(E2:E5501;"Citroën")

 8. Quelle est la vitesse maximale relevée ? Combien de véhicules ont été enregistrés à cette vitesse ?

=MAX(F2:F5501)

=NB.SI(F2:F5501;"148")

 9. Y a-t-il eu des infractions le 18 mars entre 12h et 13h ?

     Si oui, combien ?

Vous pourrez utiliser une combinaison de filtres :

        Données I Plus de filtres I Filtre standard

Sélectionner les colonnes Date et Horaire

 10. Combien de véhicules allemands de marque Hyundai ont été flashés ? (Vous pouvez réinitialiser le filtre : Données I Plus de filtres I Réinitialiser le filtre)

11. Quel est le pourcentage de véhicules ayant commis un excès de vitesse supérieur à 30 km/h ?

Environ 5,5%

=ARRONDI(NB.SI(F2:F5501;">120")/5500*100;1)

 12. Construire le diagramme en barres des infractions selon les tranches suivantes (vous pourrez utiliser la commande SOMMEPROD ou la fonction NB.SI.ENS)

La fonction NB.SI.ENS permet de compter le nombre de valeur vérifiant plusieurs critères

=NB.SI.ENS(F2:F5501;">90";F2:F5501;"<96")

=ARRONDI(NB.SI.ENS(F2:F5501;">90";F2:F5501;"<96")/55;1)

Enquête policière

Nous allons mener une enquête policière. L’inspecteur Labavure est chargé de retrouver un suspect suite à une plainte d’un employé de la SNCF.

L’incident s’est produit le 6 avril 2019, dans un train Paris-Bordeaux. J’assurai mon service à la voiture-bar n°4 lorsqu’une petite dame (moins d’un mètre soixante pour sûr) s’est présentée au bar. Cette personne d’un certain âge, environ la soixantaine, m’a commandé un thé noir, avec un fort accent du Sud de la France. Je lui ai répondu que je n’avais pas cette sorte de thé. Visiblement agacée, elle s’est mise à m’insulter et à commencé à vouloir me frapper avec son parapluie. Heureusement que le jeune homme qui l’accompagnait (son petit-fils j’imagine, car il l’a appelé « Mémé ») l’a arrêté et l’a évacué vers l’arrière du train.

L’inspecteur Labavure a eu accès au fichier clients de ce trajet et l’a croisé avec le fichier TES (Titres Électroniques Sécurisés : fichier national des cartes nationales d’identité et passeports). Il en a extrait le fichier sncf_listing.ods. À l’aide des informations de la déposition, aidez l’inspecteur Labavure à dresser sa liste de suspects.

  • Dans le répertoire de votre classe, dans le dossier _travail, dans le dossier SNT, se trouve le fichier sncf_listing.ods.
  • Copiez-collez ce fichier vers le dossier SNT dans le dossier à votre nom.

Activer l'AutoFiltre s'il n'est pas activé par défaut.

Vous pouvez ainsi filtrer les données selon leur valeur pour un ou plusieurs descripteurs.

Il faut repérer les indices, par exemple il est fait mention d'une "petite dame (moins d’un mètre soixante pour sûr)"

{Résumé audio}

Les données structurées 2022

By snt

Les données structurées 2022

  • 961