Atelier : Visualiser les données issues du web avec un logiciel SIG
Objectifs
Apprendre à interroger le web des données et à tirer profit des ressources disponibles – le point de vue du chercheur
Outils
Le web des données
Les principes du web du données: les
5 étoiles
-
-
-
-
-
-
-
-
Interroger le web des données
- A Geographic Query Language for RDF Data
Les ressources disponibles
Deux exemples
Les universités dans le monde / en Europe
Les données statistiques des pays de la Communauté européenne
Claire-Charlotte Butez – Visualiser les données avec QGIS
Objectifs
Supports
Outils
Quelques outils utiles :
Logiciel QGIS : Système d'Information Géographique (SIG) convivial distribué sous licence publique générale GNU. C'est un projet officiel de la fondation Open Source Geospatial (OSGeo). Il est compatible avec Linux, Unix, Mac
OS X, Windows et Android et intègre de nombreux formats vecteur, raster, base de données et fonctionnalités.
Logiciel GIMP : Outil d'édition et de retouche d'image et est diffusé sous la licence GPLv3 comme un logiciel gratuit et libre. Il en existe des versions pour la plupart des systèmes d'exploitation dont GNU/Linux,
OS X, et Microsoft Windows.
Données géographiques
Données géographiques Eurostat : Données géographiques de références pour les statistiques européennes. Lors de leur utilisation leur source doit être citée dans la légende de la carte et dans la page d'introduction de la publication, accompagnée de la mention suivante: : FR: © EuroGeographics pour les limites administratives.
-
Autres ressources à connaitre
-
-
Les organismes qui fournissent de l'Open Data en téléchargement ou via les web-services : WMS, WFS
Les géocodeurs : Google Map, Google Earth, Geonames…
Installation et découverte du logiciel QGIS
Affichage et préparation des données géographiques
Données géographiques
Affichage des données Eurostat
Visualisation des couches et de leurs métadonnées
Exploration de la couche NUTS_RG_10M_2010.shp
Données tabulaires
Utilisation des données issues du web de données.
Nous avons plusieurs fichiers à notre disposition que nous utiliserons au cours des exercices de cette deuxième partie (cf 1ère partie du bootcamp : requêtes sur les serveurs sparql)
-
-
Populations au 2ème échelon administratif en 2010, répartitions hommes-femmes par régions:
nuts2_pop_2010.csv
Intégration des données tabulaires dans le SIG:
Les données s'intègrent dans QGIS comme n'importe quelle autre couche vecteur avec Couche > Ajouter une couche vecteur
Il est possible de créer une couche de point à partir d'un fichier .csv qui contient des coordonnées X et Y
-
Observation du fichier .csv : Ces données comprennent des valeurs et les coordonnées X Y du lieu concerné. Ces valeurs peuvent être utilisées pour créer des points et les projeter dans QGIS.
Couche > Ajouter une couche de texte délimité
Indiquer l'emplacement du fichier “resultat_corrige”
Dans “autre délimiteurs” indiquer le séparateur “|”
Indiquer le champ X = “long” et le champ Y = “lat”
Indiquer le code EPSG des coordonnées : 4326
Enregistrer cette projection au format .shp
Afficher la nouvelle couche dans le SIG et choisir le fond vecteur adapté, par exemple la couche NUTS_RG_10M_2010_pays
Exploration et analyse des données
Les requêtes attributaires
Les requêtes attributaires se font avec la table d'attributs des données vectorielles, points, lignes ou polygones
Couche > Propriétés > Ouvrir la table d'attributs > Select by expression
Vous pouvez tester les requêtes sur les données, par exemple les universités de + de … inscrits etc..
Tous les résultats peuvent être enregistrés dans de nouvelles couches. Ceci pourra nous servir en fin de travail pour mettre au point une carte.
Fonctions de requête spatiale
Autre outil de sélection géographique par requête dans Vecteur > Requête spatiale.
Pour installer cette extension aller dans Extension > Gestionnaire d'extension et rechercher requête spatiale
Vous trouverez dans cet outil les opérateurs de requête spatiale : Contient, A l'intérieur, Croise, Intersecte, Est disjoint, Est égal
Tester avec l'outil : Sélection des entités sources depuis > “résultat_corrige”, Où l'entité > “à l'intérieur”, Entités références de “NUTS_RG_10M_2010_pays”
Vérifier et ajouter les entités non sélectionnées à cause de l'imprécision des données
Enregistrer la sélection dans une nouvelle couche > resultat_corrige_europe.shp
Ajouter la nouvelle couche à la carte
-
Outils d'analyse spatiale
Avant de se lancer dans l'analyse spatiale il faut bien réfléchir à la finalité du travail
Vecteur > Outils de géotraitement
Pour chaque outil :
La couche vectorielle de saisie est l'input, couche sur laquelle on agit
La couche d'intersection est la couche qui participe à l'opération, le feature.
Le fichier de sortie est la couche résultante de l'opération, l'output.
Les principaux outils sont :
Tampons pour créer une zone tampon autour d'une entité
Découper pour découper une couche selon une autre ou une entité
Intersection pour assembler des portions d'entités qui se superposent ou ayant une limite commune
Regrouper pour créer des fusions entre entités selon un champ donné
Union pour assembler des entités qui se superposent
Différencier pour récupérer tout ce qui n'est pas égal au feature.
Tester la création d'une zone tampon autour d'un polygone:
Tampon > Couche vectorielle de saisie “NUTS_RG_10M_2010_pays”
Distance tampon > 0.01
Définir un fichier de sortie, lancer le traitement et ajouter la nouvelle couche.
Tester la possibilité de compter le nombre de points dans un polygone, par exemple le nombre d'université par pays
Vecteur > Outil d'analyse > Compter les points dans les polygones > Indiquer les deux couches, le nom du champ en sortie (ex: nbr_univ) et la nouvelle couche : NUTS_RG_10M_2010_pays_univ.shp
Ajouter la nouvelle couche et vérifier la présence des nouvelles données attributaires
-
Jointures attributaires ou spatiales
Tester la jointure spatiale :
Ajouter à la table d'attribut des universités l'indicatif du pays auquel elles appartiennent
Dans Vecteur > Outil de gestion de données > Joindre les attributs par localisation
Indiquer la couche vecteur “resultat_corrige_europe” et joindre la couche vecteur “NUTS_RG_10M_2010_pays”
Indiquer un fichier de sortie “resultat_corrige_europe_join” et lancer le traitement
Ajouter la nouvelle couche et vérifier la présence des nouvelles données attributaires
Tester la sélection attributaire ou spatiale des université françaises
-
Tester la jointure attributaire :
Compléter des données attributaires à partir d'une jointure faite sur un fichier .csv
1er exercice : Récupération des données sur les populations par régions au format .csv :
eurostat_2004.csv
Couche > Ajouter une couche vecteur et ajouter le fichier eurostat_2004
Les principes de la jointure attributaire
Fenêtre des propriétés de la couche > Onglet Jointure
Utilisée pour joindre des données tabulaires à partir d'un champ contenant un identifiant commun à la couche et à la table
Préparer les champs de jointure : Ajouter un champ à la table attributaire de la couche NUTS_RG_10M_2010
Ouvrir la table d'attribut > Basculer en mode édition > Ouvrir la calculatrice de champ > Créer un nouveau champ à partir de l'expression : lower( “NUTS_ID” ) > Enregistrer
Fenêtre des propriétés de la couche > Onglet Jointure
Ajouter une jointure sur eurostat2004.geocodeProvince = NUTS_RG_10M_2010.nuts_id_lo
Créer une couche pour les entités concernées par la jointure : NUTS_RG_10M_2010_densite
Possibilité de faire un calcul de densité de population sur les données
Ajout d'un champ 'surf_km2' à la table attributaire à partir de l'expression : $area / 1000000
Ajout d'un champ 'densite' à la table attributaire à partir de l'expression : “eurostat_4” / “surf_km2”
Valider
Propriété de la couche > Style > Symbole gradué > Sélection du champ 'densité', 5 classes, mode quantile ou autre (cf Cartographie des données)
Ajouter les couches HYP_50M_SR_W ou doubler la couche “data_nuts_rg_2_pop” pour afficher les valeurs nulles dans le but de réaliser une carte
comme par exemple :
2ème exercice : Récupération des données sur les populations par régions au format .csv :
nuts2_pop_2010.csv
Couche > Ajouter une couche vecteur et sélectionner le fichier nuts2_pop_2010.csv
Dans la couche NUTS_RG_10M_2010 > Fenêtre des propriétés > Onglet Jointure
Ajouter une jointure sur nuts2_pop_2010.nuts_id = NUTS_RG_10M_2010.NUTS_ID
Vérifier dans la table attributaire si la jointure a fonctionné
Créer une sélection sur NUTS_RG_10M_2010 : “STAT_LEVL__fckg_QUOT_ = 2 et faire une couche “data_nuts_rg_2_pop” à partir de cette sélection
Ajouter le résultat “data_nuts_rg_2_pop” dans le projet
Sur cette couche nous allons calculer la proportion Homme-Femme pour les données à notre disposition
Pour cela il faut ajouter des champs à la table attributaire de la couche “data_nuts_rg_2_pop”
Ouvrir la table d'attribut > Basculer en mode édition > Ouvrir la calculatrice de champ > Créer trois nouveaux champs à partir des expressions :
Champ '%homme' : (“nuts2_po_2”100) / “nuts2_po_1” > Enregistrer
Champ '%femme' : (“nuts2_po_3”100) / “nuts2_po_1” > Enregistrer
Champ 'F%H' : ”%femme“ - ”%homme“ > Enregistrer
Cartographier le résultat : Propriété de la couche > Style > Symbole gradué > Sélection du champ 'F%H' > Créer une palette de couleur adaptée (cf Cartographie des données)
Ajouter les couches HYP_50M_SR_W ou doubler la couche “data_nuts_rg_2_pop” pour afficher les valeurs nulles dans le but de réaliser une carte comme par exemple :
Cartographie des données
Composeur d'impression
Rappel sur la mise en page d'une carte avec le composeur d'impression
Pour faire une mise en page aller dans Projet > Nouveau composeur d'impression.
Dans le composeur d'impression, intégrer tous les éléments indispensables à la carte : Carte-s, légende, titre, orientation, échelle, sources, nom et dates de réalisation.
Exportation de la mise en page : Composeur > Exporter comme image