Skip to content

benoitdavidfr/didodcatexport

Repository files navigation

Export DCAT du catalogue de DiDo

DiDo est un outil de diffusion des données du service des statistiques (SDES) du MTE. Sa documentation est accessible sur https://data.statistiques.developpement-durable.gouv.fr/dido/api/v1/apidoc.html.

Le présent projet consiste à concevoir et prototyper un export DCAT du catalogue des données de DiDo.
Les correspondances en DCAT des classes, des propriétés et des valeurs possibles définies dans DiDo sont définies ici.

Les principes suivants ont été retenus pour l'exposition DCAT:

  • L'export DCAT est exposé à l'URL https://dido.geoapi.fr/v1/dcatexport.{fmt}?page={page}&page_size={page_size}
  • Le contexte JSON-LD de l'export est exposé à l'URL https://dido.geoapi.fr/v1/dcatcontext.jsonld
  • La ressource JSON-LD correspondant au catalogue (dcat:Catalog) peut contenir de nombreux jeux de données et son export est donc paginé selon les principes d'une Collection Hydra identiques à ceux utilisés dans l'export DCAT de https://data.gouv.fr/ à l'URL https://www.data.gouv.fr/catalog.jsonld.
  • La page contenant un sous-objet dcat:Catalog contient aussi tous les Dataset et autres objets liés qui n'ont pas été fournis dans les pages précédentes.
  • Chaque ressource de l'export est identifiée par un URI conforme aux modèles ci-dessous sauf les fichiers annexes (Attachment) dont l'URI est l'URL de téléchargement du fichier.
  • L'URL de téléchargement associé à chaque millésime exposé dans l'export est celui fourni par DiDo pour le format CSV avec pour chaque colonne son nom, sa description et son unité.
  • Outre le fichier CSV, à chaque millésime est associé un schéma JSON qui fournit la liste des champs du fichier CSV.
  • Pour chaque référentiel et chaque nomenclature, un dcat:Dataset est défini ainsi que des dcat:Distribution correspondants à un ou plusieurs formats de téléchargement (CSV, JSON, GéoJSON) ; un schéma JSON est aussi associé à chaque référentiel et à chaque nomenclature.
  • Les données exposées par le prototype sont celles exposées sur le site école indiqué ci-dessus ; en amont de l'export DCAT un téléchargement des méta-données DiDo est effectué à partir de ce site.

DCAT étant une ontologie du web des données, les ressources sont identifiées par des URI et il est donc nécessaire de définir des URI pour chaque ressource apparaissant dans l'export. La plupart des URL fournies par DiDo ne peuvent pas être utilisés comme URI car ils contiennent le no de version de l'API et ne sont donc pas stables.
Ainsi des URI ont été définis dans le prototype et sont de la forme :

Chaque URI est déréférencable et renvoit la description de la ressource en JSON-LD à l'exception des URI de foaf:Document, dc:LicenseDocument et dc:Standard qui renvoient vers un document (JSON, HTML, PDF, CSV, ...) exposé en HTTP.

L'export DCAT est finalement testé par le validateur DCAT-AP exposé sur https://data.europa.eu/mqa/shacl-validator-ui/.

About

Export DiDo en DCAT

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages