Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Taux de complétude des métadonnées par jeux de données #30

Open
clementmandron opened this issue Dec 6, 2023 · 3 comments
Open

Comments

@clementmandron
Copy link
Collaborator

clementmandron commented Dec 6, 2023

User story

Je suis
Un gestionnaire de catalogue.
Un administrateur ministériel des données.

Je veux
En tant que gestionnaire, j'ai un rôle de coordination. Je souhaite apprécier mon patrimoine de données au regard des besoins de standardisation et d'agrégation, d'ouverture ou plus simplement de sélection des jeux de données les plus pertinents pour mon usage. Je souhaite pouvoir évaluer la qualité de mon patrimoine et en promouvoir l'amélioration :

  • à partir d'indicateurs et/ou de visualisations basés sur les métadonnées,
  • en identifiant les jeux de données dont les métadonnées gagneraient à être complétées, actualisées, consolidées, etc.

Je peux

Identifiant les jeux de données dont les métadonnées gagneraient à être complétées, actualisées, consolidées, etc., par rapport à la moyenne.
Comparer le remplissage des métadonnées entre catalogues.

Besoins associés (du plus au moins évident)

  • 1- Connaître le nombre de JDD avec une description remplie
  • 8- Connaître la complétude des champs de métadonnées, pour les données homogènes
  • 16- Contrôler les métadonnées sur deux niveaux : 1 présence, 2 règles métiers ou applicatives

Implémentation

  • Un tableau de tous les jeux de données, avec le taux de complétion des métadonnées
  • La distribution du taux de complétion

Remarques

Après première production de l'indicateur

Comment l'indicateur en l'état répond aux besoins ?

L’indicateur permet d’apprécier, pour l’ensemble des jeux de données, le taux de remplissage des métadonnées.

En utilisant les filtres, on peut comparer deux univers ou catalogue et comprendre les différences dans le remplissage des métadonnées.

Cet indicateur est un peu différent des autres, car ils concernent la qualité des métadonnées, et non la qualité des données.

Comment pourrait-il être amélioré (préconisations) ?

  1. Pouvoir ajouter les liens des fiches métadonnées dans le tableau
  2. Enrichir cet indicateur avec les nouvelles métadonnées de l’outil (réutilisations, data de mise à jour, etc.).
  3. Au déjà de l’indication “métadonnée présente ou non”, on pourrait aussi détecter des anomalies : chaîne de caractère ne correspondant pas à une phrase ou encore une description trop courte
@clementmandron clementmandron changed the title Taux de complétude [A compléter] Taux de complétude des métadonnées par jeux de données Dec 6, 2023
@clementmandron
Copy link
Collaborator Author

@qloridant @Thesauruv c'est bon, vous pouvez commencer la relecture / priorisation des tickets (celui-ci et les autres) en "Todo" !

@Thesauruv
Copy link
Collaborator

C'est parfait, rien à redire. Merci @clementmandron !

@qloridant
Copy link
Collaborator

@Thesauruv @clementmandron
J'ai ajouté un graphique de distribution.
J'ai aussi ajouté la moyenne (plus simple a retenir que la forme du graphe)

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

3 participants