date | location | attendees | |||
---|---|---|---|---|---|
2017-07-11 |
Paris |
|
Joël accompagne les structures publiques et privées à l'ouverture des données ainsi qu'à leur réutilisation sous forme de :
- Conseil ;
- Formation (culture, technique — avec R notamment) ;
- Médiation (la CAF de Paris par exemple).
Datactivist réalise l'évaluation indépendante des engagements de la France au sein de l'Open Government Partnership (OGP), mais aussi des engagements de la Ville de Paris (lire sa candidature à l'OGP).
Joël est spécialisé dans la sociologie électorale quantitative. Pratique qu'il exerce depuis 2005.
Quand tu ouvres tes données, tu ne sais pas comment elles vont être utilisées.
Enfin, Joël a participé à la création de DODOData pour aider à automatiser les demandes à la Commission d'Accès aux Documents Administratifs (CADA) ainsi que le retraitement des données, notamment via l'interconnexion entre les différentes plate-formes de données.
Le moteur de recherche est perfectible.
Je cherche beaucoup de fois le terme élections pour trouver des données d'élections. Le bon jeu de données est souvent noyé dans les résultats.
😯 Aucun résultat n'est récent
🔍 "Prénoms"
- 🙂 Il y a 1 jeu de données de l'INSEE
- 🤔 Il y a 50 jeux locaux qui redécoupent ce jeu de l'INSEE
- 🤔 Le classement n'est pas compréhensible
- Le premier jeu correspond à des élections municipales
- Le quatrième correspond aux élections européennes
- Puis arrivent ensuite des jeux relatifs aux élections cantonales et aux élections législatives
- ❗️Enfin arrive en 8ème position un jeu mentionnant explicitement élections présidentielles
- Par contre en commençant à saisir "elections présidentielles" l'auto-complétion indique un résultat potentiel intéressant.
- 😕 Les tags n'aident pas à trier dans ce cas de figure
- 😨 Pour trouver un résultat récent (de 2017), le mieux est encore d'utiliser la recherche Google (à requête équivalente)
D'ailleurs Google m'affiche même le post de blog.
Je favorise les jeux de données au format CSV ou Excel, ça va beaucoup plus vite à manipuler.
🤔 La recherche fonctionne uniquement si on cherche le bon mots-clés (qui n'est pas connu à l'avance et qui demande du temps à découvrir car souvent spécifique au vocabulaire des administrations).
Je regarde souvent les derniers jeux de données publiés sur la page d'accueil.
Des fois j'utilise les thématiques mais leur classement fait très administration publique
Il n'y a pas d'autres plates-formes qui aggrègent autant de données que data.gouv.fr.
❗️ Si une commune renseigne mieux un jeu de métadonnées/tags qu'une administration publique, elle devancera un Ministère par exemple.
😤 C'est problématique car un jeu de données à couverture nationale contenant le même type d'information est plus important.
🤔 Sans compter que chaque découpage local contient son lot de colonnes spécifiques et le reformate à sa sauce.
👎 Les onglets sont peu visibles.
👎 Les facettes sont peu visibles/lisibles également. De par leur taille et emplacement notamment.
💬 Organiser les résultats de manière moins linéaire peut-être ?
🔍 "élection présidentielle" vs. "Élection présidentielle Paris"
😤 Même en cherchant sur le nom exact du dataset il n'apparait pas dans les résultats.
😤 "election présidentielle 2017" ne mène pas à "Election présidentielle des 23 avril et 7 mai 2017 - Résultats du 2ème tour ".
🔍 "accidents"
😤 L'autocomplete ne montre que des résultats du département des Vosges.
🔍 "sirene"
😤 L'autocomplete ne donne rien (découpage local), donc on lance la recherche.
👍 On a le bon résultat en premier.
🔗 Election présidentielle des 23 avril et 7 mai 2017 - Résultats du 2ème tour
À propos des métadonnées :
- 😕 Couverture temporelle indique aller jusque 2014 alors qu'en inspectant les données, elle va jusqu'en… 2017
- 😤 La granularité est fausse
- 😤 Il n'y a que 2 lignes de description
D'ailleurs quand je vois XML, dans ma tête je traduis par XL (Excel).
🤔 L'encart Détails n'en contient d'ailleurs pas davantage.
Je sais qu'il y a un guide technique pour utiliser les données mais il n'apparait pas.
💬 Je vais devoir aller le chercher sur le site web du producteur de données.
👎 Il n'y a pas de lien hypertexte pour aller sur le site du producteur depuis le dataset — ni depuis la page de l'organisation.
Une page de dataset me permet de voir de suite les données dont j'ai besoin.
💬 Avoir la liste des colonnes, éventuellement les lignes.
🔗 Base Sirene des entreprises et de leurs établissements (SIREN, SIRET)
💬 Ça serait bien de savoir qu'on va télécharger un fichier de 1.4Go de données… (Ressource Sirene : stock au <jour> <mois> <année>).
Je peux perdre beaucoup de temps à comprendre les données.
De manière générale les jeux de données sont très durs à lire.
💬 Le nettoyage de 3 ou 4 fichiers CSV et la lecture de la notice d'utilisation a pris ½ journée à nettoyer et à comprendre.
😤 On a découvert que le champ adresse postale était tronqué sur 20 caractères.
😤 D'autres fois ce même champ contenait des latitudes et longitudes.
💬 Certaines informations de compréhension sont présentes dans les discussions. Elles mériteraient d'être mises en valeur.
J'ai 2 comptes mais c'est rare quand je suis connecté : quand je publie des données ou participe à une discussion.
Je suis content de voir qu'on s'intéresse à l'aspect UX/UI de data.gouv.fr.
4