Données souvent insuffisantes pour l’analyse car nombreux facteurs qui peuvent déterminer des connexions sans qu’elles soient documentées pour autant dans le matériel subsistant. Exemple voisins, le sait seulement car partent en vacances et
Shortest path obscur car ne sais pas comment fonctionne. Besoin d’étude plus complète sur la survie des documents de manière à pouvoir rééchantiller nos données pour l’analyse.
Diestel 2010, Infinite graph
Brandes 2012, étude sur la notion de centralité, plusieurs critères : degree eigenvector closeness betweenness. Étude de la centralité. D’autres mesures de centralité possible. La plupart de celles employées conçues dans les années 70, puis expérimentées ces dernières années dans les dernières années.
Rochat 2015 (DH2015) identification du problème et besoin de partager sur ce problèmes.
Air balls, gens qui se plaignent des boules de poils. Certains ici des algorithmes, deux autres de vraies boules de poils ! Ce n’est pas parceque l’on a des données que l’on a besoin de les visualiser.
Algorithmes derrières ces visualisation car important de comprendre comment on fait cela et d’où cela vient. Quand on a un réseau, on a ce réseau et ces sommets. Les considérant comme des chaînes, va essayer des les distribuer dans l’espace. Algorithme qui va distribuer de manière aléatoire les sommets et itérer sur les données pour produire une visualisation. Mais si le réseau est dense avec beaucoup de sommets ou neuds superposés risque d’avoir des choses où impossible de voir les choses, et de même si commence à étiqueter les choses.
Plusieurs choses proposées : si le réseau devient messy, ne l’imprimez pas. Vous devez alors explorer une présentation numérique pour visualiser les choses.
Les misérables co-occurences. Plusieurs manières de visualiser les choses. Simple map. Interactivité cf. présentation Visualing the dynamics of character network DH2016.
Laisser vos lecteurs ou les collègues questionner les résultats et explorer le réseau.
Il existe des méthodes qui simplifient les choses. Lorsqu’il y a des clusters, il existe des algorithmes qui permettent e simplifier les données.
Partagez vos données, si vous souhaitez que vos résultats soient utiles, et qu’ils puissent être discutés, partagez vos données. Ce que je fais avec Github. https://github.com/yrochat
Gif heavy our storytelling
Création chose interactive, mais peut s’apercevoir que pas posé certaines question. Pourquoi avez-vous besoins d’une visualisation interactive ? Que signifie pouvoir déplacer les sommets ? Quels sens la visualisation interactive peut apporter.
From shiny to substantive but how ? Jamais été si simple, mais data-analysis toujours un challenge. DH peuvent créer un futur pour les visualisations de réseaux, et même leur sustainability et comment aller là.
Imitation des bons. Trouver les DHer qui font déjà du beau travail.
historicalnetworkresearch.org
Ne pas réinventer la roue. Transparence et open access. Mais ne suffit pas.
Andras Buja, Dianne Cook et Deborah Swayne "interactive high-dimensional data visualization" journal of computational and graphical statistics vol 5 n1 mar 1996.
Une taxonomie sur les visualisation interactives.
Finding Gestalts = voir transfo
Poster requêtes = data transformation
Making comparaisons = view mapping
Beaucoup de posts et guides mais le plus souvent basés sur STEM research questions… est-ce la bonne approche pour les DH.
Shiny is not a bug but a feature. Beaucoup de choses que peut améliorer. Passer des tutoriaux sur la manière dont les créée aux processus de recherche qui pemettent de les créer.
Qu’est-ce que les DHer veulent ? Je rêve de réseau.
- interactive réseaux visualisations pour manipuler les modèles statistiques (not just output but also input) cf. exemples neural network, processus dans les deux directions
- interactive network visualization with uncertainty in data (nous aider à voir incomplétude et bruit dans les données)
- interactive network visualization pour communiquer avec votre audience, itération à travers retours utilisateurs
- interactive visualisations with sustainability, construits pour durer, plus que deux ans !
Pas des rêves impossibles. Pourquoi pas encore le cas ?
@Zoe_LeBlanc
Concept d’analyse en lui même. Ne compare plus les algorithmes entre eux. We go Gaussian, or we go home !
Pense que le futur de l’analyse de réseau est dans la dimensionnait. Diagramme 2 dimension centré sur deux thèmes dans une chronologie. La troisième dimension pas une dimension spatiale.
Apparition de la proéminence au fur à mesure que les documents apparaissent. Guerre du vietnam, plus de documents top secret. Puis devient plutôt diplomatiques. Animation d’un réseau dans le temps obtient concept de séquence, etc. De manière fixe ne percevrait pas ces enjeux.
Montrer pourquoi 3D nécessaire ? Imaginez réseaux ou ensemble connectés, commencer à connecter voisins, alors augmentent en proximité. Fausse 3D ne règle pas le pb. Mais si rotation avec parallaxe, devient différent. En utilisant seulement la 3D obtient un sens différent des choses. Pense que quelque chose d’important. Sans doute pas mesurable avec une règle, mais mesurable en terme de reconnaissance de motifs dans votre esprit.
En manipulant le visuel en direct pendant l’animation alors obtient une animation en 5D. Arrive à un medium formed analysis. Commence à articuler ces arguments. Johanna Drucker Bethany Nowinsky ont parler sur la manière de dessiner des arguments.
Dans un réseau complexe, en alternant étiquette, peut avoir perception des personnes et des lieux et de leurs relations entre elles. Ici visualisation dans Gephi, outils pour l’analyse de réseau mais pas pour consommer le résultat.
A donc travailler sur outils pour transformer ces réseaux Gephi en réseaux visualisantes avec JS pour leur publication.
gephi.js ?
étape suivante Google Card VR !
Topic model timeline, en faire vision 3D
expliquant que nombreuses choses existent déjà. Mais pas allés beaucoup du côté des mathématiques.
Pourquoi restent bloqués à des mesures de centralité, etc. sans doute car nb entre nous collés dans Gephi et pousse bouton. Les gens qui travaillent sur les réseaux, cherchent quant à eux des nouveaux algorithmes. Doit devenir meilleurs dans la formation à la manière dont ces algorithmes fonctionnent et comment peuvent les réimplémenter. Par exemple montré que centralité pas pertinent pour données historiques, mais pourrait faire autrement en le recomposant.