…

Signet

Ulrich Atz

L’interprétation par la mise en image des données

Il existe une quantité astronomique de données dans le monde, et le but de tout chercheur, analyste ou directeur devrait être de les rendre accessibles et utiles. Par quels moyens les données peuvent-elles être digérées puis traduites en savoir ? L’un d’eux est la mise en images des données.

Le public comme les décisionnaires ne veulent pas des données. Ce qu’ils veulent, ce sont des visions, des explications dérivées de ces données (n’en doutez pas) puis intégrées en savoir. Trois raisons expliquent principalement la popularité de la mise en images des données. Premièrement, elle constitue un outil de communication efficace d’idées ou relations complexes aux pairs, mais également aux décisionnaires et au public dans son ensemble. Deuxièmement, elle permet de représenter et d’explorer un ensemble de données. Troisièmement, c’est un outil très utile pour expliquer les données et raconter des histoires.

Les mises en images sont par exemple plus efficaces que la lecture d’un tableau rempli de données. Une image vaut mille mots, comme l’affirme le dicton. L’établissement de tableaux et graphiques est idéal pour la plupart des gens, pour autant que l’auteur sache ce qu’il fait. Ils sont visuellement instinctifs et suscitent une réaction presque immédiate. Vous pouvez voir ci-dessous combien les tendances ou anomalies sont plus évidentes par rapport à un tableau, dans un simple exemple de mise en images appelée lignes de tendances, un petit tableau de type Excel (voir la figure 1).

Sparklines in Excel

Sparklines in Excel 2010 or later are graphs that fit in one cell and give you information about the data.

Différencier l’information utile et inutile

Les mises en images peuvent aussi être utilisées pour explorer un ensemble de données. Le sens général, les perspectives et les irrégularités d’un ensemble de données sont rarement immédiatement disponibles. C’est pourquoi des tableaux et graphiques sont créés : comprendre les données et ce qu’elles ont à nous dire. Ce procédé sert également à éveiller l’intérêt du lecteur.

Un exemple d’utilisation de cette méthode est le Baromètre des données ouvertes (http://opendatabarometer.org), classement de l’utilisation des données ouvertes dans le monde (voir la figure 2). En complément d’un rapport et d’une synthèse, vous pouvez explorer les données de manière visuelle, par exemple en consultant l’indicateur de propriété des terres. Le site publie également une méthodologie détaillée indispensable pour établir la confiance, assurer de la transparence et inciter les personnes à utiliser ce travail comme repère dans les discussions politiques (« Voyez comme nous nous en sortons mal dans ce classement »), afin d’améliorer l’ouverture de l’accès aux données.

Open Data Barometer

Open Data Barometer

Enfin, la mise en images nous permet de raconter une histoire, et donc d’expliquer ou d’appuyer un argument. Cette utilité est la plus difficile à mettre en œuvre, car elle nécessite des compétences relevant de plusieurs disciplines. Le meilleur moyen d’y parvenir est de créer une équipe pluridisciplinaire, par exemple une collaboration étroite entre un statisticien, un développeur et un expert en communication.

Gro Intelligence, start-up informatique basée à New York et à Nairobi, démontre l’efficacité de cette approche au moyen de données liées à l’agriculture et à la production alimentaire. Par exemple, la carte montrée sur la figure 2 associée à une fonction de série chronologique peut constituer une mise en images simple mais efficace pour montrer des changements au fil du temps. Dans ce cas, la mise en images montre l’impact de la production de céréales en Tanzanie, après la sécheresse de 2016.

Figure 2: Production de céréales en Tanzanie après la sécheresse de 2016

Source : Gro Intelligence, diapositive provenant du Sommet GODAN de 2016

De la même manière, les tableaux de bord comme celui de Gro Intelligence conçu pour le marché américain des céréales sont utiles pour l’obtention d’une vue d’ensemble des données les plus importantes dans différentes mises en images qui seraient sinon de complexes ensembles d’indicateurs. Un tableau de bord bien pensé permet donc à un utilisateur de comprendre l’information et de l’utiliser pour prendre des décisions ou expliquer une vision à d’autres personnes. Dans ces deux exemples, la clé est la différentiation de l’information utile et inutile, ainsi que la fine compréhension de ce qui doit être expliqué plus en détail. Un tableau de bord, un graphique ou une mise en images exemplaire rencontre son lecteur au bon endroit et le guide.

Devenir expert en mise en images de données

Un bon point de départ est d’apprendre auprès d’experts : consultez des exemples dans les journaux, les blogs populaires comme http://flowingdata.com/ et lisez des ouvrages phares comme la série d’Edward Tufte. Vous y découvrirez le rapport données/encre, qui rappelle de rester minimaliste en utilisant l’encre principalement pour les données, et non pour les lignes et encadrés entourant le tableau. Le reste est une question de pratique, d’ouverture d’esprit et d’échange d’idées avec les pairs. Par exemple, il est toujours bon de faire tester un graphique ou tableau de données par un pair, afin de s’assurer que ceux à qui il est destiné pourront l’interpréter correctement, et que les formes et couleurs ne sont pas trop perturbantes ou culturellement difficiles à lire.

Pour beaucoup, la solution est une feuille de calcul de type Microsoft Excel. Cela ne signifie pas que vous êtes contraints d’utiliser les graphiques par défaut ; vous pourrez trouver de beaux modèles de tableaux populaires sur ce site web http://labs.juiceanalytics.com/chartchooser. Pour certaines tâches, une simple feuille de calcul est parfaite, mais comporte l’inconvénient d’être source d’erreurs et difficile à reproduire.

Un logiciel commercial comme Tableau est convivial et offre souvent différents moyens de personnalisation en fonction de vos usages. Son prix est toutefois élevé, et il y a un risque de vous retrouver dans une « prison dorée », un système truffé de fonctionnalités mais sans aucune liberté d’en sortir.

Les logiciels libres comme le langage statistique R (https://www.r-project.org), ou les langages de programmation comme D3 (https://d3js.org), offrent flexibilité, puissantes fonctionnalités et assistance technique irréprochable offerte par une communauté d’utilisateurs enthousiastes. Leur courbe d’apprentissage est cependant longue et ils peuvent être frustrants, car de simples tâches demandent beaucoup de temps au départ.

 

Si vous avez un blog ou créez du contenu pour un site web, essayez Datawrapper. Cet outil de pointe permet de créer des graphiques simples avec une touche d’interactivité et produit des résultats qui constituent des pratiques d’excellence. Les tableaux les plus simples sont bien souvent plus que suffisants (voir la figure 3). En bonus, le logiciel est libre d’utilisation, ce qui permet un usage moins restreint.

Figure 3 : Logiciel libre de mise en images de Datawrapper

Source: http://datawrapper.de/

En résumé, la mise en images des données existe depuis longtemps, est utilisée pour les statistiques sportives comme pour les rapports de retraites, et connaît une rapide progression des logiciels disponibles et accessibles. Edward Tufte disait qu’il fallait montrer les données avant tout, ce à quoi j’ajouterais : « et indiquez clairement leur utilité ». Très peu de personnes sont de grands compositeurs, mais la plupart des gens aiment la musique. Il en va de même pour la mise en images des données. L’utilisation de graphiques et tableaux est la première étape vers la démocratisation de l’information tirée des données. Les grands défis comme la faim dans le monde ne pourront être résolus que si nous nous débarrassons de nos préjugés, donnons du pouvoir aux gens et transposons nos visions en actions.

Datawrapper

Datawrapper is an open source tool helping everyone to create simple, correct and embeddable charts in minutes.

Articles dans le même numéro