Le concept de datavisualisation

Publié le 18 août 2022 par Alexandre Meyer


La dataviz ou encore datavisualisation désigne tout simplement le fait de mettre en forme des données brutes. Nous y sommes confrontés tous les jours et dans tous les domaines.

Jouons à un petit jeu. Sauriez-vous me dire en 5 secondes quelle température fait-il à Paris selon les tableaux ci-dessous ?

BrestLyonBiarritzCherbourgToursClermont-FerrandPerpignanRennesNancyLimoges
5°C5°C10°C8°C5°C6°C13°C7°C5°C5°C
MarseilleNantesStrasbourgBordeauxAlençonNiceLilleDijonToulouseAjaccio
12°C4°C5°C7°C5°C17°C7°C6°C10°C14°C
Bourg-Saint-MauriceAuxerreBourgesBelfortReimsGapParisMontélimarVichyMontpellier
3°C4°C4°C3°C3°C8°C5°C9°C4°C11°C

CompliquĂ© n’est-ce pas ? Il n’est pas facile de tirer du sens, mĂȘme de tableaux de chiffres trĂšs simples ! 

📈 En quelque dĂ©cennies1, la quantitĂ© d’informations reçue par une personne a Ă©tĂ© multipliĂ©e par 5 ! Notre cerveau sature et prĂ©fĂšre les images. Comme dit l’expression, une image vaut mille mots ! C’est pour cela que la datavisualisation est omniprĂ©sente dans notre quotidien.

La dataviz permet de prĂ©senter et de rĂ©sumer des donnĂ©es de façon visuelle. Sans cette dĂ©marche, il nous serait compliquĂ© de nous retrouver parmi l’abondance de donnĂ©es sur un sujet. Son objectif n’est pas uniquement de faire joli. Le but est de transmettre une information claire et pertinente Ă  son lecteur.

Data Visualisations avec des donnĂ©es Ă  titre d’exemple : diagrammes linĂ©aire et circulaire

Les secteurs qui utilisent la dataviz sont nombreux : le journalisme, la communication, la science, la culture, l’environnement, la santĂ©, le management, la sĂ©curitĂ©, le commerce, l’Ă©nergie, l’urbanisme
 Et ce depuis bien plus longtemps que nous pouvons l’imaginer !

Rapide historique

Bien que le concept de datavisualisation soit pratiquĂ© depuis plusieurs siĂšcles, arrĂȘtons-nous sur le travail du pionnier français de la reprĂ©sentation visuelle au XIXe siĂšcle, Charles Joseph Minard. IngĂ©nieur civil, Minard conçut de nombreuses cartes pour analyser et mettre en lumiĂšre les avancĂ©es Ă©conomiques et sociales que le monde a connues. L’une de ses plus grandes reprĂ©sentations de donnĂ©es fut la carte figurative des pertes en hommes de l’armĂ©e française dans la campagne de Russie 1812-1813 de NapolĂ©on.

Charles Joseph Minard (1869), La Carte figurative des pertes successives en hommes de l’ArmĂ©e française dans la campagne de Russie en 1812-1813 – Cliquez sur l’image pour l’agrandir

La couleur claire indique le flux d’hommes entrant en Russie et celle foncĂ©e de ceux qui en sortent. La largeur des traits nous donne une indication sur le nombre d’hommes disponibles. Sur la carte figure Ă©galement les tempĂ©ratures des diffĂ©rentes villes traversĂ©es (on peut en dĂ©duire que la mĂ©tĂ©o n’a pas aidĂ© l’avancĂ©e des troupes
) Cette reprĂ©sentation visuelle Ă©tait trĂšs riche d’informations. Plusieurs donnĂ©es sont couplĂ©es pour offrir une information claire et structurĂ©e.

Le bon support pour transmettre un message structuré

Aujourd’hui, avec l’évolution des moyens technologiques, l’expression des donnĂ©es peut se rĂ©aliser de plusieurs façons.

Avec de la vidéo

Dessine-moi l’Ă©co (2019), Pourquoi le marchĂ© du livre est-il encadrĂ© ? [VidĂ©o]. YouTube, https://www.youtube.com/watch?v=OAaC4Jder4k
Data Gueule (2015), Adieu sommeil – #DATAGUEULE 41 [VidĂ©o]. YouTube, https://www.youtube.com/watch?v=dAMXH2_dcvs
Statistics feed (2021), Mobile Cellular Subscriptions Per 100 People
 [VidĂ©o]. YouTube, https://www.youtube.com/watch?v=tAidimXQ-Qg

En infographie

L’Ă©tiquette d’une boisson avec sa composition en infographie, https://creapills.com/emballages-ingredients-infographie-kombucha-20220405
Des infographies pour les réseaux sociaux, https://www.topito.com/top-infographies-reunions-powerpoint

Avec du code

Les mots de passe les plus utilisés en nuage de mots, https://informationisbeautiful.net/visualizations/top-500-passwords-visualized/
Le trajet d’un satellite retranscrit sur papier, https://quadrature.co/work/satelliten/
Un parapluie connecté avec Arduino, https://julienlevesque.net/little-umbrella
Du datajournalisme avec l’Ă©quipe des DĂ©codeurs du journal Le Monde, https://www.lemonde.fr/nanographix/

Je vous invite Ă  consulter cette superbe frise interactive qui retrace la datavisualisation Ă  travers le temps : https://history.infowetrust.com/

« Une datavisualisation résulte trÚs souvent du travail de plusieurs métiers »

Face à la multitude de données, une datavisualisation résulte trÚs souvent du travail de plusieurs métiers (graphiste, vidéaste, développeur, ergonome, statisticien, sociologue, géographe, mathématicien, économiste etc
). Le Data Scientist va récupérer les données et les analyser. Le Data Analyst va choisir les données pertinentes. Le Développeur/graphiste/vidéaste va à la fin les mettre en forme.

Cependant il ne faut pas oublier que notre message doit se transmettre sur un support adaptĂ© Ă  l’environnement de diffusion. Chaque vecteur a son objectif :

  • L’infographie est adaptĂ©e Ă  la communication d’informations (avec Photoshop, Illustrator
)
  • L’animation permet la scĂ©narisation d’évĂ©nements journalistiques (avec After Effects)
  • L‘interactif donne la possibilitĂ© Ă  l’utilisateur de consulter et d’interagir avec l’information (avec du code)

Tous ces vecteurs permettent de transmettre un message selon un objectif. Cependant pourquoi accordons-nous autant d’importance aux donnĂ©es ? Que peuvent-elles nous apporter ? Pourquoi crĂ©er ou lire une dataviz ?

À quels dĂ©fis rĂ©pond la datavisualisation ?

Face à une croissance exponentielle des données récoltées, nous devons pouvoir les organiser, les hiérarchiser et les comprendre. On les met en forme pour leur donner du sens et diminuer le temps dédié à leurs analyses.

« Un gain de temps pour les professionnels »

Les donnĂ©es sont des ressources trĂšs prĂ©cieuses pour les organisations2. C’est pour cela qu’elles se tournent de plus en plus vers les tableaux de bord (dashboard). Ceci permet de repĂ©rer les valeurs aberrantes et les tendances ainsi que de rĂ©vĂ©ler les corrĂ©lations au sein de donnĂ©es complexes. Mais que gagne-t-on ?

  • Une prise de dĂ©cision efficace face aux projets
  • Une aide aux dĂ©cisions managĂ©riales
  • Un gain de temps pour les professionnels
  • Une aide face aux manques de compĂ©tences analytiques
  • La comprĂ©hension en un coup d’Ɠil car tout est consolidĂ© et arrangĂ© en un seul Ă©cran

Le nombre important de donnĂ©es nĂ©cessite d’ĂȘtre visualisĂ© afin d’ĂȘtre traduit en information et en TBDM (Tableau de bord sur donnĂ©es massives). Cette multitude de donnĂ©es que nous avons besoin de mettre en forme pour en tirer du sens est sans cesse en expansion. Mais comment ces donnĂ©es sont rĂ©coltĂ©es ? D’oĂč proviennent-elles ?

OĂč et comment sont procurĂ©es les donnĂ©es ?

Les mégadonnées (Big Data)

Le big data dĂ©signe le fait de rĂ©colter massivement des donnĂ©es provenant d’internet. Ces donnĂ©es proviennent des rĂ©seaux sociaux (like, partage, commentaire, heure de connexion, temps de sessions, publicitĂ©s cliquĂ©es), de nos mails, de nos historiques de recherches Google, de nos achats ou encore de capteurs de tempĂ©rature dans la ville etc
 

Le big data peut ĂȘtre utilisĂ© pour de nombreux usages : le ciblage marketing/publicitaire, l’analyse des comportements des utilisateurs mais aussi la dĂ©tection des pannes dans un rĂ©seau, l’amĂ©lioration de l’expĂ©rience etc
 On rĂ©alise donc des dashboard pour dĂ©chiffrer de grosses masses de donnĂ©es.

💡  En dĂ©couvrir plus : Les villes connectĂ©s, entre gestion intelligente et automatisation des processus

⚠ Bien qu’on parle de cloud, le rĂ©seau n’est pas immatĂ©riel. Selon l’Ademe, un e-mail avec une piĂšce jointe de 1 Mo envoyĂ© Ă©quivaut Ă  une ampoule de 60 W allumĂ©e pendant 25 minutes ! La pollution numĂ©rique est un problĂšme qu’il faut prendre en compte.

💡  En dĂ©couvrir plus : La relation entre les donnĂ©es : concept de Data Linked par Tim Berners-Lee et Page Rank

⚠ On fait face Ă  d’énormes volumes de donnĂ©es rĂ©coltĂ©es qui peuvent ĂȘtre structurĂ©es ou non (dizaines de pĂ©taoctets). La gestion du grand flux de donnĂ©es fait partie des grands challenges auxquels la R&D doit rĂ©pondre car les solutions classiques de stockage ne peuvent pas gĂ©rer autant de donnĂ©es.

Le principe de données ouvertes (Open Data)

L’open data est LA source de donnĂ©es pour le dataviz. Elles sont distribuĂ©es par des collectivitĂ©s ou des États. Le principe est simple : rendre disponible, rĂ©utilisable et participatif des donnĂ©es publiques ayant un intĂ©rĂȘt gĂ©nĂ©ral. L’open data garantit le libre accĂšs des donnĂ©es, sans aucune restriction (mĂȘme commerciale). Ceci permet d’encourager les reprĂ©sentations innovantes et la crĂ©ation de connaissances de la part de tous.

La notion d’open data a dĂ©jĂ  Ă©tĂ© introduite par le pĂšre du web, Tim Berners-Lee. L’open permet aussi les projets participatifs comme OpenStreetMap.

L’Etat français ainsi que la Ville de Paris, la rĂ©gion Ile-de-France, la SNCF et la RATP proposent leur plateforme d’open data.

⛓ L’open data est trĂšs souvent accompagnĂ©e d’une API. L’Interface de Programmation Applicative (en français) offre la possibilitĂ© Ă  des programmes de communiquer entre eux sur un rĂ©seau. TrĂšs utilisĂ©e dans le web, l’API permet de rĂ©cupĂ©rer et d’envoyer des donnĂ©es entre un client et un serveur via le protocole HTTP. Les donnĂ©es renvoyĂ©es par le serveur sont utilisĂ©es par le dĂ©veloppeur pour les afficher en dataviz interactive. La plateforme IFTTT permet de jouer avec des API en no-code.

Par exemple, Google utilise plusieurs bases de données (cf. API) pour récupérer les informations nécessaires pour ses dataviz

La dataviz a Ă©tĂ© dĂ©mocratisĂ©e grĂące Ă  l’opendata et au freemium des logiciels tels que Microsoft PowerBI et Tableau Server. Avant, la visualisation de donnĂ©es Ă©tait rĂ©servĂ©e aux experts et aux scientifiques.

Une dataviz ne repose pas seulement sur des donnĂ©es brutes mises en forme. Pour qu’elle soit comprise, sa rĂ©alisation exige l’utilisation de plusieurs outils du design et sĂ©miologique pour mesurer, associer, sĂ©lectionner, ordonner, quantifier et dĂ©coder un message visuel.

L’apparence visuelle des donnĂ©es doit amoindrir l’effort cognitif du lecteur (gain d’énergie et de temps) afin qu’il puisse se concentrer uniquement sur l’analyse des donnĂ©es. Le choix des couleurs, des formes, des mots et du storytelling sont Ă  rĂ©aliser en fonction du contexte et des donnĂ©es de la datavisualisation. Mais nous parlerons de la boĂźte Ă  outils et des thĂ©ories de la perception visuelle dans un prochain article 🙂 N’hĂ©sitez pas Ă  me suivre sur twitter pour ĂȘtre au courant des prochaines publications !

1HILBERT Martin, How much information is there in the “information society”?, Significance, 2012

2ANDRY Tiffany, Une approche sĂ©miotique de la conception d’outils d’analyse de donnĂ©es massives, Presses Universitaires de Bordeaux, 2018

Bibliographie complémentaire

Livres et revues

  • RENDGEN Sandra, GROOTENS Joost, Le SystĂšme Minard, B42, 2020
  • BERTIN Jacques, SĂ©miologie graphique : les diagrammes, les rĂ©seaux, les cartes, Mouton, 1967
  • BONACCORSI Julia, «Chapitre 6. Approches sĂ©miologiques du web» dans Barats Christine, Armand Collin, 2013
  • COTTON Anne-Marie, «European Communication Monitor 2016 : 10 ans de recherche pan-europĂ©enne sur la communication stratĂ©gique», Revue Communication & professionnalisation, 2017
  • FEW Stephen, Information Dashboard Design: The Effective Visual Communication Of Data, O’Reilly Media, 2006
  • LLOVERIA Vivien, «Data design-moi un mouton», Communication & Organisation, 2006
  • KIRK Andy, Data visualisation: a handbook for data driven design, Sage Publications, 2016

Vidéos

Sites

Cet article est un extrait revisitĂ© de mon cours “Introduction au concept de datavisualisation”. CC BY-NC-SA 4.0





Commentaires

Pas encore de commentaires... Soyez le premier Ă  commenter !


Donnez votre avis sur cet article