…

Faciliter le partage des données météorologiques ouvertes

Leigh Dodds

Il y a lieu d’utiliser des normes de données pour s’assurer que ces données soient facilement accessibles, utilisées et partagées. Si vous travaillez pour l’instant sur un projet de données, vous devriez prendre le temps d’examiner le type de normes que vous pourriez utiliser pour mener à bien votre projet.

Des données comme les statistiques, les cartes et les relevés de capteur en temps réel peuvent aider à la prise de décision et faciliter le développement de services et l’analyse. Une solide infrastructure de données est essentielle pour promouvoir l’innovation d’entreprise, contribuer à l’amélioration des services publics et créer des communautés durables et saines. L’importance des infrastructures de données locales, nationales et internationales est même en passe de devenir encore plus grande dans le contexte de la croissance démographique et au sein de sociétés et d’économies qui dépendent de plus en plus de l’exploitation des données.

Ces infrastructures se composent de bases de données, de l’organisation qui en assure la gestion et la mise à jour et des processus et des principes directeurs qui décrivent comment organiser, utiliser et gérer lesdites données.

La publication durable de données de haute qualité dans des formats standard constitue un élément essentiel d’une infrastructure solide de données. La valeur des données est liée à l’utilisation qui en est faite. Il est donc important de réduire les obstacles à l’accès, à l’utilisation et au partage des données. Une récente enquête a montré que les chercheurs spécialisés dans les données passent l’essentiel de leur temps à nettoyer et à organiser les données.

Les licences ouvertes autorisent toute personne à avoir accès à des données, et à les utiliser et les partager. Mais pour que les personnes et les machines puissent créer facilement de la valeur ajoutée grâce aux données, les données publiées doivent utiliser un langage, des identifiants et des formats communs et cohérents.

Quelles sont les normes ouvertes dans le domaine des données ?

Les normes de données sont des conventions documentées et utiles qui aident les organisations à publier et à échanger des données de manière toujours cohérente. Il existe différents types de normes dans ce domaine, qui reflètent les divers types de conventions nécessaires pour garantir une représentation cohérente des données. 

Ainsi, nous pouvons uniformiser les termes et les concepts que nous utilisons pour décrire les choses sous la forme d’une série de données. L’utilisation d’un langage cohérent permet de confirmer et de garantir que ces séries de données mesurent et décrivent bien les mêmes choses. De la même façon, nous pouvons uniformiser la façon dont les différentes données sont mesurées et dont elles peuvent être organisées pour être lisibles par les machines.

Prenons l’exemple des relevés de température d’une station météorologique. Beaucoup d’éléments de cette série de données peuvent en effet être standardisés. Le mode et le type de relevé des températures (par ex. la fréquence des observations), les unités de température (par ex. degrés Celsius ou Fahrenheit) et le format d’enregistrement des dates et des heures de chaque mesure sont des données de base à standardiser. Mais les normes peuvent aussi définir le mode d’organisation des relevés de température et des jours/heures dans les fichiers de données, par exemple les feuilles de calcul. Ou comment des formats spécifiques (par ex. CSV, XLS, ou JSON) sont utilisés pour l’échange de données lisibles par les machines. Les métadonnées utilisées pour décrire une série de données, notamment l’identifiant d’une station météorologique et des informations sur l’éditeur des données, peuvent également faire l’objet de normes.

Ces normes peuvent être développées à différents moments et par des communautés différentes. Le développement de normes est un processus collaboratif auquel participe une communauté internationale. Les normes ouvertes sont celles qui ont été créées dans le respect des principes « OpenStand », à savoir l’utilisation de processus ouverts et la publication des données selon des conditions permettant de les utiliser librement et à n’importe quelle fin.

En s’appuyant sur le travail d’autres communautés, il est plus facile de créer de nouvelles normes qui contribuent à faire en sorte que les données soient publiées de façon à permettre la création de nouvelles applications et de nouveaux services.

Comment les normes créent-elles un impact ?

La création et l’utilisation de normes ouvertes a pour bénéfice le plus direct de garantir que les données soient facilement accessibles et utilisables. La publication de données dans des formats standard réduit les coûts liés au traitement de nouvelles données, car l’analyse et le code existants peuvent être appliqués aux nouvelles séries de données.

Les normes peuvent également encourager la création de nouveaux outils qui visent à aider les personnes qui publient et utilisent les séries de données à respecter la norme qui a été choisie. Mais ces aspects techniques ne sont que les avantages les plus évidents de l’utilisation d’une norme.

Les normes peuvent en effet contribuer à la création d’écosystèmes et stimuler l’innovation. La disponibilité d’ensembles de données organisées de manière cohérente peut aider les start-ups à créer de nouveaux outils et services qui, à leur tour, aideront d’autres organisations à créer de la valeur grâce à ces données. L’adoption du format standardisé GTFS (spécification générale pour les flux relatifs aux transports en commun) par des autorités des transports du monde entier a ainsi permis la création de toute une gamme de nouveaux services qui aident des millions d’habitants à travers le monde à profiter au mieux des transports publics. Transport for London a ainsi indiqué que le fait d’avoir publié des données ouvertes dans ce format standardisé pourrait rapporter jusqu’à 130 millions de livres sterlings par an à la communauté locale. 

Les normes peuvent aussi contribuer à l’adoption de politiques ou de textes législatifs et aider ainsi à changer les marchés et à améliorer la fourniture de services publics. L’autorité britannique de surveillance de la concurrence a ainsi imposé la norme bancaire ouverte afin de promouvoir la compétitivité et l’innovation au sein du secteur bancaire.

Les normes peuvent également être utilisées pour induire le changement social en encourageant les gouvernements et les entreprises du secteur privé à publier des données de manière cohérente afin de promouvoir la transparence. L’initiative internationale pour la transparence de l’aide, EITI et Open Contracting Partnership utilisent chacun des normes comme outils majeur du changement.

Développement et adoption de normes : les défis

Créer de normes de qualité est toutefois un processus difficile. Il existe en effet souvent de très nombreuses normes « en compétition » pour la publication d’une série de données. Mais ces normes sont rarement adoptées et les utilisateurs ne savent pas clairement quelle pourrait être la norme la plus appropriée. 

À l’Open Data Institute (ODI), nous avons étudié les facteurs qui font obstacle à la création et à l’adoption de normes de données et examiné certaines approches en vue de les surmonter. Nous avons mené des études sur les utilisateurs et des recherches documentaires et avons coopéré avec d’autres organisations travaillant dans ce domaine pour tenter de mieux comprendre les obstacles en matière de développement de normes.

Dans le cadre du projet GODAN Action, l’ODI s’efforce également de comprendre l’éventail de normes utilisées dans le secteur agricole, par ex. pour le partage de données météorologiques. L’objectif est d’identifier une série d’interventions utiles qui peuvent encourager l’adoption de normes dans ce secteur.

Le projet a d’ores et déjà identifié plusieurs besoins. Tout d’abord, les développeurs doivent avoir à leur disposition de meilleurs outils pour mieux identifier les normes pertinentes. La carte des normes de données agroalimentaires, lancée récemment, facilitera cette identification dans le secteur de l’agriculture. Le répertoire des normes de données ouvertes a quant à lui une portée plus générale. Deuxièmement, le projet GODAN a insisté sur la nécessité d’améliorer l’offre de conseils sur le processus d’élaboration de normes afin d’aider les organisations à collaborer pour mettre au point des normes conçues avec soin. Enfin, les développeurs de normes doivent poursuivre leur réflexion sur l’adoption de leurs normes et sur les types d’outils, de documents et d’engagement nécessaires pour assurer le succès de leur norme.

Des avantages peuvent également être attendus de la création de réseaux de pairs plus efficaces entre d’une part les organisations associées au développement de normes et d’autre part, les personnes qui développent des normes et les organisations et communautés susceptibles d’en retirer des avantages.

L’ODI coopérera avec des partenaires dans le cadre du projet GODAN Action afin de mettre en œuvre des solutions pour résoudre certains de ces obstacles, tout en travaillant à la publication d’un nouveau guide pour soutenir le développement de nouvelles normes. 

Articles dans le même numéro