Tag Results
4 posts tagged données publiques
4 posts tagged données publiques

J’ai déjà eu l’occasion de revenir à plusieurs reprises sur l’importance des données, et conséquemment sur la nécessité de disposer d’un important pool de données publiques.
Je souhaite donc pointer ici cet article du O’Reilly Radar intitulé What is Data Science? parce qu’il traite du même sujet, mais en précisant pourquoi les données sont importantes : elles sont le socle des industries et de la recherche numériques de demain.
La data science et le data business seront d’importantes clés de croissance pour les années à venir.
Je vous laisse lire l’article, mais je tenais à en présenter quelques points essentiels :

… pendant que les institutions publiques françaises et européennes privatisent les leurs.
L’idée semble paradoxale mais c’est un peu qui pouvait ressortir du séminaire organisé il y a quelques temps par le GFII sur le sujet : l’ouverture des informations publiques, un enjeu pour le développement de l’économie numérique.
Depuis l’émergence du web, les entreprises s’évertuent à rendre leurs données de plus en plus disponibles. En mettant en place des API permettant d’accéder à leurs serveurs, elles donnent la possibilité à des tiers de s’y connecter et de développer leurs propres services innovants.
Les avantages sont évidents dans un univers où l’innovation réside souvent dans le design, l’ergonomie, la proximité avec l’usager. Plus besoin de démontrer la viabilité d’un modèle économique en amont. Chaque partenaire se contente de se connecter à l’API et prend son propre risque. Plus besoin de négocier des conditions ad hoc à chaque nouveau partenariat. Les possibilités d’utilisation sont directement implémentées dans l’API. Cette tendance d’ouverture devient chaque jour un peu plus évidente : facebook et facebook connect, twitter et twitter login, withings et leur pèse-personne connecté, etc. Aujourd’hui plus personne ne vous oblige à créer un compte sur chaque site internet où vous surfez, en cliquant sur un seul bouton, ce site se connecte à l’API de facebook et importe immédiatement votre nom, votre photo, votre date de naissance, etc. Tout est simplifié et facilité.
Mais cette volonté des entreprises du web d’ouvrir sans cesse leur données ne vient pas de n’importe où. Elle est le fruit d’une culture de partage instituée depuis longtemps, elle correspond à un système institué en modèle par l’état US lui-même.
Il suffit de lire les premières lignes du compte-rendu de l’anniversaire de data.gov : One year ago, data.gov was born with 47 datasets of government information that was previously unavailable to the public. The thinking behind this was that this data belonged to the American people, and you should not only know this information, but also have the ability to use it. By tapping the collective knowledge of the American people, we could leverage this government asset to deliver more for millions of people.
Autrement dit, la vision américaine consiste à dire que la valeur n’est pas dans les données. Seuls comptent l’innovation et les services.
Et l’état US montrant l’exemple en mettant gratuitement les données à disposition, les entreprises américaines ont pris l’habitude de ne pas compter sur l’exclusivité de leurs données pour conquérir le public.
Le résultat ? Today, there are more than 250,000 datasets, hundreds of applications created by third parties, and a global movement to democratize data. To date, the site has received 97.6 million hits. From these datasets, citizens have developed hundreds of applications that help parents keep their children safe, let travelers find the fastest route to their destinations, and inform home buyers about the safety of their new neighborhood.
Et sans même mentionner une vraie culture de l’ouverture et la capacité à générer des écosystèmes “a la google”.
What’s next pour la France et l’Europe ?
PS : l’illustration au début de l’article est issue du catalogue du musée McCord, mise à disposition sur Flickr Commons avec le catalogue de la librairie du congrès, du brooklyn museum, de la bibliothèque nationale de nouvelle zélande, etc. Sans aucune restriction de copyright.
Là encore… quel dynamisme et quel contraste.
Sans même parler de données publiques, les statistiques publiques ne sont pas vraiment centralisées en France : l’Institut national de la statistique et des études économiques (Insee) établit des statistiques générales sur la population et les entreprises ; les services statistiques ministériels (SSM), ainsi que d’autres organismes publics, selon leur champ de compétence, produisent des statistiques sectorielles.
De son coté, l’INSEE produit les des statistiques générales sur la population et les entreprises ; idem pour d’autres organismes publics qui produisent leurs propres données.
Chacun de ces services publie et met en ligne les statistiques qu’il produit. On ne peut pas vraiment dire que les données sont diffusées dans l’incohérence, mais ce système de production fait qu’il est très difficile de réussir à travailler de façon transversale.
Créé à la demande du Conseil national de l’Information statistique (Cnis), le portail de la statistique publique est une initiative qui devrait permettre au public d’accéder plus facilement à l’ensemble des informations statistiques produites par les institutions publiques.
Le portail est accessible ici : http://www.statistique-publique.fr/
Tout est organisé par domaine, puis par type de données. Le système semble à la fois clair et simple. Il est d’ailleurs intéressant de constater que le portail vise large puisqu’il renvoie aussi bien vers des tableaux de données que vers des études ou des rapports.
En revanche, rien n’est fait pour harmoniser les régimes de réutilisation de ces statistiques.
Ainsi que le précisent les mentions légales du site, “le portail de la statistique publique ne détient aucun droit de propriété intellectuelle des éléments accessibles à travers son site. Pour toute reproduction, totale ou partielle ou imitation, des écrans de navigation, logos, images et photos, se reporter au copyright du site d’origine de ces informations.”
C’est donc un premier pas.
Le problème de la disponibilité et du prix des données publiques devient récurrent. Nous avions eu l’occasion de travailler sur ce sujet l’année dernière dans le cadre d’une étude avec le pôle de compétitivité Advancity, et Henri Verdier, le président de Cap Digital, l’avait rappelé à la commissions Grand Emprunt lors de son intervention il y a quelques mois.
Dans la situation actuelle, les startups et les chercheurs français ne disposent tout simplement pas des mêmes chances au démarrage que leurs équivalents américaines. Alors que les sociétés californiennes peuvent librement utiliser tout un ensemble de données publiques, celles-ci restent inaccessibles de ce coté de l’Atlantique. Pendant que les français s’épuiseront à essayer d’obtenir les informations et les autorisations nécessaires, les américains seront en train de tester leurs applications, commencer à dénicher des utilisateurs, améliorer leur ergonomie et leurs API, bref, prendre quelques brassées d’avance qu’il sera quasiment impossible de rattraper. Dans un marché international comme celui du web ou des applications iPhone, cela ne pardonne pas !
Dans ce cadre, l’initiative OS OpenData lancée en avril par l’Ordnance Survey britannique est exemplaire.
En effet, l’équivalent britannique de l’IGN, met la très grande majorité de ses bases de données :
- en téléchargement libre sur son site internet,
- avec une licence de type « Creative Commons ».
Double conséquence, les entreprises et les chercheurs britatnniques peuvent désormais télécharger ces données, les étudier, et les réutiliser pour démarrer.
Et les britanniques n’ont pas fait les choses à moitié.
Les données disponibles et réutilisables, y compris pour une utilisation commerciale, concernent :
- toutes les cartes en mode « raster » ou vectoriel du 1/10 000ème. au 1 250 000 ème
- les données relatives au parcellaire,
- le référentiel adresses,
- les limites administratives,
- le microzonage du territoire (permettant un analyse cartographique de données géolocalisées) .
Ces données sont extrêmement importantes en termes de marché et de développement économique. L’information géographique, qui permet de traiter toute donnée géolocalisée, est l’un des types de données publiques les plus sollicités car elle sert de base à de nombreux applications et services. Elle est le terreau indispensable au développement de beaucoup d’entreprises, et d’autant plus à partir du moment où tout devient interconnecté.
Cela ne signifie d’ailleurs pas que les données soient obligatoirement gratuites. Au-delà d’un certain nombre d’utilisations des cartes ou des APIs, le service n’est plus garanti et il devient possible (mais pas obligatoire) de passer à une offre payante OS OpenData Pro.
En 2009, l’Ordnance Survey a d’ailleurs réalisé 117 millions de livres de revenus (131,4 M€) et a reversé à l’Etat 5 millions de livres (5,6 M€) de « dividendes ».
L’initiative a d’ailleurs été annoncée directement par le premier ministre et le secrétaire d’Etat aux collectivités locales qui espèrent clairement faciliter le développement de la filière numérique dans leur pays : « cette initiative montre que le Royaume Uni est aux avant-postes de la révolution numérique. Rendre les données publiques libres d’accès encouragera des initiatives et des idées nouvelles : plus de gens réutiliseront ces données aux travers de modalités créatives qui n’avaient pas été imaginées au départ. Un flux continu d’applications et de sites Web nouveaux démontre le potentiel des logiques combinant données, visions nouvelles et technologies du numérique. L’accès accru aux données de l’Ordnance Survey attirera une nouvelle génération d’entrepreneurs qui proposeront de nouvelles solutions (…). Ceci stimulera le développement d’un secteur économique nouveau, créant des emplois et stimulant à terme la croissance. Cette initiative est le signe d’un changement culturel plus large au sein des administrations, qui veut que toute donnée publique soit par nature dans le domaine public, et que toute exception à ce principe doit être motivé et rester l’exception».
Pour plus d’informations, vous pouvez par exemple aller voir sur le site du guardian qui a beaucoup milité pour voir cette initiative s’organiser : ici