Jeudi passé, il y avait une réunion de Montréal Ouvert, pour promouvoir la publication ouverte des données municipales. Évidemment une excellente idée. Beaucoup d’excellentes contributions visant comment pousser ça sur le plan politique. Pour gagner de la traction, il faut des applications, et pour les applications il faut des données… Un peu l’oeuf et la poule. J’ai proposé de faire un concours basé sur des maquettes d’applications, pour démarrer l’engin.

Deux points qui ont attiré mon attention:

Beaucoup de gens se plaignent que  des données publiques, une fois données à des compagnies, deviennent inaccessibles. Les données que la STM donne à Google sont un bon exemple. On peut reprocher à Google de ne pas offrir d’API vers ces données; encore qu’il soit compréhensible qu’ils veuillent protéger leur valeur ajoutée. Mais on peut surtout reprocher à la STM de ne pas les rendre disponibles au public! Mais alors, pourrions-nous, devrions-nous avoir quelque chose comme un GPL des données ouvertes? Dire qu’une donnée publique ne peut être employée qu’à condition d’en tirer un service dont les données (traitées) soient privées?

Malgré la réticence quant à la “privatisation” des données publiques, l’idée d’un GPL de données n’a pas soulevé l’enthousiasme à la rencontre. Je le comprends fort bien; par exemple, il serait difficile de faire une donnée composite (mashup) tirée de données publiques et privées. Par contre, si on permet une composition publique, toute donnée privée triviale pourrait être ajoutée pour justifier la fermeture des données…

Néanmoins, il y a selon moi une idée à creuser, et c’est ce qui me mène à mon deuxième point. Une autre problématique soulevée visait le fait de “trafiquer” les données pour des fins politiques; si les données traitées devaient toujours être accessibles, et qui plus est donner un lien vers les données publiques d’origines, et pourquoi pas les algorithmes de traitement, nous aurions une vérifiabilité de l’information dérivée.

Cette idée de lien vers l’origine m’est venue en lisant deux articles du carnet de Steve Easterbrooke: il commence par décrire une infrastructure complexe pour lier les données climatiques aux données plus brutes qui y ont mené; et il explique ensuite l’importance scientifique et politique de pouvoir retourner aux données initiales, dans ce cas particulier.

Bien sûr, on ne veut pas créer trop d’embûches techniques ou juridiques à la création des données publiques, ni à ceux et celles qui voudraient les utiliser; mais je pense que le traitement des données n’est jamais neutre, et qu’il est important de garder des traces de ce traitement.

Enfin, un dernier point: les données doivent être gratuites autant qu’ouvertes. Il est lamentable que Statistiques Canada vende ses données; mais c’est une conséquence naturelle de ce qu’un tel centre de services essentiel soit soumis à une logique comptable de rentabilité. L’équipe de Montréal ouvert ramasse les exemples où le passage aux données libres a été rentable pour les municipalités qui l’ont fait. De tels exemples existent, mais il importe de les multiplier pour persuader les administrateurs.

Enfin, bravo à l’équipe pour un effort important, et aux administrateurs qui se sont montrés réceptifs.