Avec ma formation en lettres, je suis venu lentement à
l’univers des données par l’établissement d’un index des noms propres dans les
œuvres de l’écrivain Jacques Ferron : 12 000 noms, 1 200 textes.
J’ai donc entré les 42 000 occurrences, une à la fois, sur mon premier
ordi à écran monochrome (sans souris!) et le logiciel DBASE III+. C’était
jusque-là un index ordinaire.
Quand j’ai classé les noms dans 20 catégories et que je les
ai liées aux données bibliographiques (date, éditeur, collection), j’ai réalisé
que je venais de construire une base de données. Au fil des ans avec des amis,
j’ai ajouté des données sur : la correspondance, la critique, les manuscrits,
la bibliothèque de Ferron, puis des liens internet, etc. J’ai dû numériser des
livres, transférer une bibliographie dans une base de données (je vous passe
les détails!), créer des relations entre les différents sous-ensembles de
données. Voilà 2-3 ans, j’ai appris que je faisais depuis 15 ans de
l’extraction d’entitées nommées! Ça donne le module de "Recherche globale" de l’HyperFerron que vous pouvez consulter ici (l’interface de
recherche est bien vieilli).
Le passage des informations imprimées à la base de données
numérique m’a permis de consulter autrement l’œuvre de Ferron, de me poser de
nouvelles questions, de découvrir de nombreux aspects dont je ne pouvais même pas
soupçonner l’existence. Pour moi, les données ouvertes, c’est d’abord ça :
la séparation des données de leur support fixe sur papier. Tout devient
malléable, ouvert aux échanges, aux tris multiples, à des modes de diffusion et
de visualisations variées. Je suis donc venu aux données ouvertes par la
pratique.
Peu à peu, j’ai essayé d’utiliser des outils et des
plateformes en ligne pour mieux exploiter mes données.
1) 2 000 noms de lieux mentionnés par Ferron : a)
enregistrer le fichier de données en csv, b) géocoder (ajouter longitude et
latitude); 3) importer dans Google Doc; 4) utiliser le plug-in conçu pour les
géolocaliser sur une carte! Avec 1 600 noms, le résultat est un peu long à
s’afficher, mais ça marche :
2) places de spectacles du boulevard Saint-Laurent : a)
numérisation du répertoire A.-G. Bourasse et J.-M. Larrue b) ocr, Word, base de
données, ajout de catégorie c) fichier csv, géocodage, importation dans GoogleFusion Tables
d) plug-in pour créer des fichiers kzm pour l’afficher dans
Google Earth.
La transformation des informations imprimées en données numériques
transforment complètement la vision et la compréhension que l’on pouvait avoir
de ce répertoire. On apprécie encore mieux le travail minutieux des deux
historiens.
Pour continuer ce projet? Ajouter aux lieux de spectacles
des informations sur les artistes, des photos, des extraits sonores, visuels,
des extraits de la presse, de la radio, de la littérature, les commentaires des
historiens, et laisser les gens ajouter leur propres souvenirs et documents
qu’ils ont sur la Main de Montréal.
Aucun commentaire:
Enregistrer un commentaire