Les mégadonnées: une menace, ou une chance pour le patrimoine culturel?
On nomme «mégadonnées» («big data») des collections d?informations résultant de la récolte et du stockage de données élémentaires portant sur une énorme masse d?individus (personnes, objets, biens culturels, etc.) et sur leurs «activités»; l?analyse de ces données vise à décrire le comportement habituel de ces individus, en répondant à certaines questions ciblées, et à prévoir leur comportement futur. Une telle analyse n?est possible qu?à deux conditions: 1. La technologie de stockage des données doit être en mesure de sauvegarder efficacement d?énormes quantités de données, auxquelles elle doit garantir un accès rapide (il s?agit de nombres de petaoctets à plusieurs chiffres; 1 petaoctet = 1000 téraoctets = 1 000 000 gigaoctets); c?est aujourd?hui possible, grâce aux disques durs modernes et aux systèmes de stockage en réseau. 2. On doit disposer de méthodes d?analyse applicables à des volumes de données gigantesques.
Ces dernières années, on a numérisé un grand nombre de biens culturels, et ce travail se poursuit, tant au niveau national que sur le plan international. Parmi les programmes en cours au niveau national, on mentionnera par exemple le projet «e-codices» et le «Montreux Jazz Digital Project». Aujourd?hui, on peut accéder en ligne à de grandes masses de données qui se rapportent directement à notre patrimoine culturel. Dans le domaine de la conservation des biens culturels, l?analyse ciblée de ces données et la récolte par ce biais de nouveaux résultats en sont encore à leurs balbutiements. Ce type d?analyse a donné naissance à une nouvelle discipline au sein des sciences humaines, les humanités numériques. Dans ce contexte, le développement des données ouvertes liées («linked open data, LOD») est particulièrement intéressant. Cette nouvelle technologie doit permettre aux chercheurs d?utiliser directement dans leurs propres applications et programmes d?analyse les données disponibles en ligne, grâce à une interface standardisée; par ce moyen, des données provenant des bibliothèques numériques les plus diverses pourront être combinées et comparées, ce qui ouvrira des perspectives radicalement nouvelles en matière de recherche et de présentations numériques.