Qu’est-ce qu’une archive du Web?
Francesca Musiani, Camille Paloque-Bergès, Valérie Schafer et Benjamin G. Thierry
OpenEdition Press, janvier 2019
Bien que le Web ait seulement trente ans, son patrimoine est déjà pléthorique : la fondation Internet Archive a collecté plus de 345 milliards de pages web depuis 1996. Cette fondation, qui fut l’un des pionniers de l’archivage du Web, n’est pas seule à préserver et collecter aujourd’hui ce patrimoine dit « nativement numérique ». Au cours des années 2000, plusieurs pays ont en effet lancé de tels archivages, souvent confiés aux bibliothèques nationales, et cette tendance ne cesse de s’affirmer depuis.
Ces initiatives introduisent des ruptures : dans la notion même d’archive, mais aussi dans les pratiques des professionnels des bibliothèques et du patrimoine, tout comme dans celles des chercheurs.
Cet ouvrage se propose d’initier le lecteur aux enjeux humains et techniques de l’archivage de la Toile, de la collecte à l’analyse en passant par la création et le partage de corpus ou encore le cadre législatif. Il étudie de manière pragmatique cet archivage, en essayant de rendre palpable à la fois sa fabrique (technique, institutionnelle, juridique), la relation que ses acteurs entretiennent avec les publics et les évolutions qu’ont connues les collectes en une vingtaine d’années. Ce livre s’intéresse également à la manière dont les archives du Web, outre leur rôle patrimonial, peuvent aujourd’hui être exploitées par différents acteurs, notamment à des fins de recherche.