Aller au contenu principal

Derrière les tours, la BnF stocke 45 milliards de pages web

Auteurs
Numéros de page :
pp.60-61
Depuis 2006, le web français est inscrit au dépôt légal. La BnF, Bibliothèque nationale de France, est chargée de garder une trace de tout ce qui est produit sur les sites français ou hébergés en France. En 2021, cela représentait 5,5 millions de sites, visités par Heritrix, un robot, qui scanne des sites prédéfinis et d'autres faisant l'objet de demandes spécifiques de la part des collecteurs humains. Les archives ainsi récupérées sont ensuite mises en ligne sur le service DataLab et accessibles via certaines bibliothèques associées à la BnF, et stockées dans des bornes de préservation sous forme de bandes magnétiques, moins périssables que le code informatique. Détails. Pas de chiffres.