La Bibliothèque du Congrès a-t-elle vraiment sauvegardé chaque tweet ?
De 2006 à 2017, la Bibliothèque du Congrès a archivé chaque tweet public publié sur Twitter.
Ce projet visait à documenter l'histoire numérique mondiale. L'institution a collecté des milliards de messages, des événements historiques aux simples statuts personnels. Face à l'explosion du volume de données, la bibliothèque ne conserve désormais que les tweets ayant une valeur historique ou thématique majeure.
Nerd Mode
Le 14 avril 2010, la Bibliothèque du Congrès des États-Unis a annoncé un accord historique avec Twitter pour acquérir l'intégralité des archives publiques de la plateforme depuis sa création en mars 2006. Ce projet massif visait à préserver le patrimoine numérique pour les futures générations de chercheurs. L'institution a ainsi accumulé des centaines de milliards de tweets, représentant une base de données sociologique sans précédent.En 2013, un premier rapport indiquait que la bibliothèque gérait déjà plus de 170 milliards de tweets, occupant des dizaines de téraoctets de stockage. Cependant, l'absence d'un moteur de recherche efficace pour le public et la multiplication des contenus multimédias ont rendu la tâche techniquement complexe. Les tweets contenant des images ou des vidéos n'étaient d'ailleurs pas intégralement archivés, car l'accord se concentrait principalement sur le texte.Le 26 décembre 2017, la direction de la bibliothèque a publié un livre blanc annonçant un changement de stratégie radical. À partir du 1er janvier 2018, elle a cessé de collecter l'intégralité du flux pour se concentrer sur une sélection sélective. Ce choix a été motivé par l'augmentation drastique du volume de tweets quotidiens et par le fait que Twitter était passé de 140 à 280 caractères, doublant ainsi la charge de données textuelles.
Fait vérifié
FP-0009588 · Feb 22, 2026