Contrairement aux caractères gravés sur la pierre de Rosette, les données numériques ne sont pas conservées sur des supports immuables. Quelques années après que ces données ont été écrites, leur format devient obsolète, les systèmes de lecture et d’analyse ne sont plus compatibles avec les ordinateurs plus modernes et le code de visualisation ne fonctionne plus.
Le LEP, l’ancien accélérateur phare du CERN, qui a fait entrer en collision des électrons et des positons jusqu’en 2000, a produit un ensemble de données à l’intérêt potentiellement considérable. Comme le LHC actuellement, le LEP comptait quatre points de collision, accueillant chacun une expérience (ALEPH, DELPHI, OPAL et L3) exploitée par plusieurs centaines de chercheurs. Si le LEP détient le record de la plus haute énergie pour des collisions e+ e-, rares sont les scientifiques à avoir toujours accès aux données recueillies pendant plus de deux décennies d’exploitation.
À la manière des archéologues qui exhument les vestiges de civilisations oubliées, les archéologues du numérique sont des experts en informatique chargés de récupérer des données alors que les collaborations qui les ont collectées sont passées à d’autres d’expériences depuis plusieurs années. « Il faut dans un premier temps obtenir l’accord de la collaboration pour ouvrir et mettre à disposition ses données, ainsi que les logiciels qui permettent de les exploiter. Ensuite, comme le feraient des archéologues, nous nous plongeons dans les documents rédigés par les anciennes collaborations au sujet de l’architecture des données et nous retrouvons les logiciels utilisés à des fins d’analyse », explique Ulrich Schwickerath, ancien physicien à DELPHI aujourd’hui expert en informatique au sein du département IT. La tâche est ardue car les informations nécessaires sont souvent éparpillées dans des documents jamais publiés ou dans des dépôts privés auxquels la collaboration n’a parfois même pas eu accès.
Le logiciel d’analyse utilisé à l’époque du LEP était conservé sur CERNLIB, une bibliothèque numérique conçue par le CERN, puis abandonnée en 2003. « Juste après la publication de la dernière version de CERNLIB, de nombreux passionnés extérieurs au CERN ont maintenu le logiciel en vie, en le mettant à jour avec de petites retouches appelées correctifs. Dans un effort commun, ces correctifs ont été réunis afin de créer une version « communauté » de ce vieux logiciel et de le rendre compatible avec les architectures modernes, poursuit Ulrich Schwickerath. Depuis, accompagnés d’une poignée de passionnés du LEP, nous sommes parvenus à ressusciter les infrastructures logicielles des expériences DELPHI et OPAL à l’aide de la version « communauté » de CERNLIB. Nous essayons de mettre l’intégralité du jeu de données à disposition, dans son format original, mais rendu aussi compatible que possible avec le matériel et les logiciels modernes, et de réviser les codes de visualisation des données afin que les scientifiques d’aujourd’hui puissent mener leurs analyses. »
Les données d'ALEPH et DELPHI sont désormais ouvertes et les données DELPHI seront bientôt disponibles sur Portail des données ouvertes du CERN. Que vous soyez scientifique, membre du corps enseignant ou estudiantin, ou simplement avide de physique, partez à la découverte des données sur l’annihilation électron-positon recueillies par le détecteur DELPHI en cliquant sur ce lien.