Note technique

Note technique sur la base de données du site Archives de l'Oulipo rédigée par Marc Douguet.

 

Les archives numériques de l’Oulipo reposent sur trois types de fichiers sources :

  • Édition numérique des documents en XML-TEI
  • Thésaurus de entités nommés en XML-SKOS (personnes citées ou présentes aux réunions, institutions, événements, ouvrages et notions citées)
  • Catalogue des archives en XML-EAD

 

Ces fichiers sont le produit de transformations manuelles ou automatisées, et les informations qu’ils contiennent sont insérées dans la base de données du CMS Drupal, selon le schéma ci-dessous.

 

Le texte des documents a été transcrit et enrichi de métadonnées (date, type de document, personnes présentes, etc.) et d’annotations (balisage des entités nommées). L’extraction des entités nommées permet de construire un thésaurus par type d’entité qui liste, pour chaque entité, les différentes formes sous lesquelles celle-ci est exprimée (par exemple « Raymond Queneau », « Queneau », « R. Queneau », « RQ », mais aussi « ueneau » ou « ‘mond ‘neau » quand les Oulipiens jouent à supprimer les initiales de leur nom, par exemple dans les documents t10010013-1961-11-cr et t10010157-1973-05-cv).

Les fichiers XML-TEI (dont les informations sont insérées dans les champs des « nœud » du CMS) et les thésauri (qui servent à construire autant de « taxonomies » dans le CMS) forment le cœur des archives. Ils sont liés les uns aux autres : chaque document référence les termes de taxonomie correspondant aux entités qui y sont mentionnées, ce qui permet en retour d’afficher, pour chaque terme, un index de ses occurrences et d’effectuer des recherches avancées dans les documents.

Le catalogue complet des archives, exprimé en XML-EAD, décrit la structure du fond dans un perspective archivistique, sous la forme d’une arborescence des séries et des dossiers dans lesquels sont contenus les documents. Ces informations sont également insérées dans la base de données du CMS et complètent le corpus des documents retranscrits.

 

Les plugins jQuery suivants sont utilisés pour l’affichage des pages du site :