27 mars 2025 | MRSH de Caen
PDN ; PUC ; PURH ; CEEN
Rencontre Caen
tour de table présentation
PURH, Presses universitaires de Caen, Pôle Documents Numériques (PDN), CEEN
Présentation de la chaire
3 axes de la chaire.
- théorique
- pratique
- institutionnel
Marcello et philosophe, intérêt pour la théorie de l’édition. Souvent l’édition est considérée comme une pratique qu’on laisse aux petites mains. De quelle manière la matière pense, le premier enjeu de la chaire est de produire une théorie de l’édition, et de voir comme certaines pratiques portent une pensée et des modèles. Cette théorie ne peut exister si elle n’est pas incarnée dans la matérialité.
Pour la chaire ces pratiques s’incarnent dans une série de projets dont on a hérité :
- la correspondance de Juliette Drouet, réalisée en Spip, et intérêt pour la conversion HTML vers TEI.
- Astrée, idem conversion HTML vers TEI
- Édition de la Siloge Parisina, édition critique d’un témoin avec 4 niveau d’apparat, 3 langues, etc. Ici on note une certains résistance des philologues qui n’arrivent pas à penser en TEI, mais le modèle proposé par Ekdosis, correspond pas mal aux pratiques des philologues et qui permet de faire des sorties TEI.
- Ecrisoi, utilisation de Stylo et Julia pour générer un site à la volée. Intérêt de faire travailler des personnes qui ne veulent pas trop mettre les mains dans la technique et qui n’ont pas besoin de contenus très structurés
- Pressoir également
La Chaire s’intéresse également à la pérennité des production, qu’elle est le rôle de l’éditeur et des presses, mais aussi la possibilité de proposer des API sur le texte, proposer bien évidemment les ressources en XML par exemple mais aussi serialisation.
La chaire n’est pas sectaire dans les méthodes à utiliser.
Que peut-on partager avec la Caen ?
Présentation des activités de Caen
P-Y Buard A Caen, le parcours numérique est vraiment lié à des projets éditoriaux. Au début pas de support technique, le XML était balbutiant. Au début approche pratique, puis la théorie s’est rajoutée. La pratique de base est : numérisation/dématérialisation d’un texte, d’une source -> balisage et annotation avec un niveau de description qui est très variable selon les besoins du projet -> mise en forme et rematérialisation (sortie papier et/ou numérique)
Il faut un collectif de travail, avec des acteurs qui travaillent ensemble, c’est un point très important, tout le monde va dans le même sens et travaille pour un même objectif.
L’organisation du travail : Bases de données recherche / fiche catalographique / textes auteurs -> exportation/conversion (XML-EAD et XML-TEI) avec connexion avec les autorités locales, viaf, crossref, lieux, personnes, etc. -> transformation : inventaires/archivas, éditions en ligne, ePub, PDF, papier, etc.
Ils sont impliqués dans Biblissima+ (cluster 5B Typologies textuelles du Moyen Âge et de la renaissance, le cluster 5 étant Édition de sources en TEI) pour faire des propositions sur des approches qui peuvent être reprises et réutilisées par tous afin de ne pas partir de 0. Volonté de produire un thésaurus des sources, un peu sur le modèle de la Typologie textuelle réalisée dans le cadre du groupe CAHIER (groupe Ariane maintenant).
La TEI est au centre de tout, ce n’est pas parfait, il manque des choses, elle évolue régulièrement, mais c’est une base de discussion documentée.
Pour le moment ils ne proposent pas d’API, proposer, publier la TEI n’était pas au cœur des préoccupations. Les chroniques du Mont Saint-Michel, une des premières édition, a été réalisée avec PHP et des appels XSL pour la transformations. Ce premier travail questionnait la différence entre texte, document, source, etc. Car les différentes éditions des sources ne présentaient pas les textes dans le même ordre. Le numérique permettait de lire les textes dans l’ordre que l’on souhaite.
Ils ne s’interessent pas uniquement aux sources textuelles, développement d’un modèle prosopographique, projet Diverive, mais toujours en TEI. Rassemble un outil de travail et un outil de publication.
Avec l’édition de l’Hortus Sanitatis, volonté de produire un premier modèle interopérable pour des échanges avec des équipes de recherche Nancéenne. Première tentative aussi de reconfiguration du texte avec la réalisation d’un répertoire des citations qui sont présente dans l’Hortus, qui permet de récupérer, par exemple, toutes les citations d’Aristote présente dans les textes.
La question de l’APIfication des données pourrait être un point à développer avec Caen, afin de pouvoir par exemple récupérer toutes les citations d’Aristote dans l’Hortus et dans la Siloge s’il y en a.
Pour la publication papier, il y a un véritable flux de travail qui a été imaginé et mis en œuvre avec un éclatement du flux complet (les documents XML-TEI très annotés) afin d’extraire le texte, les différents niveaux d’annotation, etc. et faire rentrer ce flux XML dans In-Design pou rla composition.
Édition de Geoffroi Malaterra. La numérique permet de ne pas choisir entre l’édition des textes et des documents. Lors de ce projet, un travail main dans la main avec les ingénieurs du pôle, réalisation d’une importante documentation, pour l’encodage, mais aussi pour l’utilisation d’outils et d’environnement mis en place pour l’édition avec XML Mind. Les chercheurs ont appréciés les environnements et la vue proposé par XML-Mind. Réalisé avec un proto-Max, mais l’erreur qui a été faite a été de partir directement du document produit par le chercheur, ce qui était compliqué. Il aurait été beaucoup plus simple de produire des ressources intermédiaires pour publier ces dernières. Il faut bien penser qu’il y a un temps pour la recherche et un temps pour la publication. La publication correspond à un résultat d’une recherche. Cela ne veut pas dire qu’on ne peut pas reprendre la recherche, mais dans ce cas il s’agira d’une nouvelle édition.
Flux et outils collaboratif Éditeur XML (client lourd - XML Mind - avec environnements personnalisés), édition des fichiers XML (TEI et EAD), qui sont stockés dans une base de données XML (BaseX). Pluco permet de se connecter sur la base et de modifier les documents dans XML-Mind. Ensuite utilisation de Max pour le moteur d’affichage XML. De fait possibilité de versionnement avec Git très limité. Une instance BaseX par projets, mais plusieurs sous-projets portant sur la même thématique sont regroupés au sein du même BaseX.
MaX
Projet lancé il y a 10ans. Il n’y avait pas de solution d’affichage stable. L’objectif était de gagner du temps. L’idée c’était d’avoir 3VM et un MaX qui tourne sur toutes les machines. MaX automatise la création d’index, publication de fragments, etc. Mais rapidement trop de projets, trop de ports à configurés et VMs qui crash tout le temps.
Le mode de déploiement est revu et une logique par projet est adopté : un projet, un MaX. Mais perte des avantages, avec logique multiprojets
Le coût d’entrée est quand meme un peu élevé, même si on sait coder en TEI, il faut quand même savoir déployer MaX.
MaX est un moteur d’affichage, il requête une base XML et affiche des contenus.
Actuellement, développement d’une V2. Max reste un moteur d’affichage, mais adoption d’une logique de bundle.
Pour le moment le cœur applicatif de MaX est fermé et développé uniquement par un développeur de la DSI de Caen (développeur historique de MaX). Discussion avec Christian Grun (BaseX) pour créer une moteur de recherche mixed content. API DTS (et DOTS, dans cluster 7 de Biblissima) développée par Philippe Pons, qui pourrait être intégrée par un bundle. De fait, l’APIfication des données pourrait être prévue via un bundle.
Q° quand il faut créer des routes, il faut bien mettre les mains dedans. MaX V2 adopte une logique d’autoroutes, en fonction de modèles, d’instances XML et cas d’organisation des fichiers, pour définir des routes par défaut (macro modèles). Logique de surcharge si besoin de modifier quelque chose.
TEI Publisher est trop complexe à déployer. C’était censer régler tous les problèmes, mais c’est devenu un usine à gaz.
MaX a l’idée de proposer un traitement par défaut des balises TEI par des “XSL de base” l’affichage ne sera peut être pas parfait mais quelque chose s’affichera.
Volonté à terme d’utiliser les citeStruct.
Discussion autour des éditeurs dans les presses universitaires et des outils, question de l’intégration d’un flux LaTeX, mais problématique pour trouver des spécialistes de LaTeX. Critique autour de l’identification des documents LaTeX qui se ressemblent tous (en même temps même chose pour les éditions réalisées avec MaX.)