Presses Universitaires de Vincennes

Texte à l'épreuve du numérique (Le)
  • Auteur(s) : Collectif
  • Revue : Médiévales n° 73
  • Nombre de pages : 254
  • Langues : Française
  • Paru le : 25/01/2018
  • EAN : 9782842928018
  • Caractéristiques
    • Support : Livre broché
    • ISSN : 0751-2708
    • CLIL : 3386 Moyen Age
    • ISBN-10 : 2-84292-801-6
    • ISBN-13 : 978-2-84292-801-8
    • EAN-13 : 9782842928018
    • Format : 160x240mm
    • Poids : 460g
    • Illustrations : Non
    • Édition : Première édition
    • Paru le : 25/01/2018
    •  
    • Support : PDF
    • ISBN-13 : 978-2-84292-802-5
    • EAN-13 : 9782842928025
    • Taille : 7 Mo
    • Protection : Marquage (water mark)
    • Illustrations : Non
    • Paru le : 25/01/2018
    •  

Texte à l'épreuve du numérique (Le)

N°73/2017

Les humanités numériques sont omniprésentes dans les études médiévales. Ce numéro réunit des études de cas inédits favorisant les échanges autour de ces derniers et des dispositifs mis en place.

À l’heure où les humanités numériques sont omniprésentes dans les études médiévales, ce numéro réunit un ensemble interdisciplinaire d’études de cas inédits. L’édition  des textes en  format numérique ouvre des possibilités qui modifient en profondeur les pratiques et les méthodes des historiens. Le recours à ce nouveau mode d’accès et d’exploitation des données textuelles se révèle particulièrement fécond dans bien des domaines des études médiévales, comme le prouve le nombre de projets de recherche lancés depuis dix ans et dont on recueille ici  les premiers fruits.

Avec le soutien du Laboratoire DYPAC – Université Versailles Saint-Quentin (Paris-Saclay)

Coordinateur(s) du numéro :
Anne Rochebouet |

Coauteur(s) :
Sébastien Hamel |
Jean-François Moufflet |
Dominique Stutzmann |
Auteur(s) :
Eloïse Adde |
Thibault Clerice |
Frédéric Duval |
Davide Gherdevich |
Graziella Pastore |
Anne Rochebouet |
Anne Salamon |
Xavier-Laurent Salvador |
Sergio Torres Aguilar |
Julien Véronèse

SommaireRésuméAbstractExtrait(s)Collection/Abonnement

Mots-clés : Archives | Bases de données | Édition numérique | Humanités numériques | Latin | Littérature française | Moyen Âge | Numérique | Recherche | Texte | Traitement de données | Traitement de texte

notre page Facebook notre fil Twitter notre flux des nouveautés notre page Linkedin notre page Viméo




Sommaire

Introduction

Anne Rochebouet
Le texte à l’épreuve du numérique


Frédéric Duval
Pour des éditions critiques numériques. L'exemple des textes français

Graziella Pastore
L’édition numérique du Livre de jostice et de plet (ELEC), point de départ de la constitution d’une base prosopographique (Omeka),

Sergio Torres Aguilar
La reconnaissance des entités nommées dans les bases numériques de chartes médiévales en latin : le cas du Corpus Burgundiae Medii Aevi (Xe- XIIIe siècles)

Dominique Stutzmann, Jean-François Moufflet, Sébastien Hamel
La recherche en plein texte dans les sources manuscrites médiévales : enjeux et perspectives du projet HIMANIS pour l'édition électronique

Xavier-Laurent Salvador
ISILEX, un serveur et gestionnaire de contenus collaboratifs REST XQuery au service des Humanités Numériques : l’exemple de la Bible historiale

Thibault Clérice
Les outils CapiTainS, l’édition numérique et l’exploitation des textes

Anne Salamon
« H(histoires) U(universelles) 15 » : un portail numérique pour textes en mal d’édition

Davide Gherdevich
Polimawiki : un site contributif pour l’étude du pouvoir des listes au Moyen Âge

 Essais et recherches

Eloïse Adde
Environnement textuel et réception du texte médiéval. La deuxième vie de la Chronique de Dalimil,

 Point de vue

Julien Véronèse
L’historien et ses démons. Autour de quelques travaux récents sur la démonologie médiévale,

 

- Notes de lecture
- Livres reçus

Résumé

Frédéric Duval
Pour des éditions numériques critiques. L’exemple des textes français

Trente ans après les débuts de l’édition numérique de textes médiévaux en français, le bilan est maigre et les méthodes éditoriales privilégient les éditions documentaires, dans la tradition anglo-saxonne du scholarly documentary editing. Cette contribution voudrait sensibiliser les médiévistes francisants à l’intensité actuelle des débats théoriques consacrés à l’édition numérique et à la place que peut y trouver l’édition critique. Après une mise au point terminologique, elle revient sur les raisons qui expliquent le triomphe des éditions numériques orientées vers le document, avant de rappeler que le numérique ne modifie pas l’ontologie des textes et ne disqualifie pas l’approche de la critique textuelle. Au contraire, une complémentarité est à trouver entre éditions documentaires et éditions auctoriales.
Mots-clés : édition numérique, humanités numériques, littérature française, texte (édition).

 

Graziella Pastore
L’édition numérique du Livre de jostice et de plet (Élec), point de départ de la constitution d’une base prosopographique (Omeka)

La solution décrite dans cette contribution permet de combiner exigences académiques et difficultés pratiques : un outil de gestion de fichiers qui permet de gérer des fichiers d’autorité, d’en visualiser les données comme de s’assurer de leur interopérabilité, sans pour autant nécessiter une formation ardue et tout en s’adaptant à des corpus et des projets variés. Les fichiers d’autorité ont été balisés en XML en suivant le format EAC-CPF (Encoded Archival Context – Corporate Bodies, Persons and Families) ; la visualisation des données est gérée par le système de gestion de contenus (CMS) Omeka. Le corpus d’autorité est basé sur les officiers et jurisconsultes cités dans le Livre de jostice et de plet, compilation juridique rédigée en ancien français au xiiie siècle et récemment éditée en ligne sur Élec (Éditions en ligne de l’École des chartes).
Mots-clés : édition numérique, humaniés numériques, Livre de jostice et de plet , prosopographie, Omeka.

 

Sergio Torres Aguilar
La reconnaissance des entités nommées dans les bases numériques de chartes médiévales en latin : le cas du Corpus Burgundiae Medii Aevi (Xe-XIIIe siècle)

La disponibilité d’une quantité phénoménale de manuscrits médiévaux numérisés nous oblige à chercher des méthodes efficaces pour en réaliser une exploitation à grande échelle. Mais ce travail ne peut être réalisé que dans des bases de données structurées où les propriétés textuelles ont été explicitées et formalisées. Une telle structuration, lorsqu’elle est effectuée à la main, est coûteuse en termes de temps et d’effort, ce qui a conduit à chercher des manières de l’automatiser. Nous en présentons ici un exemple : la création d’un modèle de reconnaissance des entités nommées, qui sont un agent structurant primaire, puisque y sont identifiés tous les sujets et objets qui adoptent des noms spécifiques. Nous détaillons la création et la mise en œuvre du modèle créé à partir des chartes de Bourgogne (Corpus Burgundiae Medii Aevi), produites entre le Xe et le XIIIe siècle ainsi que diverses expériences de validation pour en tester la robustesse sur un large éventail de sources, tout en soumettant les résultats à une discussion qui tente d’exposer les divers avantages et défis qu’offre un corpus de manuscrits médiévaux pour ce type de technique.
Mots-clés : bases de données, chartes, Corpus Burgundiae Medii Aevi, humanités numériques, latin, reconnaissance des entités nommées.

 

Dominique Stutzmann, Jean-François Moufflet, Sébastien Hamel
La recherche en plein texte dans les sources manuscrites médiévales : enjeux et perspectives du projet HIMANIS pour l’édition électronique

HIMANIS (Historical MANuscript Indexing for user-controlled Search) est un projet de recherche européen, associant, sous le pilotage de l’IRHT (CNRS, France), la société innovante A2iA (France), la Rijksuniversiteit Groningen (Pays-Bas) et l’Universitat Politècnica de València (Espagne). Il vise à l’indexation du texte des registres de la chancellerie royale française des années 1302-1483, conservés aux Archives nationales sous les cotes JJ35 à JJ211, à partir des images produites par leur numérisation. Les enjeux de recherche d’information (données massives et bruitées) permettent de conjoindre les enjeux technologiques (reconnaissance de l’écriture manuscrite) et historiques (analyses paléographiques et diplomatiques, recherche sur les institutions, le fonctionnement de la monarchie, la naissance de l’État-nation).
La présente contribution propose un modèle d’accès à l’information dans un corpus de données massives, d’un point de vue tant ergonomique qu’herméneutique. À cette fin, après une présentation du corpus, des outils actuels pour accéder à l’information qu’ils contiennent et de leur formalisation en TEI, elle problématise l’édition électronique comme « vérité terrain » et « terrain d’apprentissage », en renversant l’approche classique de l’édition critique comme finalité. Enfin, elle décrit le modèle d’accès proposé, à la fois pour une approche par « indexation » (et non par transcription) et pour une granularité par acte.  
Mots-clés : Archives nationales, chancellerie royale, édition électronique, HIMANIS, humanités numériques, recherche en plein texte.

 

Xavier-Laurent Salvador
Isilex, un serveur et gestionnaire de contenus collaboratifs REST XQuery au service des humanités numériques : l’exemple de la Bible historiale

Isilex, un serveur et gestionnaire de contenus collaboratifs REST XQuery au service des humanités numériques : l’exemple de la Bible historiale
Dans le contexte des humanités numériques, il est désormais possible de développer de nouveaux moyens de représentations des données textuelles affranchies de la logique documentaire. Isilex <http://www.isilex.fr> est un gestionnaire de contenus XML en même temps qu’un serveur Web basé sur la philosophie innovante du Web intitulée REST et basée sur les possibilités de programmation offertes par la bibliothèque Full-Text d’XQuery. Il permet de penser de nouveaux moyens pour la mise en ligne immédiate d’encyclopédies et de corpus.
Mots-clés : Bible historiale, humanités numériques, Isilex.

 

Thibault Clérice
Les outils CapiTainS, l’édition numérique et l’exploitation des textes

Issu de la collaboration de membres des équipes de Perseids et Perseus à Tufts et de la Humboldt Chair of Digital Humanities de l’Université de Leipzig, le projet CapiTainS voudrait proposer des solutions open source, réexploitables et extensibles visant à simplifier le développement et la valorisation de publications et éditions numériques. Cet ensemble d’outils permet aux chercheurs d’inscrire leur projet dans un réseau de données ouvertes et pleinement réutilisables, réduisant ainsi le coût nécessaire à la ré-exploitation de données produites.
Mots-clés : édition numérique, CapiTainS, humanités numériques.

 

Anne Salamon
H(istoires) U(niverselles) 15 : un portail numérique pour textes en mal d’édition

Cet article présente le portail numérique H(istoires) U(niverselles) 15, développé dans le cadre d’une subvention « Développement Savoir » du CRSH (Canada), qui a pour objectif de faciliter l’accès au texte de quelques histoires universelles du xve siècle ainsi que d’approfondir les connaissances sur ces textes encore inédits. Dans un parcours du théorique au pratique, cet article part d’une réflexion médiatique sur la nature de l’édition de texte, en particulier autour de la notion de remediation, développée par Jay D. Bolter et Richard Grusin. Il explore ensuite comment cette réflexion sur le médium et le choix du numérique ont orienté les décisions éditoriales, et contribué à définir la structure d’un projet voulu comme un cadre d’expérimentation pour réfléchir aux possibilités de l’édition numérique.
Mots-clés : édition numérique, histoires universelles, humanités numériques.

 

Davide Gherdevich
PolimaWiki : un site contributif pour l’étude du pouvoir des listes au Moyen Âge

L’un des premiers objectifs du projet ANR Polima (POuvoir des LIstes au Moyen Âge), débuté en 2015 à l’Université de Versailles Saint-Quentin, a été de créer un moyen de partager entre chercheurs reproductions d’objets et de documents comme éditions de textes médiévaux contenant des listes. Grâce au logiciel Mediawiki, et à l’extension Semantic Mediawiki, les données sont intégrées à un site internet collaboratif, qui en facilitera le partage et l’échange par la communauté des chercheurs.
Mots-clés : bases de données, humanités numériques, listes, PolimaWiki.

 

Éloïse Adde
Environnement textuel et réception du texte médiéval. La deuxième vie de la Chronique de Dalimil

Cette analyse propose d’apporter un éclairage nouveau sur la réception de la Chronique de Dalimil grâce à l’analyse des « assemblages textuels » constitutifs des codices qui la renferment. Si l’enquête nous surprend dans un premier temps par l’importance des textes de divertissement au sein du corpus et le recul de la portée politique du texte, ce constat est néanmoins en conformité avec les transformations de la société qui avaient rendu caduc le message de Dalimil. L’écrasante majorité des textes en tchèque rend compte des progrès de la vernacularisation ainsi que du rôle des « transferts culturels » dans l’élaboration de la littérature nationale. La composition des différents codices se fait en outre le reflet de la nouvelle place prise par la littérature dans la société, dans le contexte de l’apparition des « nouveaux publics », tout en illustrant les destinées que pouvait suivre le texte, indépendamment des visées premières de son auteur. Enfin, elle montre que le processus de canonisation de l’œuvre, capable de faire le poids à côté des « hits » de la littérature européenne, était déjà largement engagé à l’orée du XVe siècle.
Mots-clés : Bohême, Chronique de Dalimil, littérature politique, morale, littérature de divertissement, vernacularisation.

 

Guillaume Mora-Dieu
Les corporations et la défense d’une ville : l’exemple de Liège

Dès l’aube du XIVe siècle, l’incroyable essor des corporations de métiers à Liège a laissé son empreinte dans la défense de la cité. Celles-ci fournissent de nouveaux contingents pour la sauvegarde des murs de la ville. La capacité militaire des métiers s’accroît aussi avec l’extension des droits de bourgeoisie à la banlieue en 1343 et 1429, fournissant aux corporations un nouveau vivier de membres potentiels. à l’origine, les bras armés de ces corporations semblent plutôt être une émanation de l’ancien ost urbain, qui se répartissait par vinâves (quartiers). Mais contrairement à cet ost, demeuré bien obscur, on connaît un peu mieux leurs prérogatives militaires et leurs atours. Au fil du temps, les métiers liégeois montrent leurs limites dans l’exercice de leur fonction protectrice. Pour y remédier, les deux derniers tiers du xve siècle voient ainsi la mise au premier plan d’autres corps de défense. Présentant une puissance similaire à celles des plus grandes villes de Flandre de la même époque, les métiers de Liège et leurs milices semblent avoir suivi une destinée… tout aussi équivalente.
Mots-clés : métiers, Liège (Belgique), guerre, maintien de l’ordre, défense urbaine, compagnies militaires.

 

Julien Véronèse
L’historien et ses démons

Autour de quelques travaux récents sur la démonologie médiévale

Abstract


Frédéric Duval
For Critical Scholarly Digital Editions. The Example of Medieval French Texts

Thirty years after the first digital edition projects for texts in Old and Middle French, the results are meager and editorial methods favor documentary editions, in the Anglo-Saxon tradition of scholarly documentary editing. This contribution aims to sensitize the medievalists interested in French texts and documentation to the current intensity of the theoretical debates devoted to the digital edition and the place that the critical edition can find there. After a terminological refinement, it returns to the reasons for the triumph of digital editions oriented towards the document, before recalling that the digital does not modify the ontology of texts and does not disqualify the approach of textual criticism. On the contrary, a complementarity is to be found between documentary editions and critical editions.
Keywords : Digital Edition, Digital Humanities, French Literature, Text (Edition).

 

Graziella Pastore
The Scholarly Digital Edition of the Livre de jostice et de plet (Élec): A Starting Point for Creating a Prosopographical Database with Omeka CMS

The solution described is the result of a combination of research and practical experience: a file management tool for authority files, with publishing and interoperable capabilities that can be handled without a steep learning curve, and that can adapt themselves to variation or different cases. The authority records were delineated in XML markup following EAC-CPF (Encoded Archival Context—Corporate Bodies, Persons and Families) convention; the dataflow was managed by the Omeka Content Management System. The corpus of authority files is based on officials and jurisconsults cited in the Livre de jostice et de plet, a legal compilation written in Old French around 1260, recently edited online on Élec (Éditions en ligne de l’École des chartes).
Keywords : Digital Edition, Digital Humanities, Livre de jostice et de plet, Prosopography, Omeka.

 

Sergio Torres Aguilar
Named Entities Recognition for Digital Bases of Medieval Latin Charters. The Case of the Corpus Burgundiae Medii Aevi (Tenth-Thirteenth Centuries)

The availability of a vast amount of digitized medieval manuscripts requires to import effective methods for large-scale exploitation. But this work can only be done in structured databases where the textual properties are explicit and formalized. This type of handmade structuring is highly time-consuming, which has led to the search for ways to it. We present an example of this: the creation of a named entities recognition model, which are a primary structuring agent, since it corresponds to all the subjects and objects adopting specific names. We detail the creation and implementation of the model formed from Burgundian charters (Corpus Burgundiae Medii Aevi), produced from the tenth to the thirteenth centuries; also, we describe various validation experiments in order to test its robustness on a wide range of sources and at the same time we submit all the results to a discussion that shows the various benefits and challenges of this type of technique on a medieval manuscripts’ corpus.
Keywords : Corpus Burgundiae Medii Aevi, Charters, Digital Bases, Digital Humanities, Latin, Named Entities Recognition.

 

Dominique Stutzmann, Jean-François Moufflet, Sébastien Hamel
Full Text Search in Medieval Manuscripts: Issues and Perspectives of the HIMANIS Project for Electronic Publishing

HIMANIS (Historical MANuscript Indexing for usercontrolled Search) is a European research project involving the innovative A2iA company (France), the Rijksuniversiteit Groningen (the Netherlands) and the Universitat Politècnica de València (Spain). It aims at indexing the full manuscript text of the Royal French Chancery registers from their digital images from 1302 to 1483, kept in the National Archives under the call numbers JJ35 to JJ211. The challenges for information retrieval in these registers (massive and noisy data) combine both technological (recognition of handwriting) and historical issues (paleographic and diplomatic analyzes, research on institutions, the functioning of the monarchy, national state genesis) issues.
This paper proposes a model for accessing information in a massive body of data, both from an ergonomic point of view and from an hermeneutic one. To this end, after presenting the corpus, the current tools for accessing information contained in the corpus and their formalization in TEI format, it challenges electronic publishing as a “ground truth” and as “training data”, by aiming to reverse the classical approach of critical editions. Finally, it describes the proposed access model, both for an “indexing” approach (which is not a transcription) and for a granularity per act. 
Keywords : Digital Edition, Digital Humanities, Full Text Search, HIMANIS, National Archives (France), Royal French Chancery.

 

Xavier-Laurent Salvador
Isilex, a Collaborative REST XQuery CMS for Digital Literacies: About the Bible Historiale

Digital literacies offer a new and comprehensive way of thinking and building new objects of science, cross-linking new data-building tools and, most of all, textual ressources. Isilex <http://www.isilex.fr> is an XML CMS server based upon the Web philosophy of REST and is Full-Text XQuery oriented. It facilitates the creation of new means of immediately publishing corpora and encyclopedias online.
Keywords : Bible historiale, Digital Humanities, Isilex.

 

Thibault Clérice 
CapiTainS Toolkit, Digital Editing and Data Reuse

CapiTainS Toolkit, Digital Editing and Data Reuse Collaboratively founded by members of the Perseids and Perseus staff at Tufts and of the Humboldt Chair of Digital Humanities at the University of Leipzig, the CapiTainS project aims to offer open source, reusable and extensible software solutions to simplify the development and promotion of digital editions and publications. This toolkit enables researchers to insert their project into a network of open and reusable data, and helps reduce costs in mining them.
Keywords : CapiTainS, Digital Editing, Digital Humanities.

 

Anne Salamon
H(istoires) U(niverselles) 15: A Digital Website for Unedited Texts

This article presents the H(istoires) U(niverselles) 15 digital portal, developed as part of a SSHRC “Insight Development” Grant (Canada), which aims to facilitate access to the text of several universal chronicles from the Fifteenth century and to deepen the knowledge on these still unedited texts. From the theoretical to the practical, this article starts with a media reflection on the nature of text editing, especially around the notion of remediation as developed by Jay D. Bolter and Richard Grusin. It then explores how these considerations on the medium and the choice of a digital medium have oriented the editorial decisions and helped to define the structure of a project conceived as a framework of experimentation to reflect on the possibilities of digital editing.
Keywords : Digital Editing, Digital Humanities, Remediation, Universal Chronicles.

 

Davide Gherdevich 
PolimaWiki : a Semantic Wiki for Collaborative Studies about the Powers of the List in the Middle Ages

One of the first objectives of the ANR project Polima (Power of the lists in the Middle Ages), begun in 2015 at the University of Versailles Saint-Quentin, was to create a means of sharing reproductions of objects and documents, among researchers as well as editions of medieval texts containing lists. Using Mediawiki software and the Semantic Mediawiki extension, the data has been integrated into a collaborative website, which facilitates sharing and exchange by the research community.
Keywords : Digital Bases, Digital Humanities, List, PolimaWiki.

 

Éloïse Adde 
Textual Environment and Reception of a Medieval Text. The Second Life of the Chronicle of Dalimil

This analysis proposes to shed new light on the reception of the Chronicle of Dalimil through the analysis of the “textual collections” constituted by the codices that contain it. While we were initially surprised by the importance of texts made for entertainment within the corpus and the decline in the political scope of the text, this observation is nonetheless in conformity with the transformations of society which had rendered obsolete the message of Dalimil. The overwhelming majority of the Czech texts reflect the progress of vernacularization and the role of “cultural transfers” in the development of national literature. The composition of the different codices is also a reflection of the new place taken by literature in society, in the context of the appearance of the “new publics”, while illustrating the different fates that might befall the text, independently of the aims of its author. Finally, it shows that the process of canonization of the work, capable of competing with the “hits” of European literature, was already very much under way at the beginning of the fifteenth century.
Keywords : Bohemia, Chronicle of Dalimil, Entertainment Literature, Morals, Political Literature, Vernacularization.

 

Guillaume Mora-Dieu 
Guilds and Urban Defence : the Example of Liege

From the beginning of the fourteenth century, the extraordinary growth of the craftsmen guilds from the city of Liège had a knock-on effect on urban defense : guilds provided new troops for the town’s safety. This new military capacity continued to increase with the extension of the bourgeoisie’s rights to the suburbs in 1343 and 1429, giving the guilds another large pool of potential members. Originally, the armed men of the guilds seem to have been drafted from the old urban ost, which was divided into wards. But unlike these first barely known urban troops, we know a little more about their military privileges and their attire. Over time, the serious shortcomings of the craftsmen guilds with respect to their defensive duties began to reveal themselves, and to remedy this, other defense forces were placed at the forefront during the last two thirds of the fifteenth century. With a manpower equivalent to that of the guilds of the largest cities in Flanders at this time, the guilds of Liège and their militias seem to have met a similar fate to their counterparts in these areas.
Keywords : Craftsmen Guilds, Liège (Belgium), War, Policing, Urban Defense, Military Fellowships.

 

Julien Véronèse
The Historian and His Demons

On Several Recent Works on Medieval Demonology

Extrait(s)

Introduction

Anne Rochebouet
Le texte médiéval à l'épreuve du numérique

Depuis les travaux de Roberto Busa qui commença à utiliser, à partir de 1949, le traitement automatique des données pour réaliser entre autres des concordances pour l'œuvre de Thomas d'Aquin1, les humanités seraient désormais devenues, du moins en partie, numériques. Si l'omniprésence du syntagme, ou de son équivalent anglo-saxon digital humanities, dans les projets de recherche comme dans le champ institutionnel de l'enseignement supérieur et de la recherche atteste autant d'une réalité des pratiques que d'un effet de mode, voire d'un certain opportunisme dans un contexte où toute la société est présentée comme en pleine et nécessaire mue numérique, il est indéniable que les dix dernières années ont vu fondamentalement changer le mode d'accès et d'exploitation des données de la recherche. Les études médiévales, quelle que soit leur discipline, ne font pas exception2 et les projets mettant en jeu des outils numériques se sont multipliés, comme les publications sur le sujet.

Face à ce champ en plein essor, l'objectif de la journée d'études qui a eu lieu en juin 2016 à l'Université de Versailles-Saint-Quentin, en partenariat avec l'Université Laval à Québec et avec le labex Patrima, était double. Il s'agissait d'une part de s'inscrire résolument dans une logique pragmatique et technique, en présentant des dispositifs numériques à partir des contraintes et objectifs ayant guidé leur élaboration, de l'autre de se situer dans un dialogue entre les disciplines, mais aussi entre chercheurs et professionnels de la conservation et de l'information. En effet, l'omniprésence aujourd'hui des outils et du medium numériques, tout comme les fortes incitations à les utiliser qui pèsent sur les chercheurs, rendent indispensables l'échange et les retours d'expérience sur les dispositifs techniques adoptés ou mis en place par les uns ou les autres, et ce afin de favoriser leur réutilisation, comme celle des données produites, dans le cadre d'autres projets. Cela est d'autant plus nécessaire que les chercheurs comme leurs équipes ne disposent pas toujours des moyens techniques, humains et/ou financiers pour élaborer de tels outils3.

Pérennité et interopérabilité se veulent donc ici autant techniques (prise en compte et réflexion sur les normes, qui visent à assurer la compatibilité des différents formats et protocoles, mais aussi à garantir l'accès, sur un temps long, aux données produites face à l'évolution des machines et des langages4) que disciplinaires : il s'agit alors pour chacun, dans la mesure du possible, de penser l'exploitation numérique de son objet d'étude de manière à ce qu'il puisse également être utilisé dans le cadre de recherches menées avec des méthodes et des objectifs différents. Les professionnels de la conservation et de l'information qui travaillent dans le monde des archives, des musées et des bibliothèques ont également développé une grande expertise dans ces domaines, qui touchent directement un certain nombre de leurs missions (accès aux collections et aux fonds, valorisation par le développement d'outils de signalement et de recherche, conservation, notamment par la création de supports de substitution). Ils sont ainsi partie prenante de nombreux projets et groupes de réflexion (en particulier sur la constitution de normes internationales), dans une perspective de mise à disposition des collections et d'archivage des données qui n'est pas celle des chercheurs, mais dont ces derniers bénéficient.

C'est ainsi en s'appuyant avant tout sur des études de cas variées, par les corpus étudiés (du point du vue chronologique, géographique, linguistique comme quantitatif), par les méthodes et champs disciplinaires sollicités (histoire, philologie, linguistique, paléographie, littérature, etc.) et enfin par les moyens humains, techniques et financiers mis en œuvre, que ce dossier voudrait croiser les différentes utilisations, pour l'étude et l'exploitation des textes médiévaux, du support numérique comme des outils développés grâce au traitement automatique des données.

Les huit contributions qui vont suivre ont également comme point commun d'être centrées sur l'analyse de données textuelles. Cette limitation au texte, soit à toute « chaîne linguistique [ici] écrite formant une unité communicationnelle »5, explique l'absence de projets relevant du traitement du matériau linguistique pour lui-même (par exemple ceux menés dans le cadre de recherches lexicographiques au sens strict) : c'est ici l'unité textuelle et les analyses qui portent sur cette dernière qui sont mises en jeu, et non l'exploitation de segments linguistiques, utilisés indépendamment de l'ensemble dans lequel ils ont été puisés.

Le choix de se limiter à l'exploitation des textes n'implique pas en revanche que seul le contenu sémantique transmis par ce dernier soit celui envisagé ; la forme et l'inscription du texte sur son support semblent également faire partie, même si c'est souvent de manière secondaire comme nous le verrons, d'une partie des dispositifs présentés, et au-delà de bon nombre de projets en cours. Ce lien entre le texte et sa matérialité pourrait paraître paradoxal, la numérisation étant par essence une dématérialisation. Force est de constater cependant que la plupart des projets de recherche impliquant un recours au numérique associent textes et images, contenu sémantique et visualisation ou prise en compte du ou des support(s) qui le conserve(nt) et qui l'informe(nt) : il est par exemple rare aujourd'hui de trouver une édition électronique de texte qui ne comporterait pas de renvois aux reproductions numérisées du ou des manuscrit(s) ou document(s) utilisés ; de même, dans le langage XML-TEI6, l'un des plus utilisés actuellement par la communauté scientifique pour les éditions et publications en ligne, les balises servant à décrire la mise en page et la forme du support sont parmi les plus développées7. La présence de l'image ou de la mémoire de la forme originelle du texte doit cependant être diversement interprétée8 : elle est notamment en partie significative de la façon dont le support numérique brouille, pour le lecteur qu'est le chercheur, les différents statuts du texte. En cela, ce support met à l'épreuve notre notion du texte comme les questions que nous lui posons, tout en étant un formidable révélateur de nos choix méthodologiques comme de nos paradigmes épistémologiques, et c'est sur cette labilité, exposée et renforcée par le numérique, que je voudrais m'arrêter ici.

Il n'est pas inutile de rappeler que l'emploi que nous faisons du terme numérique le place à la fois du côté de l'outil (il renvoie alors au traitement automatique, par la machine, de données9) et du côté du medium (moyen d'accès et, via l'écran, d'appréhension et de mise en forme des données). Le Digital Turn ou la « conversion numérique »10 implique ainsi toujours une migration des données qui, avec le développement de l'Internet, s'accompagne très souvent d'une publication, c'est-à-dire de leur mise à disposition, en accès libre ou restreint, sur le Web. Le travail de publication et d'édition en ligne qui en résulte consiste ainsi à traduire le texte, augmenté ou non d'un autre type de contenu, en du code informatique « destiné à être interprété par des systèmes techniques sur lesquels l'éditeur n'a pas de maîtrise »11 ; parmi ce code informatique doivent également figurer des métadonnées, qui identifient et décrivent, pour la machine, ce qui a été codé. Le producteur de texte ainsi numérisé, que ce dernier soit ensuite destiné à une lecture linéaire ou à une consultation par l'intermédiaire d'une base de données, est donc aussi et avant tout un méta-éditeur, c'est-à-dire qu'il ne fixe plus la forme du texte12 qu'il publie ou établit, mais lui donne une place dans un système de référencement en programmant les outils informatiques qui lui donneront forme à sa place. Cela est d'autant plus vrai à l'heure du Web sémantique, parfois appelé Web 3.0, où le lien est fait directement entre les données, et non plus entre les pages.

Dans le cas des textes médiévaux, les données de départ qui sont ainsi converties ont des statuts très différents, qu'uniformisent cependant une fois sur l'écran à la fois le manque de métadonnées (ou l'inadéquation de certains champs communément utilisés) et la mise en forme, souvent standardisée, appliquée par les logiciels, et notamment les logiciels de gestion de contenu13. Une édition critique de la seconde moitié du xixe siècle, tombée dans le domaine public et accessible via de grandes plate-formes de numérisation comme archive.org, n'obéit pas aux mêmes objectifs ni à la même méthodologie que la transcription directement effectuée sur un seul témoin dans le cadre d'un projet de recherche (ou d'une opération de crowdsourcing14), ou encore que l'océrisation15 d'une édition imprimée du xvie ou du xviiie siècle, numérisée en mode image et disponible sur Gallica. Le numérique brouille ainsi, bien davantage que la publication papier, la distinction entre transcription de travail, fac-similé et édition critique - quels que soient les critères méthodologiques qui guident cette dernière.

Mais cette labilité de statut du texte numérique ne relève pas d'une simple problématique de critique des sources, bien connue par ailleurs des médiévistes16. L'inventaire rapide, dressé plus haut, des différentes opérations que nécessite l'utilisation de données textuelles numériques (et qui conditionnent en partie l'exploitation qui peut en être faite) permet de voir que la difficulté est renforcée par les spécificités du medium numérique. Notre appréhension des textes y est en effet guidée par une double illusion mimétique, celle de l'écran et celle de la machine. Comme le soulignent nombre de travaux des sciences de l'information et de la communication, l'écran, notamment par l'usage extensif qu'il fait désormais de l'image17, est considéré implicitement comme garantissant un accès direct, non médié, entre l'utilisateur et les données, par exemple ici le manuscrit ; la machine quant à elle est perçue comme gage d'une « objectivité computationnelle »18 : instrument mécanique, elle apparaît comme un moyen d'appréhension neutre et objectif de ces mêmes données. Or toute migration de support implique une opération de transposition, qui ne peut être blanche, mais s'appuie au contraire sur une série de choix, et donc d'interprétations.

À ces illusions mimétiques, largement impensées, s'ajoute le poids des pratiques, qu'il ne faut pas négliger, car elles encouragent des usages en créant des horizons d'attente formels comme intellectuels. C'est ainsi d'abord comme formidable démultiplicateur d'accès libre et ouvert aux collections, aux fonds, et donc aux documents et aux objets qu'a été et qu'est toujours utilisé le numérique par les institutions de conservation : elles ont ainsi particulièrement développé, dans la dernière décennie notamment19, la numérisation de leurs collections (entendue ici comme la migration vers un support numérique permettant une visualisation en mode image, accompagnée d'un référencement et/ou d'un balisage plus ou moins fin). C'est en partie dans la suite de ce mouvement que les projets utilisant le numérique intègrent très souvent dans leurs objectifs premiers de donner accès aux document « primaires » sur lesquels sont basées leurs recherches. Cette problématique d'accès aux documents et aux sources entraîne un recours massif, mais finalement peu interrogé, à des types de traitement et de présentation perçus comme descriptifs ou documentaires, et à une appréhension du numérique et de l'Internet comme lieu de dépôt de données qui seraient, comme on l'a vu, non médiées. C'est ainsi une sorte de culture, visuelle et intellectuelle, du fac-similé qui est pour l'instant prégnante dans les projets numériques aux dépens de la réflexion sur les différents statuts du texte par rapport au document ou l'objet qui le contient. En s'appuyant ainsi sur l'idée que le passage au numérique est une opération neutre, favorisée par une forme de mimétisme technique (la reprise sans l'interroger du protocole technique proposé par un autre projet), c'est alors l'importance des choix effectués par tout transcripteur ou éditeur qu'on risque de gommer, comme la différence entre le texte, l'œuvre et le (ou les) documents.

C'est entre autres ce que souligne Frédéric Duval dans sa synthèse sur les pratiques actuelles de l'édition de textes numérique, qui ouvre le dossier. Dans le cas des éditions de textes médiévaux français, auxquels il se limite ici, il montre ainsi que c'est l'édition de type documentaire, celle qui veut donner accès à un témoin (document) et non au texte ou à l'œuvre (work), qui est pour l'instant largement répandue.

Les sept contributions qui suivent présentent des retours d'expérience sur des projets en cours ainsi que sur les outils informatiques développés ou adoptés dans leur cadre, comme sur les perspectives offertes par ces derniers. Du côté des outils conçus à partir d'éditions de texte nativement numériques ou de textes numérisés, c'est d'abord la gestion des données prosopographiques qui retient Graziella Pastore : à partir d'un corpus restreint, tiré de l'édition électronique d'une compilation juridique en français médiéval, le Livre de jostice et de plet, elle détaille comment constituer une base de données avec le logiciel libre Omeka. C'est également sur les entités nommées (personnages, institutions, lieux) que porte le travail de Sergio Torres Aguilar, qui, par l'automatisation de leur identification à l'intérieur des chartes latines préalablement numérisées au sein du Corpus Burgundiae Medii Aevi, vise à créer un outil d'interrogation, et au-delà de structuration de telles bases, tout en prenant en compte la spécificité des documents médiévaux et des questionnements qui leur sont appliqués. La confrontation de la machine aux manuscrits médiévaux est de même au centre du projet HIMANIS (HIstorical MANuscript Indexing for user-controlled Search) présenté ici par Dominique Stutzmann, Sébastien Hamel et Jean-François Moufflet ; l'objectif en est d'indexer les registres de la chancellerie royale française (1302-1483) conservés aux Archives nationales à partir des images numérisées des manuscrits, mais aussi des index et éditions imprimées existantes. Il s'agit autant de réfléchir à la manière pour la machine d'« apprendre » à déchiffrer des manuscrits qu'à la façon de donner accès aux données produites en fonction d'un modèle interprétatif pertinent. La gestion des données massives, les big datas, sont ainsi la toile de fond de ces différents projets.

Les contributions de Xavier-Laurent Salvador et Thibault Clerice présentent quant à elles deux types différents de gestionnaires de contenu numérique, en s'interrogeant notamment sur la modélisation et la structuration, permises par ce biais, des données textuelles. À partir de l'exemple de la Bible historiale de Guyart des Moulins, première traduction intégrale commentée en prose française médiévale, Xavier-Laurent Salvador décrit le principe de fonctionnement d'Isilex, outil de saisie et de mise en ligne de corpus automatisés couplant XML et logique REST XQuery. Thibault Clerice expose de son côté les différentes fonctionnalités de CapiTainS, outil qui fournit un ensemble de service et d'interfaces pour l'exploitation des publications numériques et de leurs données.

Les projets présentés peuvent enfin entrer dans la logique cumulative et collaborative de la plate-forme ou du portail dont l'objectif est de structurer des informations de statut et de types variés, réunies petit à petit, pour mieux appréhender les corpus d'études ainsi constitués. Anne Salamon fait la genèse de la mise au point du portail H(istoires) U(niverselles) 15, qui doit permettre d'étudier les histoires universelles du xve siècle, corpus historique de langue française particulièrement difficile d'accès du fait de sa taille mais aussi du caractère inédit et mal connu de la plupart des textes concernés. Davide Gherdevich expose de son côté le fonctionnement du site collaboratif POLIMA (POuvoirs de la LIste au Moyen Âge), basé sur MediaWiki et Semantic MediaWiki, qui vise à la fois à créer un corpus de travail et un moyen d'interroger, dans une perspective interdisciplinaire, ce dernier.

Tous ces projets interrogent les possibilités et les contraintes générées par le traitement numérique des données textuelles médiévales. Au-delà de l'intérêt spécifique de chaque étude de cas, leur réunion dans ce dossier thématique a enfin pour objectif de dépasser la simple revue des pratiques pour appréhender ce que le numérique fait au texte médiéval, ou, pour le dire autrement, comment les usages numériques actuels guident et influencent notre appréhension de ces textes comme de leurs supports, et informent donc en partie les questions que nous leur posons par le biais de ces dispositifs numériques.

Médiévales
Langue Textes Histoire

Abonnement

  Version papier (hors frais d'envoi)Version numérique
Abonnement d'un an28.00 €Ajouter au panier
Abonnement de 2 ans56.00 €Ajouter au panier

Présentation

Médiévales paraît deux fois par an.
Langue de rédaction des articles : français

La revue, créée en 1982, entend rester un lieu de rencontre entre des médiévistes de générations et d'origines diverses. Sur des thèmes successifs elle présente des points de vue et des écritures venant d'horizons disciplinaires variés. Par là elle ouvre notre curiosité et rénove notre connaissance du Moyen Âge.

This journal means to remain a meeting place for medievalists of different generations and backgrounds. It presents points of view on recurring themes and studies from varied disciplines. It opens our curiosity and renews our knowledge of the Middle Ages.

Directrice de la rédaction : Laurence Moulinier-Brogi - Rédacteurs en chef : Danièle Sansy et Christopher Lucken - Comité de rédaction : Didier Boisseuil - Nathalie Bouloux - Boris Bove - Alban Gautier - Stéphane Gioanni - Didier Lett - Fanny Madeline - Marilyn Nicoud - Mireille Séguy - Malcom Walsby - Nicolas Weill-Parot.


Revue soutenue par l'Institut des Sciences Humaines et Sociales du CNRS.