L’unité des humanités numériques : mythe ou réalité ?

La journée d’études inaugurale  du laboratoire junior Nhumerisme de l’Ecole normale supérieure de Lyon  intitulée « la Tour de Babel numérique » s’est tenue le 15 octobre 2013. Ce fut un véritable moment d’échanges et de réflexion autour des humanités numériques. La diversités des interventions nous a montré à quel point l’unité des humanités numériques peut être un leurre…

Les humanités numériques mal nommées

Milad Doueihi  (Université de Laval, Québec) et Frank Girard (ENSSIB, Villeurbanne) partent d’un constat : l’expression même d’humanités numériques est mal choisi.

Le mot d’humanités est pris dans un sens catégoriel : l’ensemble des disciplines des Sciences humaines et sociales.

Le numérique est pris dans un sens différent que ce qu’il définit : le nombre, la masse infinie de données. Il s’agit ici de la dématérialisation de données par le bais des outils informatiques.

Les humanités numériques définiraient donc le processus de digitalisation des sciences humaines et sociales. la définition élude en revanche la réflexivité et les transformations qui s’opèrent par le numérique dans le champ de la Recherche : la technicisation des pratiques d’écriture et de traitement des données. Il conviendrait selon Milad Doueihi de ne plus parler d’humanités numériques mais d’humanisme numérique. En effet, le recours au numérique est uniquement pensé en terme d’instrumentalisation, mais pas en terme de culture. Le numérique modifie radicalement notre rapport au temps, à l’espace et au monde.. Cette conversion numérique, déjà actée dans les usages n’est que rarement pensée sur le plan méthodologique.  Elle n’estompe pas non plus le cloisonnement des champs disciplinaires,  même si le numérique favorise l’établissement de passerelles entre les sciences humaines et sociales sur des objets de recherche communs. Il y a un assujettissement de la technique à la Discipline.

Voir la vidéo de Milad Doueihi

Deux projets différents, deux pratiques distinctes

La présentation des projet Symogih initié en 2007 et dirigé par Francesco Beretta ( CNRS – LARHRA ) et du logiciel Arcane élaboré par Eric Olivier Lochard (Université Montpellier 3) montrent deux logiques différentes dans l’utilisation du numérique. Symogih (Système de Gestion de l’information historique) d’abord a une double finalité

d’une part, mettre au point un système de stockage informatique de l’information historique, à la fois ouvert et collectif, indépendant de la période étudiée ; d’autre part, tirer profit des logiciels existants, si possible gratuits et open source, afin d’exploiter et d’analyser les données récoltées en leur appliquant des outils de cartographie, d’analyse des réseaux, de statistique, d’analyse factorielle, etc.

Les utilisateurs contribuent collectivement à l’élaboration des types d’information et saisissent sur une appli web leurs propres données. A chaque information, une identifiant est créé que l’on peut mettre en relation avec d’autres informations selon des types définis. Les utilisateurs doivent donc connaitre un minimum les architectures de bases de données ( ici le système MERISE), les modélisation des données et éventuellement les opérations d’extractions de données pour exploiter leurs ressources.  Simogyh vise sur l’effet cumulatif pour produire une masse critique d’informations éventuellement réutilisables (biographies, événements)  par la communauté des utilisateurs, une quarantaine actuellement (dont ma pomme). Symogih se veut une plateforme intégrée aux pratiques de recherche des utilisateurs, un outil du quotidien, en évolution constante selon les besoins de la Communauté.

Le logiciel Arcane suit un autre principe et n’est pas une base de données mais un logiciel d’édition.  Arcane est un pionnier en France. Créé en 1996, il avait pour but de donner proposer une alternative à l’éditeur de texte Word.  Le téléchargement doit se faire sur l’ordinateur du chercheur. Arcane efface volontairement toute implication de l’utilisateur en informatique. Les connaissances techniques sont restreintes pour l’utilisateur, lequel importe ses données ( textuelles)  et peut les exploiter de plusieurs manière : lexicométrique, textométrique, cartographique et statistiques.

Antony McKenna (Université de Sant-Etienne) donna un aperçu de l’étendue des possibilités d’Arcane avec la correspondance de Pierre Bayle éditée sous format papier (via un éditeur TEX) et une mise en ligne (par XML-TEI et et un CMS de type SPIP), la mise en relation des réseaux de correspondants. Contrairement à Symogih, la communication sur l’existence d’Arcane est restreinte. Le logiciel n’est pas distribué de façon massive, mais au compte-goutte en dépit d’avantages indéniables.

Il s’agit de deux visions différentes des rapports du chercheur au numérique. Pour Francesco Beretta, le chercheur doit s’impliquer dans le numérique et s’implique dans un démarche de travail collaboratif. Cette implication, lui apporte en dépit de moments difficiles dans la prise en main, des compétences informatiques et numériques ( encodage, exploitation de données, édition web) qu’il peut valoriser dans le cadre de ses activités et de son cursus. Arcane au contraire propose une solution clé en main où les compétences requises pour sa manipulation sont minimes.

Questionnements

Mais la tour de Babel des humanités numériques n’est-elle pas déjà un entre-soi, une élite de chercheurs utilisant les outils pour leur propre compte, bref une praxis hermétique du fait des compétences à acquérir ?

Le numérique est un savoir-écrire un prolongement de la civilisation du livre : que ce soit du code ou du texte, des pratiques rédactionnelles sont requises pour intégrer le numérique à son travail de recherche. Pour Franck Girard, c’est là un enjeu majeur pour la Recherche en France : former son personnel au numérique.

Ce medium qu’est l’écran, doit aussi amener à une réflexivité, une « scénarisation technique » dans le champ de nos disciplines. Le chercheur doit opérer des choix d’outils utiles à son travail et le résultat envisagé. Christine Beaugrand ( Ecole nationale supérieur des beaux-arts, Lyon) nous a ainsi fait part du peu de réflexion fait par les artistes autour des médias numériques. A travers le groupe DatAData, elle essaie de faire réfléchir artistes et étudiants en arts sur l’apport et les usages possibles des médias numériques. Ces médias sont pourtant ce qui lie entre eux des pratiques et des disciplines, mais nous pouvons envisager bien plus.

Tout cela conduit à parler d’une acculturation nécessaire du chercheur. Abandonner progressivement, sans les renier, les oripeaux de la culture du livre pour la culture numérique fondée sur l’ouverture des données et les expériences collaboratives d’écriture, de pratiques. Il ne s’agit pas d’imposer des pratiques, mais de les adapter à la révolution technologique en cours C’est l’humanisme numérique pour lequel plaide Milad Doueihi. Le numérique modifie notre rapport au temps à l’espace et à nous même selon un idéal d’ouverture, de partage. C’est in fine le but de la Recherche : concourir au progrès des sciences et à l’intérêt commun.

Le laboratoire junior Nhumerisme réfléchira au cours des prochains mois sur les pratiques numériques en matière de recherche. Des journées d’études et des ateliers seront organisés au cours de l’année universitaire.

Les Lettres de Pierre Bayle : un exemple d’édition électronique

L’Institut Claude Longeon de l’Université de Saint Etienne, a publié en ligne avec le concours de l’Institut d’Histoire de la Pensée Classique (regroupant au sein de l’UMR 5037 des équipes de l’Université Clermont-Ferrand II, de l’Université Lyon II et de l’ École Normale Supérieure de Lyon) une partie de la correspondance du journaliste et philosophe protestant Pierre Bayle (1647-1705).

La publication de cette correspondance intervient alors que s’opère une révision complète de la philosophie et de l’oeuvre de Pierre Bayle dans le sillage d’Elizabeth Labrousse et d’Hubert Bost. Les travaux de Gianluca Mori, Gianni Paganini et d’Antony McKenna ont renouvelé l’image d’un des grands observateurs et intermédiaire de la République des Lettres, alors que s’opère la crise de conscience européenne et l’avènement du rationalisme dans tous les domaines d’études. Cette correspondance permet aussi de rattacher Bayle à un réseau spécifique de correspondants en rapport avec ses activités intellectuelles. La correspondance de Bayle a le mérite de redonner à Bayle sa qualité d’intellectuel Protestant et de s’éloigner quelque peu de l’image du philosophe pyrrhonien causée par la publication du Dictionnaire historique et critique en 1697.

La version « papier » publiée par la Voltaire Oxford Foundation n’est pas encore achevée. La correspondance de Pierre Bayle compte plus de 1600 Lettres. Le tome IX est paru en février 2012 et court jusqu’à l’année 1696. A ce jour, 1099 lettres ont été publiées sur papier, mais seules 587 lettres sont disponibles sur version électronique.

Le projet de publication de cette correspondance a été initié par Mme Elizabeth Labrousse, décédée en 2001, historienne du protestantisme et spécialiste de Bayle, et M. Antony McKenna, avec la participation de nombreux historiens : Hubert Bost,  Laurence Bergon, Annie Leroux,  Caroline Verdier, Ruth Whelan, Maria-Cristina Pitassi…  La version électronique a été reprisé par M. McKenna, et Mme Fabienne Vial-Bonacci de l’institut Claude Longeon de l’université de Saint-Etienne (CNRS UMR 5037)

Le site propose pour le moment les cinq premiers tomes de l’édition papier. L’élaboration de la correspondance de Bayle a été faire à l’aide du système ARCANE. Il s’agit d’un système d’édition de texte destiné à produire, enrichir et publier d’importants corpus de ressources et de documents multimédias, réunis dans une base de données documentaire xml-compatible. Il a été conçu pour être l’instrument de travail des auteurs sans compétence informatique particulière, en lieu et place des suites logicielles actuelles. Son efficacité s’exprime particulièrement bien dans les domaines.  Les textes ont été encodés selon un balisage spécifique permettant un double travail critique, interne et externe du document. L’encodage du texte sur Arcane a permis de produire une version papier puis une version XML. Le site a été développé sous SPIP, CMS bien connu des universitaires français pour sa facilité d’utilisation.

Le site propose un rattachement du texte encodé à la visualisation en bas de page d’une reproduction du manuscrit ou de la version imprimée par Bayle dans les Nouvelles de la République des Lettres. La rubrique indexation mène à trois index, un glossaire, une bibliographie, et un index des personnes citées dans la correspondance. Une rubrique « médiathèque » permet de visualiser les portraits des correspondants de Pierre Bayle.

Le site de la correspondance de Pierre Bayle est exemplaire pour la clarté de la mise en page, et la concision du travail d’annotation. Nous ne connaissons pas d’équivalent de correspondance en ligne pour les savants du Grand Siècle. On peut toutefois regretter de ne pas bénéficier d’une version encodée du texte comme on le trouve pour d’autres travaux d’édition de textes en ligne.

Actuellement, il existe en France plusieurs projets d’éditions électronique de textes anciens. En littérature une équipe du CELLF ( Centre d’Etude de la Langue et de la Littérature Françaises des XVIIe et XVIIIe siècles – Université Paris IV Sorbonne) édite  l’Astrée d’Honoré d’Urfé. Ce roman pastoral fut un des best sellers de l’aristocratie française au Grand Siècle. L’édition intégrale des oeuvres de Bossuet, de ses joutes théologiques avec le pasteur Ferry, de Metz, à l’Histoire des variations du protestantisme , la numérisation promet de diffuser plus largement ces oeuvres.

On peut distinguer deux sortes d’édition électronique : la numérisation pure et simple d’un document, et l’édition numérique. Pour la numérisation, voyons deux exemples :

La Bibliothèque nationale permet grâce à Gallica de retrouver plus d’1 millions de textes numérisés., On accède librement à l’intégralité de ces textes, généralement libres de droit donc accessibles au plus grand nombre.

Google Livres permet aussi de retrouver ces textes numérisés avec des accès plus restreints, car Google peut numériser des fonds de bibliothèques sous certaines conditions.  On trouve ainsi des références sur telle ou telle édition de Mauriac, par exemple, mais on ne peut pas toujours avoir accès au texte numérisé. L’avantage de Google Livres est le mode recherche dans le texte, qui permet d’aller directement au mot désiré. Sur Gallica, ce mode n’est pas toujours actif.

L’édition numérique s’inscrit dans cette démarche de numérisation, mais va plus loin. Il ne s’agit pas seulement de numériser des documents , il s’agit aussi d’exploiter la masse d’informations qui y est contenue, de la rendre à la fois lisible et visible.

L’édition numérique s’inscrit pleinement dans le cadre des digital humanities : les sciences humaines et sociales numériques. Les digital humanities constituent un ensemble de méthodes de travail, métiers, pratiques, compétences des personnels des organismes de recherche et d’enseignement supérieur qui sont au contact de l’informatisation des données, et de l’édition électronique, etc. Ces méthodes sont avant tout des outils de travail permettant de faire avancée la recherche. Les digital humanities se basent sur des outils informatiques « ouverts » c’est-à-dire des outils libres de droit ou en libre accès. Pour l’édition numérique, la grande majorité des projets se base sur le langage XML langage informatique plus puissant que le HTML puisqu’il permet de créer ses propres balises. l’encodage TEI (Text Encoding Initiative) suit les recommandations du XML  La TEI est un consortium d’acteurs issus de milieux universitaires ou de la recherche en sciences humaines et sociales et linguistique. Créée en 1987, elle a pour but de proposer des normes d’encodage en XML. Les textes transcrits en XML sont ensuite mis en forme selon des feuillets CSS.

Prenons un exemple : le projet Artamène. Artamène ou le Grand Cyrus, écrit par des époux Scudéry est le plus long roman de la langue française avec 13 095 pages dans l’édition originale, publiée entre 1649 et 1653. Une coopération helvéto-américaine a permis de numériser intégralement ce roman, d’en donner une version électronique sous plusieurs formes.

On a donc plusieurs présentations possibles du texte : soit un texte en mode continu c’est-à-dire ne respectant pas la pagination initiale, soit le texte paginé selon l’édition originale avec une image de la page de l’édition d’origine .

Un résumé de chaque partie et à l’intérieur de chaque chapitre est également disponible, de même qu’un outil fort pratique d’agrandissement de police. Le tout est imprimable. Un moteur de recherche permet de localiser un ou plusieurs termes dans le texte.

L’intégralité du texte et des documents sont libres de droit, à condition de citer la source.

D’autres éditions proposent aussi une version régularisée en corrigeant, par exemple des fautes de typographie, ou « corrigée » avec une orthographe moderne.

Pour une version corrigée, les Bibliothèques virtuelles humanistes  met à disposition ce type de travail critique. Ce projet, développé par le CESR (Centre d’Etudes Supérieures de la Renaissance) de l’université de Tours depuis 2002 numérise et diffuse les livres anciens et documents patrimoniaux en rapport avec les activités du CESR. On trouve sur le site des BVH des fac-similés, c’est-à-dire des ouvrages numérisées, une base textuelle, Epistemon qui propose l’édition d’ouvrages en format XML-TEI.

La consultation des textes encodés peut être fait de différentes manières. Un véritable travail philologique complet a été opéré. On peut choisir une visualisation « originale » du texte, avec une orthographe régularisée ou non pour améliorer le confort de lecture, de voir le cas échéant le texte effacé, ou les ajouts mentionnés…

L’édition numérique des oeuvres des BVH s’efforce de respecter au maximum la mise en page de l’édition originale, jusqu’aux marques d’imprimeur.

Pour des projets véritablement historique avec un appareil critique, on peut consulter l’édition en ligne des édits de pacification précédant l’Edit de Nantes, dirigée par Bernard Barbiche et hébergée par l’Ecole nationale des Chartes.

Bien entendu, ces projets sont à but non lucratif puisque élaborés par des organismes universitaires et/ou de recherche à partir de logiciels libres, de formats ouverts. Ces éditions permettent de valoriser et de diffuser le travail de recherche effectué par ces chercheurs, ces enseignants, ces informaticiens, et on aurait tort de s’en priver… Les possibilités offertes par les nouvelles technologies dans le cadre des digital humanities sont donc prometteuses pour tout chercheur, enseignant. La France est en retard par rapport à d’autres pays comme le Royaume-Uni et les Etats-Unis. Tous ces projets nécessitent cependant une réelle implication de tous les acteurs, l’élaboration d’une politique numérique par les établissements en solo ou en collaborations ainsi que des financements pour les équipements et la formation.

[Edit : 18 mars 2015 en suivant les remarques du commentaire de Ednomesor.]