L’unité des humanités numériques : mythe ou réalité ?

La journée d’études inaugurale  du laboratoire junior Nhumerisme de l’Ecole normale supérieure de Lyon  intitulée « la Tour de Babel numérique » s’est tenue le 15 octobre 2013. Ce fut un véritable moment d’échanges et de réflexion autour des humanités numériques. La diversités des interventions nous a montré à quel point l’unité des humanités numériques peut être un leurre…

Les humanités numériques mal nommées

Milad Doueihi  (Université de Laval, Québec) et Frank Girard (ENSSIB, Villeurbanne) partent d’un constat : l’expression même d’humanités numériques est mal choisi.

Le mot d’humanités est pris dans un sens catégoriel : l’ensemble des disciplines des Sciences humaines et sociales.

Le numérique est pris dans un sens différent que ce qu’il définit : le nombre, la masse infinie de données. Il s’agit ici de la dématérialisation de données par le bais des outils informatiques.

Les humanités numériques définiraient donc le processus de digitalisation des sciences humaines et sociales. la définition élude en revanche la réflexivité et les transformations qui s’opèrent par le numérique dans le champ de la Recherche : la technicisation des pratiques d’écriture et de traitement des données. Il conviendrait selon Milad Doueihi de ne plus parler d’humanités numériques mais d’humanisme numérique. En effet, le recours au numérique est uniquement pensé en terme d’instrumentalisation, mais pas en terme de culture. Le numérique modifie radicalement notre rapport au temps, à l’espace et au monde.. Cette conversion numérique, déjà actée dans les usages n’est que rarement pensée sur le plan méthodologique.  Elle n’estompe pas non plus le cloisonnement des champs disciplinaires,  même si le numérique favorise l’établissement de passerelles entre les sciences humaines et sociales sur des objets de recherche communs. Il y a un assujettissement de la technique à la Discipline.

Voir la vidéo de Milad Doueihi

Deux projets différents, deux pratiques distinctes

La présentation des projet Symogih initié en 2007 et dirigé par Francesco Beretta ( CNRS – LARHRA ) et du logiciel Arcane élaboré par Eric Olivier Lochard (Université Montpellier 3) montrent deux logiques différentes dans l’utilisation du numérique. Symogih (Système de Gestion de l’information historique) d’abord a une double finalité

d’une part, mettre au point un système de stockage informatique de l’information historique, à la fois ouvert et collectif, indépendant de la période étudiée ; d’autre part, tirer profit des logiciels existants, si possible gratuits et open source, afin d’exploiter et d’analyser les données récoltées en leur appliquant des outils de cartographie, d’analyse des réseaux, de statistique, d’analyse factorielle, etc.

Les utilisateurs contribuent collectivement à l’élaboration des types d’information et saisissent sur une appli web leurs propres données. A chaque information, une identifiant est créé que l’on peut mettre en relation avec d’autres informations selon des types définis. Les utilisateurs doivent donc connaitre un minimum les architectures de bases de données ( ici le système MERISE), les modélisation des données et éventuellement les opérations d’extractions de données pour exploiter leurs ressources.  Simogyh vise sur l’effet cumulatif pour produire une masse critique d’informations éventuellement réutilisables (biographies, événements)  par la communauté des utilisateurs, une quarantaine actuellement (dont ma pomme). Symogih se veut une plateforme intégrée aux pratiques de recherche des utilisateurs, un outil du quotidien, en évolution constante selon les besoins de la Communauté.

Le logiciel Arcane suit un autre principe et n’est pas une base de données mais un logiciel d’édition.  Arcane est un pionnier en France. Créé en 1996, il avait pour but de donner proposer une alternative à l’éditeur de texte Word.  Le téléchargement doit se faire sur l’ordinateur du chercheur. Arcane efface volontairement toute implication de l’utilisateur en informatique. Les connaissances techniques sont restreintes pour l’utilisateur, lequel importe ses données ( textuelles)  et peut les exploiter de plusieurs manière : lexicométrique, textométrique, cartographique et statistiques.

Antony McKenna (Université de Sant-Etienne) donna un aperçu de l’étendue des possibilités d’Arcane avec la correspondance de Pierre Bayle éditée sous format papier (via un éditeur TEX) et une mise en ligne (par XML-TEI et et un CMS de type SPIP), la mise en relation des réseaux de correspondants. Contrairement à Symogih, la communication sur l’existence d’Arcane est restreinte. Le logiciel n’est pas distribué de façon massive, mais au compte-goutte en dépit d’avantages indéniables.

Il s’agit de deux visions différentes des rapports du chercheur au numérique. Pour Francesco Beretta, le chercheur doit s’impliquer dans le numérique et s’implique dans un démarche de travail collaboratif. Cette implication, lui apporte en dépit de moments difficiles dans la prise en main, des compétences informatiques et numériques ( encodage, exploitation de données, édition web) qu’il peut valoriser dans le cadre de ses activités et de son cursus. Arcane au contraire propose une solution clé en main où les compétences requises pour sa manipulation sont minimes.

Questionnements

Mais la tour de Babel des humanités numériques n’est-elle pas déjà un entre-soi, une élite de chercheurs utilisant les outils pour leur propre compte, bref une praxis hermétique du fait des compétences à acquérir ?

Le numérique est un savoir-écrire un prolongement de la civilisation du livre : que ce soit du code ou du texte, des pratiques rédactionnelles sont requises pour intégrer le numérique à son travail de recherche. Pour Franck Girard, c’est là un enjeu majeur pour la Recherche en France : former son personnel au numérique.

Ce medium qu’est l’écran, doit aussi amener à une réflexivité, une « scénarisation technique » dans le champ de nos disciplines. Le chercheur doit opérer des choix d’outils utiles à son travail et le résultat envisagé. Christine Beaugrand ( Ecole nationale supérieur des beaux-arts, Lyon) nous a ainsi fait part du peu de réflexion fait par les artistes autour des médias numériques. A travers le groupe DatAData, elle essaie de faire réfléchir artistes et étudiants en arts sur l’apport et les usages possibles des médias numériques. Ces médias sont pourtant ce qui lie entre eux des pratiques et des disciplines, mais nous pouvons envisager bien plus.

Tout cela conduit à parler d’une acculturation nécessaire du chercheur. Abandonner progressivement, sans les renier, les oripeaux de la culture du livre pour la culture numérique fondée sur l’ouverture des données et les expériences collaboratives d’écriture, de pratiques. Il ne s’agit pas d’imposer des pratiques, mais de les adapter à la révolution technologique en cours C’est l’humanisme numérique pour lequel plaide Milad Doueihi. Le numérique modifie notre rapport au temps à l’espace et à nous même selon un idéal d’ouverture, de partage. C’est in fine le but de la Recherche : concourir au progrès des sciences et à l’intérêt commun.

Le laboratoire junior Nhumerisme réfléchira au cours des prochains mois sur les pratiques numériques en matière de recherche. Des journées d’études et des ateliers seront organisés au cours de l’année universitaire.

Publicités

Une soutenance, un travail, un doctorat

Le jury à l'issue de la délibération. Cliché : Thierry Faure David-Nillet

Le jury rend sa délibération.
Cliché : Thierry Faure David-Nillet

J’ai soutenu ma thèse de doctorat en histoire ce lundi 8 juillet 2013.

Mon sujet consistait à donner l’édition critique de la correspondance de Jacob Spon (1647-1685). J’ai rendu un travail inachevé, en raison du délais que m’imposait une dernière année d’inscription en doctorat… Le temps béni des thèses interminables est révolu.

J’ai débuté mon doctorat en octobre 2007 quasiment en autodidacte du point de vue de la méthodologie. A l’époque, je n’imaginais pas l’ampleur qu’allait prendre ce travail. Je suis parti fleur au fusil dans une édition critique qui prend des années. Au fur et à mesure des années, la correspondance s’est étendue. Mon corpus s’est élargi à 425 lettres que j’ai totalement retranscrit en format doc. ce qui représente environ une saisie de plus de 700 pages.

J’ai péché sur plusieurs points. J’aurais du envisager dès les premiers mois une saisie systématique sur un logiciel dédié à l’édition de correspondance de type ARCANE. A l’époque, je n’étais pas autant impliqué qu’aujourd’hui dans les outils numériques, d’autant plus que les digital humanities n’étaient pas aussi développées.

Sous la pression du temps qui coulait, j’ai entrepris, trop tardivement, la rédaction d’une introduction de 75 pages que j’ai achevé  en février 2013. J’ai mis trois mois à l’écrire, ce qui est un délai court, trop court. J’ai péché par un manque de relecture ce qui m’a été reproché, tout autant que l’exploitation approfondie du corpus. J’ai tout de même expliqué les conditions dans lesquelles je l’ai rédigé : une activité professionnelle accaparant mon temps, et l’impossibilité de pousser mon inscription en doctorat pour une 7e année. Sans ces contraintes, j’aurais pu rédiger une véritable étude fondée sur une analyse des données par le biais d’outils numériques. J’ai frustré le jury sur cette introduction car elle ne présentait que trop brièvement, en 77 pages, les thèmes, les enjeux, les informations de cette édition critique.

L’autre point reproché, justifié, est celui de mon trop grand respect du texte. Une édition critique n’est pas une édition philologique. Les choix d’édition doivent viser la clarté et la cohérence. Ma cohérence fut de ne pas avoir biffé le texte par l’ajout d’une ponctuation adéquate, la modification de certains mots en français contemporain (surtout sur l’accentuation)… Autant de défauts qui ont agacé deux membres du jury.

Enfin, on m’a reproché dans le corpus critique la surabondance de détails inutiles : j’ai trop précisé certains points, sans compter certaines formules maladroites dans la rédaction de notices.

Aucun reproche ne m’a été fait sur le fond de ma thèse que j’ai rédigé en introduction, ce qui me conforte sur le solidité scientifique de ma problématique et des réponses que j’ai apporté.

En dépit de ces faiblesses, le jury a souligné l’importance du travail rendu : 912 pages au total, en cinq années sur un sujet aussi vaste mérite le respect. Mon travail constitue ainsi une « oeuvre majeure » dans l’Histoire de la République des Lettres, et permet de mieux en comprendre son fonctionnement. J’ai ainsi matière à développer son étude dans la rédaction d’un ouvrage de fond adossé à une édition critique qui en soit vraiment une. Je pourrais donc, une fois l’oeuvre approfondie et les erreurs corrigées, soumettre ce corpus à édition aux éditions Honoré Champion. Je ne renonce pas non plus à donner une édition électronique en accès ouvert pour le bénéfice des chercheurs et des curieux.

Je suis donc docteur « très honorable ».  Comme je n’ai pas d’ambition dans l’enseignement universitaire en Histoire (j’enseigne et forme à l’Université sur une autre matière), j’espère mettre à profit ce doctorat dans d’autres projets, articulant Histoire et Nouvelles Technologies, pourquoi pas dans les Humanités numériques ?

Je donnerai d’autres articles sur les leçons de cette soutenance et le fonds de mon sujet.

Les Lettres de Pierre Bayle : un exemple d’édition électronique

L’Institut Claude Longeon de l’Université de Saint Etienne, a publié en ligne avec le concours de l’Institut d’Histoire de la Pensée Classique (regroupant au sein de l’UMR 5037 des équipes de l’Université Clermont-Ferrand II, de l’Université Lyon II et de l’ École Normale Supérieure de Lyon) une partie de la correspondance du journaliste et philosophe protestant Pierre Bayle (1647-1705).

La publication de cette correspondance intervient alors que s’opère une révision complète de la philosophie et de l’oeuvre de Pierre Bayle dans le sillage d’Elizabeth Labrousse et d’Hubert Bost. Les travaux de Gianluca Mori, Gianni Paganini et d’Antony McKenna ont renouvelé l’image d’un des grands observateurs et intermédiaire de la République des Lettres, alors que s’opère la crise de conscience européenne et l’avènement du rationalisme dans tous les domaines d’études. Cette correspondance permet aussi de rattacher Bayle à un réseau spécifique de correspondants en rapport avec ses activités intellectuelles. La correspondance de Bayle a le mérite de redonner à Bayle sa qualité d’intellectuel Protestant et de s’éloigner quelque peu de l’image du philosophe pyrrhonien causée par la publication du Dictionnaire historique et critique en 1697.

La version « papier » publiée par la Voltaire Oxford Foundation n’est pas encore achevée. La correspondance de Pierre Bayle compte plus de 1600 Lettres. Le tome IX est paru en février 2012 et court jusqu’à l’année 1696. A ce jour, 1099 lettres ont été publiées sur papier, mais seules 587 lettres sont disponibles sur version électronique.

Le projet de publication de cette correspondance a été initié par Mme Elizabeth Labrousse, décédée en 2001, historienne du protestantisme et spécialiste de Bayle, et M. Antony McKenna, avec la participation de nombreux historiens : Hubert Bost,  Laurence Bergon, Annie Leroux,  Caroline Verdier, Ruth Whelan, Maria-Cristina Pitassi…  La version électronique a été reprisé par M. McKenna, et Mme Fabienne Vial-Bonacci de l’institut Claude Longeon de l’université de Saint-Etienne (CNRS UMR 5037)

Le site propose pour le moment les cinq premiers tomes de l’édition papier. L’élaboration de la correspondance de Bayle a été faire à l’aide du système ARCANE. Il s’agit d’un système d’édition de texte destiné à produire, enrichir et publier d’importants corpus de ressources et de documents multimédias, réunis dans une base de données documentaire xml-compatible. Il a été conçu pour être l’instrument de travail des auteurs sans compétence informatique particulière, en lieu et place des suites logicielles actuelles. Son efficacité s’exprime particulièrement bien dans les domaines.  Les textes ont été encodés selon un balisage spécifique permettant un double travail critique, interne et externe du document. L’encodage du texte sur Arcane a permis de produire une version papier puis une version XML. Le site a été développé sous SPIP, CMS bien connu des universitaires français pour sa facilité d’utilisation.

Le site propose un rattachement du texte encodé à la visualisation en bas de page d’une reproduction du manuscrit ou de la version imprimée par Bayle dans les Nouvelles de la République des Lettres. La rubrique indexation mène à trois index, un glossaire, une bibliographie, et un index des personnes citées dans la correspondance. Une rubrique « médiathèque » permet de visualiser les portraits des correspondants de Pierre Bayle.

Le site de la correspondance de Pierre Bayle est exemplaire pour la clarté de la mise en page, et la concision du travail d’annotation. Nous ne connaissons pas d’équivalent de correspondance en ligne pour les savants du Grand Siècle. On peut toutefois regretter de ne pas bénéficier d’une version encodée du texte comme on le trouve pour d’autres travaux d’édition de textes en ligne.

Actuellement, il existe en France plusieurs projets d’éditions électronique de textes anciens. En littérature une équipe du CELLF ( Centre d’Etude de la Langue et de la Littérature Françaises des XVIIe et XVIIIe siècles – Université Paris IV Sorbonne) édite  l’Astrée d’Honoré d’Urfé. Ce roman pastoral fut un des best sellers de l’aristocratie française au Grand Siècle. L’édition intégrale des oeuvres de Bossuet, de ses joutes théologiques avec le pasteur Ferry, de Metz, à l’Histoire des variations du protestantisme , la numérisation promet de diffuser plus largement ces oeuvres.

On peut distinguer deux sortes d’édition électronique : la numérisation pure et simple d’un document, et l’édition numérique. Pour la numérisation, voyons deux exemples :

La Bibliothèque nationale permet grâce à Gallica de retrouver plus d’1 millions de textes numérisés., On accède librement à l’intégralité de ces textes, généralement libres de droit donc accessibles au plus grand nombre.

Google Livres permet aussi de retrouver ces textes numérisés avec des accès plus restreints, car Google peut numériser des fonds de bibliothèques sous certaines conditions.  On trouve ainsi des références sur telle ou telle édition de Mauriac, par exemple, mais on ne peut pas toujours avoir accès au texte numérisé. L’avantage de Google Livres est le mode recherche dans le texte, qui permet d’aller directement au mot désiré. Sur Gallica, ce mode n’est pas toujours actif.

L’édition numérique s’inscrit dans cette démarche de numérisation, mais va plus loin. Il ne s’agit pas seulement de numériser des documents , il s’agit aussi d’exploiter la masse d’informations qui y est contenue, de la rendre à la fois lisible et visible.

L’édition numérique s’inscrit pleinement dans le cadre des digital humanities : les sciences humaines et sociales numériques. Les digital humanities constituent un ensemble de méthodes de travail, métiers, pratiques, compétences des personnels des organismes de recherche et d’enseignement supérieur qui sont au contact de l’informatisation des données, et de l’édition électronique, etc. Ces méthodes sont avant tout des outils de travail permettant de faire avancée la recherche. Les digital humanities se basent sur des outils informatiques « ouverts » c’est-à-dire des outils libres de droit ou en libre accès. Pour l’édition numérique, la grande majorité des projets se base sur le langage XML langage informatique plus puissant que le HTML puisqu’il permet de créer ses propres balises. l’encodage TEI (Text Encoding Initiative) suit les recommandations du XML  La TEI est un consortium d’acteurs issus de milieux universitaires ou de la recherche en sciences humaines et sociales et linguistique. Créée en 1987, elle a pour but de proposer des normes d’encodage en XML. Les textes transcrits en XML sont ensuite mis en forme selon des feuillets CSS.

Prenons un exemple : le projet Artamène. Artamène ou le Grand Cyrus, écrit par des époux Scudéry est le plus long roman de la langue française avec 13 095 pages dans l’édition originale, publiée entre 1649 et 1653. Une coopération helvéto-américaine a permis de numériser intégralement ce roman, d’en donner une version électronique sous plusieurs formes.

On a donc plusieurs présentations possibles du texte : soit un texte en mode continu c’est-à-dire ne respectant pas la pagination initiale, soit le texte paginé selon l’édition originale avec une image de la page de l’édition d’origine .

Un résumé de chaque partie et à l’intérieur de chaque chapitre est également disponible, de même qu’un outil fort pratique d’agrandissement de police. Le tout est imprimable. Un moteur de recherche permet de localiser un ou plusieurs termes dans le texte.

L’intégralité du texte et des documents sont libres de droit, à condition de citer la source.

D’autres éditions proposent aussi une version régularisée en corrigeant, par exemple des fautes de typographie, ou « corrigée » avec une orthographe moderne.

Pour une version corrigée, les Bibliothèques virtuelles humanistes  met à disposition ce type de travail critique. Ce projet, développé par le CESR (Centre d’Etudes Supérieures de la Renaissance) de l’université de Tours depuis 2002 numérise et diffuse les livres anciens et documents patrimoniaux en rapport avec les activités du CESR. On trouve sur le site des BVH des fac-similés, c’est-à-dire des ouvrages numérisées, une base textuelle, Epistemon qui propose l’édition d’ouvrages en format XML-TEI.

La consultation des textes encodés peut être fait de différentes manières. Un véritable travail philologique complet a été opéré. On peut choisir une visualisation « originale » du texte, avec une orthographe régularisée ou non pour améliorer le confort de lecture, de voir le cas échéant le texte effacé, ou les ajouts mentionnés…

L’édition numérique des oeuvres des BVH s’efforce de respecter au maximum la mise en page de l’édition originale, jusqu’aux marques d’imprimeur.

Pour des projets véritablement historique avec un appareil critique, on peut consulter l’édition en ligne des édits de pacification précédant l’Edit de Nantes, dirigée par Bernard Barbiche et hébergée par l’Ecole nationale des Chartes.

Bien entendu, ces projets sont à but non lucratif puisque élaborés par des organismes universitaires et/ou de recherche à partir de logiciels libres, de formats ouverts. Ces éditions permettent de valoriser et de diffuser le travail de recherche effectué par ces chercheurs, ces enseignants, ces informaticiens, et on aurait tort de s’en priver… Les possibilités offertes par les nouvelles technologies dans le cadre des digital humanities sont donc prometteuses pour tout chercheur, enseignant. La France est en retard par rapport à d’autres pays comme le Royaume-Uni et les Etats-Unis. Tous ces projets nécessitent cependant une réelle implication de tous les acteurs, l’élaboration d’une politique numérique par les établissements en solo ou en collaborations ainsi que des financements pour les équipements et la formation.

[Edit : 18 mars 2015 en suivant les remarques du commentaire de Ednomesor.]

Université d’Eté de la correspondance littéraire à Ferney-Voltaire

La ville de Ferney-Voltaire a inauguré cette année son université d’Eté qui s’est tenue entre le 29 août et le 2 septembre à la mairie. Le thème choisi,  la correspondance littéraire, fut proposé par l’Institut international du livre et de la librairie (2I2L) que dirige M. Philippe Martin, professeur d’histoire moderne à l’Université Lumière Lyon 2, et membre de mon laboratoire, le LARHRA.

Le choix de ce thème n’est pas anodin. On a recensé et publié environ 22 000 lettres écrites par le patriarche de Ferney, Voltaire. Les chercheurs trouvent encore des lettres inédites d’une correspondance qui paraît n’avoir pas de limites.

La municipalité de Ferney a accueilli, de fort belle manière une quarantaine de participants, doctorants et enseignants-chercheurs pour présenter, discuter, et débattre des thèmes de recherche de chacun, où la correspondance épistolaire joue un rôle majeur.

L’étendue et  l’hétérogénéité des disciplines représentées a permis à tous les participants de confronter leurs expériences et leurs points de vue. Les intervenants abordèrent les problèmes de correspondances aussi variées que celles de Voltaire, Marcel Proust ou encore Louis-Ferdinand Céline, François Delsarte, Pierre Fourier, et Natalia Ginzburg.

En filigrane, les communications posaient aussi des questions de méthodes sur lesquelles nous, chercheurs, butons quelques fois. Le devenir de nos travaux donna lieu à quelques présentations de projets de bases de données et d’éditions critiques en ligne comme la correspondance Pierre Bayle dirigée par M. McKenna dont je reparlerai.

J’ai présenté une communication sur Jacob Spon (1647-1685) en tant qu’intermédiaire entre Paris, l’Italie et Genève. J’ai abordé ce que la correspondance de Spon révélait comme contenus permettant de mieux connaître les rapports entre savants dans la République Lettres, et principalement entre ces ensembles géographiques. Le lien entre Spon est Genève était fort. Le médecin lyonnais y fit ses humanités, et y pratiquer sa foi protestante en toute liberté. J’ai aussi évoqué les lacunes de cette correspondance, parfois expurgée à dessein par les héritiers de ces lettres, puis par les conservateurs de bibliothèques au XIXe siècle.

En arrivant à la mairie de Ferney, où se tenait nos sessions, j’ai eu la surprise de constater que les éditions locales Dauphiné Libéré et La Tribune républicaine, me mentionnaient. Je suis intervenu un mardi après-midi après deux interventions de spécialistes voltairistes pour lesquels quelques Ferneysiens s’étaient déplacés. Quant à moi, peut-être que cette citation que j’estime incongrue en considération de mon rang fut le fait que j’évoquais la ville de Genève par ma communication.

Les actes de cette première université d’Eté donneront  lieu à une publication sous la direction de M. Martin. Je mettrai en ligne cet article dès que je l’aurai achevé.

Une visite du château de Ferney où Voltaire passa les vingt dernières années de sa vie a permis à notre assemblée de mieux situer ce village dans l’Europe des Lumières en tant que centre intellectuel. Voltaire sut faire du bourg le centre du parti philosophique en Europe. Il y écrivit ses ouvrages les plus réputés : Candide, Le dictionnaire philosophique ; y mena ses plus belles luttes de plume pour Jean Calas ou le chevalier de la Barre. On mesure mal, si on n’en est pas informé quelle fut l’influence de Voltaire sur le village de Ferney qu’il modela à sa façon.

Je déplore comme le conservateur du château, et quelques uns de mes collègues, l’état de l’intérieur de l’édifice qui mériterait une petite réfection. Les malheureux aménagements réalisés par les propriétaires succédant à Voltaire ont contribué aussi à dénaturer la bâtisse qui devint au XIXe siècle un lieu de pèlerinage pour de nombreux hommes de plume de France et d’Europe.

Ce séjour fut des plus instructifs et fructueux. J’ai rencontré de nombreux collègues doctorants avec lesquels j’ai noué des contacts stimulants. Je remercie M. Martin et la municipalité de Ferney-Voltaire pour leur accueil exceptionnel. Il est rare d’être accueilli aussi confortablement et efficacement lors de colloques scientifiques. Malheureusement, pour raison professionnelle, je ne pus pas assister à l’intégralité du colloque

Gageons que les prochaines éditions de cette université d’Eté seront aussi bonnes que la première.