Réalisations numériques

SITE INTERNET EBALZAC.COM

Édition génétique et hypertextuelle de l’œuvre de Balzac

Ouvert en avril 2017, le site ebalzac.com propose en libre accès une édition électronique d’une version inédite en ligne de La Comédie humaine d’Honoré de Balzac (et à terme de l’œuvre complète de l’auteur), ainsi que des outils d’interrogation textuelle particulièrement innovants dans le domaine des humanités numériques, poursuivant l’objectif d’une valorisation du patrimoine littéraire français. Ce site constitue une première réalisation du projet Phœbus (Projet d’Hypertexte de l’Œuvre de Balzac reposant sur l’Utilisation de Similarités), financé par l’Agence Nationale de la Recherche pour la période 2015-2019, porté par l’équipe ALITHILA de l’Université Lille SHS, sous la direction d’Andrea Del Lungo, en partenariat avec le CELLF (Centre d’Études de la Langue et de la Littérature Françaises) et le LIP6 (Laboratoire d’Informatique de Paris 6) de l’université Paris Sorbonne.


Fig. 1 : Page d’accueil du site eBalzac.com

1. LE PROJET D’ÉDITION HYPERTEXTUELLE

1.1 Caractère innovant de la recherche

Le projet consiste à mettre en résonance l’ensemble de l’œuvre balzacienne (La Comédie humaine, les romans de jeunesse, les contes drolatiques, le théâtre et les œuvres diverses) avec un vaste corpus d’écrits contemporains, à aires culturelles multiples et de nature variée, qui ont pu la nourrir : œuvres romanesques d’autres auteurs de l’époque ; recueils collectifs de littérature panoramique (auxquels Balzac apporta des contributions) ; ouvrages scientifiques susceptibles d’avoir influencé la création balzacienne, notamment dans les domaines de la médecine, de la physiologie et des sciences naturelles. Son objectif est de permettre des recherches et des comparaisons intertextuelles élaborées, à l’intérieur de l’œuvre de Balzac, et dans le corpus plus vaste de textes littéraires et scientifiques de l’époque, entre 1800 et 1850, afin de faire émerger des correspondances, de repérer des emprunts, des citations, des reprises, des plagiats éventuels, et de constituer ainsi une cartographie de l’univers intellectuel de Balzac à partir des traces que d’autres textes ont laissées dans l’œuvre.

La finalité du projet est donc de réaliser un objet scientifique nouveau en termes de méthode et de corpus : une édition génétique et hypertextuelle de Balzac, que personne n’a encore procurée à ce jour, comprenant une bibliothèque virtuelle constituée d’ouvrages qui appartenaient à son univers intellectuel. Il va sans dire qu’une fois testée sur Balzac, cette approche pourra être généralisée à bien d’autres auteurs du patrimoine.

1.2 Objectifs et méthodologie

Le projet, qui relève des humanités numériques, vise à fournir aux chercheurs en littérature et sciences humaines de nouveaux outils d’interrogation de vastes corpus textuels, susceptibles de permettre une connaissance approfondie de phénomènes génétiques, poétiques, stylistiques, ainsi que leurs implications en termes idéologiques. Du point de vue de la méthodologie littéraire, il se situe dans le domaine de l’intertextualité, de l’interdiscursivité et de la génétique de l’imprimé, auquel le corpus balzacien offre un champ d’application particulièrement fécond : Balzac a la spécificité de multiplier les supports d’écriture (livres, volumes collectifs, feuilletons, articles de journal), en réutilisant ses textes antérieurs ; en même temps, son œuvre, qui définit par son ampleur l’état socio-historique contemporain, se nourrit de l’apport d’autres textes (notamment ceux de la littérature panoramique), et intègre diverses formes de savoir qui dépassent le champ littéraire. Au terme de ce projet, on sera en mesure de cartographier les sources que Balzac a utilisées au cours de l’écriture des différents romans de La Comédie humaine.

Au niveau de l’informatique, dans le cadre d’une recherche sur les méthodes d’exploitation de vastes corpus textuels qui se pose aujourd’hui comme une nécessité, notre projet vise à mettre à profit les techniques algorithmiques contemporaines pour explorer systématiquement les réseaux de réutilisations textuelles. L’étude porte donc sur la mise en évidence automatique de réseaux de segments textuels présents à l’intérieur d’une œuvre d’un auteur et provenant de l’ensemble de l’œuvre de cet auteur et d’un corpus contemporain plus large. Nous souhaitons, dans ce projet, utiliser ces techniques pour fabriquer un prototype informatique de repérage de réemplois pour l’analyse intertextuelle, qui fournira aux chercheurs une méthode originale d’interrogation de très vastes corpus textuels.

1.3 Hypothèses de recherche

Ce projet ne se restreint pas à l’exploitation, à la mise en valeur ou à la numérisation d’un corpus. L’originalité de son approche numérique tient au caractère systématique d’une investigation opérée sur des quantités considérables de textes qu’il eût été impossible d’exploiter manuellement. Outre l’apport théorique aux études littéraires, le projet Phœbus se propose à la fois de concevoir des algorithmes de détection des réutilisations, de les tester en confrontant l’œuvre de Balzac à celle d’auteurs qu’il lisait, qu’il s’agisse d’écrivains ou de scientifiques, puis, enfin, de concevoir une édition hypertextuelle de Balzac qui tire profit de ces travaux. Les aspects novateurs du projet, ainsi que les verrous scientifiques et techniques à lever, peuvent être résumés en trois points :

  • La mise au point d’algorithmes de repérage des réutilisations et des réemplois opérant sur de très grandes masses de textes. Cela reprend, en les généralisant, les principes de la détection de plagiat. Pour cela, on fait appel à des techniques de traitement automatique de la langue, en particulier à la lemmatisation, à la racinisation et à l’étiquetage syntaxique, ainsi qu’à des techniques de recherche d’information. Réalisés par les informaticiens du LIP6, ces algorithmes originaux seront mis à l’épreuve sur des corpus connus où les réutilisations ont déjà été repérées, comme par exemple, les réutilisations de Gautier par Balzac.
  • La conception d’un hypertexte dans lequel les liens matérialisent les jeux d’influences induits à partir de la détection automatique d’homologies. Les différentes opérations de réécriture pourront ainsi être classées et évaluées de manière à différencier, par exemple, les réemplois avoués (citations) de ceux qui restent inavoués (influences, plagiats), ou encore les reprises identiques (sans variations textuelles) des reprises réélaborées. De ce point de vue, un verrou scientifique à lever concerne la détection des réemplois qui s’éloignent le plus du texte source, comme dans le cas de l’allusion ; or, la collaboration entre littéraires et informaticiens est précisément censée permettre une analyse permanente des résultats en vue d’une amélioration des aspects algorithmiques, de manière à rendre sensible le logiciel à des homologies plus complexes que la simple identité lexicale, fondées sur des critères syntaxiques (emplacement dans la phrase) ou sémantiques (appartenance à un même champ lexical).
  • Enfin, au niveau de la théorie littéraire, les travaux sur l’intertextualité, conduits en France à partir des années 1960, seront étendus par l’emploi de techniques de traitement automatiques de la langue naturelle et de fouille de données, donnant naissance à de nouvelles « technologies de l’intellect ». Plus généralement, ce projet s’inscrit dans une réflexion épistémologique transdisciplinaire entre les études littéraires et l’intelligence artificielle qui propose de renouveler les sciences de l’interprétation des textes grâce à la numérisation des contenus et aux opérateurs de traitement associées.

1.4 Programme de travail et résultats

Le produit final du projet consiste en la création d’une édition génétique et hypertextuelle de l’œuvre de Balzac. Cette création passe par deux étapes qui résument la double avancée visée.

La première consiste à fabriquer un prototype informatique de repérage de réemplois pour l’analyse intertextuelle, qui fournira aux chercheurs une méthode originale d’interrogation de très vastes corpus textuels. Si le pari ambitieux du projet était tenu, cette méthode pourrait améliorer de manière sensible la recherche telle qu’elle se pratique actuellement, à l’aide de moteurs de recherche lexicaux, de concordanciers ou de requêtes booléennes ; l’équipement intellectuel des chercheurs en serait ainsi accru, car les moyens techniques mis en œuvre permettraient d’obtenir des résultats plus rapides et plus nombreux que ceux qui ont été obtenus grâce à des moyens empiriques par les nombreux érudits qui, depuis plus d’un siècle et demi, ont contribué à constituer un corpus critique balzacien.

La deuxième étape est la création de l’édition hypertextuelle, qui donnerait accès d’une part à une bibliothèque virtuelle constituée par adjonctions successives à partir d’un corpus minimal ; d’autre part, elle permettrait à l’utilisateur, sur la base des interférences ou résonances entre les textes, de circuler dans la bibliothèque et de la visualiser de manière globale. Cette édition sera accessible dans un site dédié (bien évidemment en libre accès), présentant quatre manières d’utilisation :

  • une visualisation au niveau générale des œuvres qui mettra en évidence les liens entre textes qui présentent des homologies significatives entre eux. Cette visualisation fera appel à des outils de visualisation de graphes comme Gephi qui a été originellement conçu au LIP6 ;
  • une visualisation au niveau d’une paire d’œuvres qui soulignera, sur un diagramme croisé, les zones de réemploi. Notons que l’on passe du premier niveau au second en cliquant sur n’importe quel lien du graphe ;
  • un déroulement linéaire des textes permettant d’accéder, grâce au logiciel MEDITE développé dans l’équipe du LIP6, à la comparaison entre textes sources et textes cibles, par un système de double fenestrage. Ce procédé met en évidence l’ensemble des homologies et, sur chacune d’entre elles, les transformations qui ont pu être opérées (déplacements, suppressions, insertions, remplacement) ;
  • la lecture intégrale d’une œuvre de Balzac, en « feuilletant » un texte dont les parties qui présentent des homologies avec d’autres textes seraient signalées.

Le site ebalzac.com, décrit au point suivant, présente un premier état de cette édition.

2. VALORISATION DES RÉSULTATS ET IMPACT

2.1 Description du site eBalzac.com

La création du site eBalzac.com, en avril 2017, a constitué l’occasion de définir un élargissement considérable du périmètre du projet Phœbus, rendu possible par le financement de l’ANR et par le travail d’un doctorant en informatique et de deux post-doctorants en littérature affectés au projet. La synergie avec le Labex Obvil (Observatoire de la Vie Littéraire, Sorbonne Universités), pionnier dans le domaine des humanités numériques) a été également précieuse.

En effet, dans le but de créer une édition exhaustive de l’œuvre, il a été décidé d’intégrer à ce site un volet sur l’histoire du texte balzacien, qui consiste à numériser et à rendre accessibles en ligne tous les états imprimés des textes, publiés du vivant de l’auteur, afin de permettre leur comparaison avec le texte de référence que constitue l’édition dite « Furne corrigé ». L’objectif du site est donc double : d’une part, rendre accessibles un grand nombre d’éditions qui ne sont pas à ce jour numérisées (notamment celles en feuilleton) ; d’autre part, résoudre le problème du relevé de variantes au moyen d’un outil de comparaison entre deux états du texte qui permet de repérer visuellement quatre types de variation textuelle : ajouts, suppressions, remplacements, déplacements. Pour ce faire, nous avons eu recours au logiciel d’alignement textuel MEDITE, développé par l’équipe du LIP6 partenaire du projet et par l’ITEM (Institut des Textes et Manuscrits Modernes, Paris), qui est déjà opérationnel et que nous avons pu récemment améliorer, de manière à ce qu’il puisse fonctionner avec des textes encodés en TEI.


Fig. 2 : Première édition numérique des Petites Misères de la vie conjugale illustrées par Bertall (Paris, Chlendowski, 1846. Un vol. in-8º) donnant accès au fac-similé de l’ouvrage


Ce projet sur les variantes avait été initialement conçu dans un cadre commercial, et destiné à une base de données en ligne de l’éditeur Classiques Garnier, comme complément à une édition papier de La Comédie humaine, avec accès payant réservé uniquement aux institutions. Soucieux comme nous le sommes de poursuivre une logique de libre accès, nous avons décidé avec l’accord de l’éditeur de reprendre entièrement la direction du projet dans le cadre du site eBalzac, naturellement avec un accès gratuit.

Le site eBalzac, outre l’accueil et la description du projet, comporte trois grandes rubriques :

  • Édition
    Cette partie propose une édition électronique de l’œuvre de Balzac, à commencer par La Comédie humaine, dans une version inédite en ligne et philologiquement exacte, qui intègre les corrections apportées par Balzac sur son exemplaire personnel et qui corrige de nombreuses éditions antérieures se basant sur ce dernier état du texte. L’entrée dans les textes se fait suivant trois critères au choix de l’utilisateur, via des menus déroulants : plan de l’œuvre, ordre chronologique, ordre alphabétique. L’ensemble du site a été conçu graphiquement avec une séparation verticale au centre qui mime la page du livre et qui permet surtout d’articuler deux espaces en vis-à-vis : dans l’édition, la colonne de droite est consacrée au texte numérisé, et la colonne de gauche à l’ouverture (en cliquant sur le numéro de la page) en mode image de la page du support d’origine (dans ce cas, l’exemplaire personnel de l’édition Furne, présentant les corrections de la main de Balzac). L’édition est multiformat, et donne notamment la possibilité de télécharger les textes en ePub.

Fig. 3 : Exemple de l’affichage de l’édition électronique du Furne corrigé, Modeste Mignon, p. 113.
  • Génétique
    Le deuxième axe propose l’édition des multiples états imprimés des textes de La Comédie humaine et offre la possibilité d’une comparaison informatique des différents états du texte (exploitant toujours le système graphique de la double colonne pour mettre les textes en vis-à-vis) via le logiciel MEDITE, permettant ainsi une étude génétique de l’œuvre de Balzac. Actuellement, la comparaison entre le Furne et le Furne corrigé est possible pour tous les textes : la comparaison avec des états antérieurs est disponible pour quelques textes (dont Le Cousion Pons), car nécessite que ceux-ci soient numérisés et édités, tâché prévue pour la dernière année du projet. Les premiers résultats de ce travail ont fait l’objet d’une publication scientifique d’Andrea Del Lungo, décrite plus bas.
Fig. 4 : Exemple de l’affichage des comparaisons obtenues à l’aide du logiciel MEDITE
Fig. 5 : Exemple de l’affichage du contenu mis en forme en cours de développement
  • Hypertexte
    Le troisième axe est orienté vers l’édition hypertextuelle de l’œuvre de Balzac, décrite dans la première partie de ce document, qui permettra de recomposer une bibliothèque virtuelle comprenant l’ensemble des textes littéraires et non littéraires (textes scientifiques et médicaux) dont on a repéré la trace dans l’œuvre de Balzac. Cette partie est actuellement vide car le logiciel Phœbus, développé par le LIP6 et déjà opérationnel, est en voie de restructuration : l’équipe du LIP6 travaille en effet à la création d’un nouveau logiciel qui intégrerait les fonctionnalités de Phœbus et du logiciel PhiloLine, développé par l’équipe ARTFL (American Research on the Treasury of French Language) de l’Université de Chicago dans le cadre d’un partenariat déjà effectif.
Fig. 6 : Exemple de l’affichage prévu pour l’édition hypertextuelle de l’œuvre de Balzac

Un quatrième espace du site sera consacré à un moteur de recherche lexical, grâce précisément au partenariat avec le projet ARTFL de l’Université de Chicago, qui mettra à disposition les fonctionnalités du moteur de recherche déjà développé.

Fig. 7 : Exemple de l’affichage des résultats de recherche lexicale dans les œuvres

2.2 Impact scientifique et diffusion des résultats

Le site eBalzac.com a l’ambition de devenir une référence dans le domaine éditorial, d’une part par la publication intégrale de l’œuvre de Balzac, d’autre part par les outils et logiciels mis à disposition des utilisateurs pour la recherche lexicale, la comparaison des variantes et la navigation dans l’intertexte, qui peuvent fonctionner comme modèle pour d’autres projets de valorisation du patrimoine écrit.

Dans son état actuel, le site constitue déjà un apport majeur à la connaissance de l’œuvre de Balzac, et notamment de La Comédie humaine, donnée à lire dans une version à ce jour inédite en ligne, celle qui intègre les corrections manuscrites de Balzac apportées sur son exemplaire personnel (version dite « Furne corrigée », sur laquelle se fondent la plupart des éditions papier, mais qui ne circule pas en ligne). Le travail éditorial très approfondi que nous avons mené grâce au financement ANR, impliquant un retour à la source (l’exemplaire personnel de Balzac) et une vérification des corrections manuscrites, a permis d’aboutir à une version particulièrement corrigée du texte, qui rectifie de nombreuses erreurs de transcription ou d’interprétation qui circulent dans les versions papiers, y compris dans la prestigieuse Bibliothèque de la Pléiade. La communauté scientifique peut donc déjà bénéficier de cette édition et des premiers résultats des comparaisons textuelles entre les différentes éditions ; à terme, l’hypertexte complètera cet ensemble dont les apports inédits pourront sans aucun doute renouveler la vision de l’œuvre balzacienne et les manière d’interroger des corpus textuels.

En termes d’impact scientifique, le projet a déjà donné lieu à deux publications dans des revues internationales à comité de lecture :

  1. Del Lungo, A., Ganascia, J.-G., et Glaudes, P., « Automatic Detection of Reuses and Citations in Litérary Texts », Literary and Linguistic Computing, 29 (3), 2015, p. 412-421 (accessible sur Archives ouvertes : http://hal.archives-ouvertes.fr/hal-00977310).
  2. Del Lungo, A., « Éditions et représentations de La Comédie humaine », Genesis (Revue internationale de critique génétique), 44, 2017, p. 81-96.

La première détaille les principes de fonctionnement algorithmiques du logiciel Phœbus, et en présente les premiers résultats en ce qui concerne l’interrogation croisée des textes de La Comédie humaine ; la seconde analyse les premiers résultats de la comparaison génétique des différentes versions des textes, issue du logiciel MEDITE, et présente aussi un tableau exhaustif de toutes les éditions corrigées par Balzac, et qui devront donc être intégrées au site.

En termes de diffusion, une séance entière de présentation du projet et d’analyses de ses premiers résultats a été proposée dans le cadre du colloque annuel de l’association Nineteenth-Century French Studies, « Le Style », Charlottesville, 9-11 novembre 2017, colloque réunissant un millier d’universitaires du monde entier, spécialistes du XIXe siècle. La séance, intitulée « eBalzac. Questions de style dans les humanités numériques », a vu la participation d’Andrea Del Lungo, Tania Duclos et Maxime Perret.

Une journée d’étude a été organisée à la MESHS de Lille dans le cadre du séminaire « Humanités numériques », sous le titre « Méthodes et démarches dans les humanités numériques littéraires », interventions de Xavier-Laurent Salvador, Marine Riguet, Maxime Perret, Marc Douguet, Chiara Mainardi, 17 mars 2017.

Le projet a fait l’objet de plusieurs présentations dans des cadres prestigieux :

  1. Digital Humanities Conference, University of Nebraska–Lincoln, juillet 2013 (texte mentionné plus haut, publié dans la revue Litarary and Linguisting Computing) (intervention de A. Del Lungo et J.-G. Ganascia) ;
  2. Conference of the European Society for Textual Scholarship, Paris, novembre 2013 (intervention de A. Del Lungo) ;
  3. Formes et supports, colloque de Cerisy, juillet 2014 (intervention de A. Del Lungo) ;
  4. Les études françaises à l’ère du numérique,colloque annuel des francisants italiens, Université de Gênes, septembre 2014 (intervention de A. Del Lungo).
  5. Des humanités numériques littéraires ?, colloque de Cerisy, 2017 (intervention de J.-G. Ganascia) 
  6. Épistémologie et Pratiques des Humanités Numériques, Séminaire de recherche, Paris, INRIA (Institut national de recherche en informatique et en automatique), février 2017 (intervention de A. Del Lungo).
  7. L’hypertexte et l’hypertextualité entre humanités numériques et jeux vidéo, Journée d’étude, Université Aix-Marseille, 12 février 2018 (intervention de Maxime Perret).
  8. Construire le récit : histoire et poétique des chapitres, colloque de Cerisy, juin 2018 (intervention de A. Del Lungo).

Il a également donné lieu à plusieurs conférences de valorisation :

  1. Présentation du projet Phoebus, par Andrea Del Lungo, Jean-Gabriel Ganascia, Pierre Glaudes, Tania Duclos et Maxime Perret. Conférence à la Maison de la Recherche Paris Sorbonne, 11 mars 2016.
  2. « Le digital humanities nell’ambito della francesistica », par Andrea Del Lungo, conférence sur invitation, Université de Rome La Sapienza, 14 mai 2016.
  3. Tania Duclos, « Poétique balzacienne de l’intertextualité ». Conférence dans le cadre du séminaire de recherche Phœbus, 4 mai 2016.
  4. Présentation du projet Phœbus, par Andrea Del Lungo, Tania Duclos et Maxime Perret. Conférence sur invitation de la MESHS (Maison Européenne des Sciences de l’Homme et de la Société) de Lille.
  5. Maxime Perret, « Balzac hypertexte : réflexions à partir de La Comédie humaine ». Conférence dans le cadre du séminaire de recherche Phœbus, 16 juin 2016.
  6. Andrea Del Lungo, « Variantes éditoriales de La Comédie humaine », journée d’étude « La littérature française au XIXe siècle. Œuvres, auteurs, perspectives », Université d’Udine, 12 mai 2017.
  7. Andrea Del Lungo et Maxime Perret, « Présentation du site eBalzac.com », Paris, Maison de Balzac, 26 novembre 2017.
  8. Andrea Del Lungo, « Il sito eBalzac : metodologie e problemi dell’edizione elettronica », Université de Gênes, 19 janvier 2018.

2.3 Impact socio-économique et stratégies de valorisation

Plusieurs éléments permettent de mesurer l’impact socio-économique du projet ainsi que ses apports en termes de valorisation.

1. Développement et mise à disposition en libre accès de logiciels.

Les deux logiciels Phœbus (pour la détection de citations et de réutilisations) et MEDITE (pour la comparaison des textes), développés par l’équipe LIP6 dans le cadre du projet, sont déjà accessibles sur le site du Labex Obvil :

Logiciel Phœbus (http://obvil.lip6.fr/phoebus)

Logiciel MEDITE (http://obvil. lip6.fr/medite).

Les nouvelles versions de ces logiciels, issues du dialogue avec les équipes littéraires et de la collaboration internationale avec l’ARTFL de l’Université de Chicago, seront disponibles sur le site eBalzac.com, et pourront aider le développement d’autres projets d’édition électronique.

2. Livres numériques

L’édition de texte du site eBalzac a été pensée et encodée pour être multiformat et multisupport. Un premier développement a donc été de rendre accessible toute l’œuvre de Balzac en donnant à l’utilisateur la possibilité de télécharger des livres numériques au format ePub.

Dans ce dessein, nous allons déposer le nom de marque eBalzac auprès de l’INPI (Institut national de la propriété industrielle), afin de protéger notre édition du piratage possible. Un partenariat avec la BNF, qui nous a autorisé à nous servir de numérisations déjà existantes pour le corpus annexe, est déjà effectif : les livres numériques de l’œuvre de Balzac issues de notre travail éditorial seront donnés gracieusement à la BNF pour qu’ils figurent dans Gallica (où l’on trouve pour l’instant une version très fautive des textes de La Comédie humaine, sans les corrections de Balzac).

Nous avons noué également un partenariat avec la maison de Balzac à Paris pour l’édition des huit romans de jeunesse de Balzac, dont les éditions originales se trouvent à la bibliothèque de la Maison de Balzac : une stagiaire de l’université Lille 3 (Mathilde Dellay, M2 Lettres) a travaillé au printemps dernier à l’établissement de la version d’un de ces textes, Wann-Chlore.

3. Édition papier

Comme expliqué plus haut, le volet génétique du site eBalzac est issu d’un projet initialement conçu avec les éditions Classiques Garnier, que nous avons voulu infléchir dans une logique de libre accès. Le projet d’une édition papier de La Comédie humaine reste cependant prévu avec cet éditeur, en 16 tomes, sous la direction d’Andrea Del Lungo et avec la collaboration d’une trentaine de chercheurs (les contrats ont déjà été signés).

Cette édition bénéficiera naturellement de l’établissement du texte minutieusement effectué dans le projet, et des résultats de la recherche, en ce qui concerne l’histoire du texte (volet génétique) mais aussi ses sources (volet hypertextuel). L’éditeur s’est engagé à publier cet ensemble d’abord en grand format, puis, au bout de six mois, en édition de poche, ce qui rendra accessible pour la première fois à ce format l’ensemble de La Comédie humaine.

2.4 Impact environnemental et sociétal des résultats

Plusieurs actions ont été imaginées pour valoriser les résultats du projet, notamment en termes de formation, de diffusion du savoir et d’événementiel.

1. Retombées pédagogiques

Le projet a été présenté lors de la table ronde « Dialogue des humanités numériques entre praticiens » au Salon EduSpot France « Les rencontres du numérique pour l’éducation », (Paris, Palais des congrès, 8 mars 2017), réunissant un millier d’enseignants du secondaire. Il a retenu l’attention de plusieurs acteurs du secteur, y compris du Ministère de l’éducation nationale, qui ont souhaité un développement des aspects pédagogiques non seulement classiques (introductions, résumés des œuvres, iconographie, etc.) mais aussi dans le sens d’une interaction et d’un usage innovant.

Un projet est donc à l’étude (et devra être présenté au Ministère de l’éducation nationale) afin que l’emploi de l’édition hypertextuelle et de la bibliothèque virtuelle qui lui est associée permette aux enseignants d’aborder la question théorique de l’intertextualité à partir de supports numériques plus conviviaux, voire ludiques, capables de mettre en évidence par une cartographie visuelle des liens, des réseaux ou des associations qui aident à replacer le texte dans son contexte historique et culturel.

2. Formation à la recherche et professionnalisation

En ce qui concerne la contribution du projet au contenu des formations de l’enseignement supérieur, il paraît évident que l’édition hypertextuelle, ainsi que les méthodes qui l’ont fondées, pourra apporter une matière inédite aux nombreuses filières en humanités numériques qui se développent actuellement, à l’exemple du parcours de master Lettres « Édition numérique et imprimée en littérature » créé en 2015 à l’université Lille 3, associant lettres, informatique et sciences du langage, sous la responsabilité d’Andrea Del Lungo et Nathalie Gasiglia. Ce parcours a des objectifs professionnalisants clairs afin de former les étudiants dans les secteurs des maisons d’édition, mais aussi des entreprises ou services de composition assurant les traitements de flux XML pour l’édition des ouvrages publiés dans les différents formats visés, et des entreprises spécialisés dans la publication en ligne, sur i-book ou tablettes. Plusieurs étudiants de ce master ont effectué des stages financés par le projet, ayant des tâches de numérisation, de nettoyage et d’encodage des textes.

3. Événementiel

À partir de l’utilisation de l’édition électronique en ligne, plusieurs types d’ateliers pourront être proposé à différentes institutions, et pour des publics variés :

  • un atelier étudiant, dans le but de sensibiliser ce public autour de la question de la rédaction, et notamment des limites entre la citation et le plagiat (action importante auprès des étudiants ayant à rédiger des dossiers ou des mémoires).
  • un atelier scolaire, prévoyant des déplacements dans des classes de CM1-2 et des rencontres avec les enseignants, pour sensibiliser les enfants au bon usage d’internet (par exemple, proposer un petit exposé à faire avec l’aide d’internet, puis montrer le fonctionnement de notre logiciel détectant des copier-coller).
  • un atelier scolaire niveau collège pour montrer l’ampleur et le type de travail créateur d’un écrivain, via le logiciel de comparaison des variantes et l’analyse des corrections manuscrites.
  • un atelier d’écriture, à l’intention d’un public adulte (bibliothèques-médiathèques), pour montrer l’apport des sources chez un écrivain, ainsi que les manières de réemployer et de réinvestir une matière textuelle dans l’écriture.