1. La question de l’instruction publique à l’ordre du jour
Toute discussion autour du thème de l’instruction publique pendant la Révolution française doit tenir compte de l’histoire politique et intellectuelle de l’Ancien Régime aussi bien que des prolongements de ces histoires dans la période révolutionnaire. Aussi la suppression des Jésuites (1764) constitue un point de départ commode pour analyser ces événements. Phénomène d’envergure européenne, qui débouchera sur la suppression de l’ordre religieux par le pape, cette affaire aura une coloration particulière dans le royaume du roi Louis XV. En France, l’expulsion des Jésuites est l’occasion d’une réflexion approfondie sur les collèges, leurs fonctions, leur place dans le tissu social, sur l’éducation conçue comme un tout. Les ouvrages sur l’éducation abondent entre 1762 et 1765 (Fabre 2023).
Sous l’Assemblée législative, le débat sur l’orientation de l’éducation dans une nation régénérée, débat qui couvait depuis l’expulsion des Jésuites, éclate au grand jour. La Législative commence à siéger le 1er octobre 1791. Depuis déjà plusieurs mois, le pouvoir est, en fait, aux mains des Jacobins. Ils sont déjà divisés, sauf sur un point : il faut, plus que jamais, instruire les citoyens, afin qu’ils résistent aux arguments des contre-révolutionnaires, de même qu’aux armées ennemies. L’éducation, pouvoir formateur de l’homme tout entier, physique et moral, et le pouvoir politique, inventeur de l’avenir, se combinent pour établir un système national d’instruction publique. Aussi une des premières décisions administratives de l’Assemblée législative aura été la création du Comité d’instruction publique le 14 octobre 1791. Parmi les premiers membres de ce comité, des nobles libéraux, Bernard-Germain de Lacépède, Claude-Emmanuel Pastoret, Marie-Jean-Antoine-Nicolas Caritat, marquis de Condorcet (Boulad-Ayoub 1997)… et des scientifiques de tendance jacobine, Gilbert Romme, Lazare Carnot…
Moins de deux semaines après sa première séance, la Convention, qui succède à la Législative, se dote à son tour (1792) d’un Comité d’instruction publique, composé de 24 députés. Il comprend les écrivains Marie-Joseph Chénier et Louis-Sébastien Mercier, le peintre Jacques-Louis David, le scientifique Romme, quelques anciens enseignants comme Joseph Fouché. Condorcet a préféré se faire élire au Comité de constitution, mais son prestige domine toujours les premiers travaux du Comité d’instruction publique.
Dans ces débats où s’affrontent les projets enjoignant de « former un nouveau peuple », les députés se posent des questions qui mettront plus d’un siècle à être résolues, et qui, aujourd’hui encore, ne le sont pas toutes : écoles publiques, écoles privées ? instruction obligatoire ? quels programmes ? quelle structure ? quelle place aux sciences ? à la morale ? Chacun des protagonistes, à sa manière, a ouvert la voie à la conception moderne et démocratique de l’instruction publique. Le corpus des procès-verbaux du Comité d’instruction publique de l’Assemblée législative et de la Convention nationale (corpus Guillaume) accueille l’intégralité des textes que les outils informatiques mis à disposition dans notre édition numérique permettent de comparer aisément (Boulad-Ayoub, Grenon et Leroux 1992, avec des tableaux statistiques informatisés des occurrences thématiques et conceptuelles établis par J. Boulad-Ayoub).
2. Sauver la Révolution de l’oubli
Le débat ne s’arrête pas à la fin de la Première République, et l’importance politique et idéologique de ses enjeux ne s’évanouit pas avec la liquidation napoléonienne du Comité d’instruction publique. Le contexte proprement révolutionnaire nous transporte, un siècle plus tard, dans celui de l’activisme pédagogique des débuts de la Troisième République. Ferdinand Buisson, pédagogue, démocrate et anticlérical, avait fait admettre, dès 1881, l’idée de la publication d’un grand recueil de documents relatifs à l’histoire de l’instruction publique pendant la Révolution française. À son instigation, un réfugié politique, militant anarchiste et ami de Pierre Kropotkine, James Guillaume (1844–1916), dont les ardentes convictions républicaines rejoignent les finalités idéologiques et politiques des initiateurs de la publication, entreprend de réunir un corpus gigantesque de textes. Son œuvre, rétrospectivement, devient un témoignage de la réappropriation élective de l’héritage révolutionnaire par la Troisième République à la recherche de ses valeurs fondatrices.
Les farouches polémiques entre partisans et adversaires de la Révolution, républicains et antirépublicains, anticléricaux et fidèles catholiques, avaient éclaté lors de l’anniversaire du premier centenaire. Elles portaient à la fois sur les causes et les conséquences de la Révolution, de même que sur le sens de cet événement. En particulier, l’histoire de l’instruction publique, entre 1789 et 1795, est le théâtre d’affrontements extrêmement rudes. Les républicains y voyaient l’une des conquêtes les plus nobles de la Révolution ; au contraire, les antirépublicains, et en particulier les prêtres catholiques, y retrouvaient comme le condensé du mal révolutionnaire.
Pour servir leur cause, les républicains étaient cependant à même de mobiliser l’appareil d’État. En 1886, le Comité des travaux historiques du ministère de l’Instruction publique hérite d’un immense projet d’édition de documents relatifs à l’histoire de l’instruction publique pendant la Révolution. En 1889, les Procès-verbaux du Comité d’instruction publique de l’Assemblée législative (Guillaume 1889) voient le jour dans la Collection des documents inédits sur l’histoire de France : les comptes rendus des séances sont réunis avec soin par Guillaume, avec toutes sortes d’annexes et d’appendices.
Le ministre de l’Instruction publique ordonne presque aussitôt la publication, sur ce modèle, des Procès-verbaux du Comité d’instruction publique de la Convention nationale. Il s’agit de six lourds volumes, plus deux tomes de tables générales, précédées d’une importante section d’errata et d’addenda divers. Le sixième volume paraît en 1907 (Guillaume 1891–1958). L’ensemble est couronné d’un admirable index alphabétique et analytique.
Les annexes forment en fait la plus grande partie du corpus Guillaume des Procès-verbaux : elles comprennent des extraits de correspondance officielle entre le Comité et d’autres instances de l’appareil d’État, ainsi que des lettres, des adresses, des pétitions provenant de sociétés populaires, d’administrations locales ou de simples citoyens, des discours prononcés par des membres du Comité, tous les projets de décret concernant l’instruction publique pendant la Révolution, des extraits de journaux de l’époque (du Moniteur à la Feuille villageoise) se rapportant à tel ou tel élément des procès-verbaux.
Le tome prévu pour la période du Directoire ne paraîtra jamais, faute de budget. Le travail colossal, plus de 6000 pages formant le corpus étudié, fait date dans le monde des sciences sociales et historiques et est caractéristique de ce centenaire de la Révolution, marqué au sceau de l’érudition objective et des grandes entreprises de publications de sources inédites.
3. L’institution du citoyen
Les vecteurs principaux de l’édification révolutionnaire du citoyen par le Comité d’instruction publique se confondent avec les nouvelles institutions qui se créent. Leur portée est universelle et les modèles qu’elles concrétisent perdurent jusqu’à nos jours comme autant de fondements politiques et éthiques de nos sociétés démocratiques.
Mise à part la réorganisation de l’éducation qui oscillera jusqu’à aujourd’hui entre la primauté donnée aux Lumières (tendance Condorcet) et celle donnée aux mœurs et à la vertu (tendance Rousseau), il ne faudrait pas négliger les autres dimensions des activités du Comité dont rendent compte le corpus Guillaume et notre édition numérique. Il en va ainsi du processus d’unification du droit préparé par la Convention et qui aboutira au Code civil et à nos sociétés de droit. Aussi décisif, le travail de l’unification de la langue, et par le fait même de l’ensemble des Français, mené par l’infatigable Grégoire (Boulad-Ayoub 2005) au sein du Comité d’instruction publique. Son Rapport sur la nécessité et les moyens d’anéantir les patois et d’universaliser l’usage de la langue française du 16 prairial an II (juin 1794) en donne un aperçu (pour les détails de l’analyse du logiciel Service d’analyse de texte par ordinateur, ou SATO, de l’action de Grégoire, voir les figures 3, 4, 5 et 6).
La systématisation des nouvelles lois régissant la société française ; la rationalisation et la « déchristianisation » du calendrier public ; la création d’un système métrique et d’un système de poids et mesures unifiés ; l’établissement des grandes écoles révolutionnaires, pour les temps de paix et pour les temps de guerre ; l’organisation de la production des livres élémentaires, de recueils des actions héroïques des citoyens, de conférences publiques dans les villes et les villages ; la lutte contre le vandalisme (Boulad-Ayoub 2012) et pour la liberté des cultes ; l’instauration, selon un modèle égalitaire inédit, du Muséum et du Conservatoire des arts et métiers, tout cela compose autant d’illustrations concrètes de cette volonté unitaire qui traverse de part en part la Révolution jusqu’à notre temps.
Les membres du Comité s’emploient également à forger l’identité nationale par la mise en place de structures pratiques d’homogénéisation des références culturelles. L’organisation des fêtes et des spectacles, par exemple, une recette fédératrice, si l’on peut dire, est aussi efficace autrefois qu’aujourd’hui. Ou encore la leçon que l’on peut tirer de la récupération, par le biais de cérémonies spéciales ou de chants patriotiques, du télégraphe de Claude Chappe et la « fabrication révolutionnaire du salpêtre », inventions qui furent utilisées aussitôt à des fins militaires (Boulad-Ayoub 2022).
Nous pouvons découvrir ainsi tout au long de chacun des tomes du corpus Guillaume et de notre propre édition numérique comment se sont construits, strate après strate, le modèle incitatif de l’homme régénéré moderne en même temps que les instruments de la nouvelle sociabilité. Gage politique matérialisé et ferment symbolique du changement social, le Comité d’instruction publique est parvenu à forger les leviers privilégiés de cette transformation rapide et profonde des rapports sociaux que la République et la patrie attendaient de lui. C’est le legs intemporel dont nos sociétés postrévolutionnaires lui sont encore redevables.
4. À nouveau tremplin, nouvelles plates-formes
Les Procès-verbaux du Comité d’instruction publique de l’Assemblée législative, comme ceux de la Convention nationale, brassent, on le voit, tous les problèmes que, depuis la fin du XVIIIe siècle, l’éducation pose à la démocratie tout autant qu’au mouvement général des idées philosophiques et religieuses. Ces documents qui sont conservés aux Archives nationales constituent le premier relais de leur histoire-gigogne. Un siècle plus tard, ils seront compilés, enrichis et annotés par Guillaume : c’est le deuxième relais.
Ce riche ensemble de documents met principalement en scène le débat de 1789 à 1795 sur l’orientation de l’instruction publique, débat qui reste fondamental pour nos démocraties. Le rythme en est palpitant. On est mis au fait également, séance par séance, de l’abolition des institutions de la monarchie et de leur remplacement par des établissements conformes par leur esprit aux conditions d’un État républicain.
L’édition nouvelle que nous avons mise à jour est revue et augmentée tant pour l’édition papier de 1997 (Boulad-Ayoub et Grenon 1997) que pour l’édition numérique actuelle. Ces deux éditions, papier et numérique, reproduisent la publication de Guillaume, l’actualisent, et la prolongent jusqu’à la période du Directoire. Elles forment respectivement les troisième et quatrième étapes de l’histoire-gigogne des Procès-verbaux du Comité d’instruction publique.
i. L’édition papier : ajouts et interventions diverses
Cette édition (Boulad-Ayoub et Grenon 1997) est précédée d’une préface de l’éminent historien Michel Vovelle et d’un tome d’introduction générale (Vovelle 1997). Nous avons été désireux de restaurer l’intégrité logique de la publication de Guillaume en y insérant, à leur place, les addendas, les errata corrigés (composant un ensemble fort copieux d’environ 400 pages publiées, faisant partie du Tome VII, posthume, de l’édition de l’Imprimerie nationale). Cela, selon les indications déjà disponibles, mais aussi selon nos propres vérifications des sources conservées aux Archives nationales ainsi que d’une révision attentive des textes originaux.
Le supplément d’informations que nous apportons à la thématique touchée par les activités des comités d’instruction publique successifs signale les acquis de la recherche actuelle. Surtout, nous avons complété la série des textes compilés par Guillaume en publiant quelques textes importants datant du Directoire (repris dans l’édition numérique), période non couverte par Guillaume qui s’arrête à la dernière séance de la Convention, ainsi que deux textes inédits.
Le premier texte date de 1790 : il s’agit du Plan d’éducation présenté à l’Assemblée nationale au nom des instituteurs publics de l’Oratoire. Ce plan était, en fait, l’œuvre de l’oratorien Pierre-Claude-François Daunou, le futur membre de la Convention ([Daunou] 1790). Guillaume mentionne le document dans son introduction au tome des Procès-verbaux du Comité d’instruction publique de la Législative, mais ne le reproduit pas. Le second texte est de 1791 : c’est une pétition d’un costumier de théâtre, Pierre-Nicolas Sarrazin, portant sur le projet d’une école gratuite pour l’enseignement des arts appliqués. Ces textes nous ont paru dignes d’intérêt comme illustrations de deux types de témoignages. Le premier document est le plan de l’Oratoire, établissement principal d’instruction au XVIIIe siècle et rival de celui des Jésuites. Les Oratoriens avaient la charge de l’enseignement sous l’Ancien Régime. Ce plan d’éducation, le dernier des plans proposés par le Comité d’instruction publique et, surtout, celui qui sera effectivement mis en vigueur, est rédigé par Daunou. Le second document peut jouer le rôle de paradigme de ce genre de pétitions qui arrivaient en masse au Comité de toutes les couches de la population et de tous les coins de la France. Il exprime la ferveur et la participation de tous les citoyens à la refonte révolutionnaire du système d’éducation.
ii. L’édition numérique : enjeux et enrichissements
Le passage du document papier au document électronique n’est pas simplement un changement de support. L’enjeu ici est de permettre de naviguer à travers un ensemble de pièces liées de multiples façons. Les métadonnées accompagnant chacun des documents doivent permettre d’en saisir les conditions de production et de constituer des corpus de recherche sur la base de ces métadonnées : dates, lieux, auteurs, publics cibles et références intertextuelles. Les documents individuels sont souvent des objets composites faisant appel à plusieurs genres de discours et portant de multiples marques d’intertextualité.
En outre, l’enrichissement des corpus originaires permet de repérer diverses catégories de référents : géographiques, temporels, événementiels et humains. En plus de l’interface permettant de naviguer dans le texte catégorisé de diverses manières, une exportation du corpus, selon des normes conformes aux propositions de la Text Encoding Initiative (TEI), en assure la pérennité et l’interopérabilité au moyen de plusieurs outils informatiques.
Chacun des documents est accompagné d’une fiche de métadonnées décrivant le document et ses liens avec les autres documents et la collection complète, le tout selon un modèle de données bien documenté ayant déjà fait l’objet de publications (Daoust et al. 2008).
Des innovations méthodologiques caractérisent notre édition numérique des Procès-verbaux du Comité d’instruction publique . Considérablement plus riche que l’édition imprimée, l’édition électronique comprend, en effet, une multitude d’hyperliens de navigation et d’outils d’analyse intégrés.
Par exemple, l’édition papier est accompagnée d’un index alphabétique et analytique très développé. Mais l’édition imprimée des procès-verbaux ne signale pas les liens réciproques entre le texte des procès-verbaux et les rubriques de l’index. Le marquage de ces liens dans l’édition électronique permet au lecteur-chercheur une consultation simple des notes, de la table analytique des matières, des rubriques et notices biographiques de l’index et de tous les commentaires critiques des documents d’introduction, de sommaires et d’analyse à partir du texte affiché. La navigation par l’interface express fait appel à des outils analytiques permettant des parcours de lecture dictés par les préoccupations du chercheur. Ainsi, si on veut étudier les liens entre religion et État, on peut avoir recours aux discours de Grégoire et de Romme sur ce thème. De même, on voudra savoir la place respective qu’occupent dans les grands rapports de Condorcet ou de Lepeletier-Robespierre les concepts de liberté, d’égalité, de vertu.
On se heurtera quelquefois à des surprises, par exemple le nombre prépondérant dans le tome V de références au salpêtre allant jusqu’à éclipser les concepts fondateurs de régénération ou de liberté (Boulad-Ayoub 2022). C’est que nous sommes au moment où la jeune République est en guerre avec toute l’Europe. La liberté, comme le dit Robespierre, est au bout de l’arme victorieuse.
De telles surprises sont heureuses, car elles déclenchent l’approfondissement de la recherche sous une nouvelle perspective, sortant des chemins battus, et illustrent bien le rôle adjuvant pour la recherche joué par les outils d’analyse. En suivant la piste du salpêtre, on découvrira alors l’ampleur de faits, de chants, de cérémonies qui entourent le terme de salpêtre. Le recrutement des volontaires patriotes est comparable au recrutement des élèves de l’École normale. Les instructions accélérées sont prodiguées aux volontaires par les chimistes les plus réputés, et ainsi de suite.
iii. La chaîne de traitement semi-automatique pour réaliser l’édition numérique
La réalisation de notre édition numérique repose sur deux grandes étapes.
Première étape : déconstruction. Cette première étape consiste à décomposer les corpus, ou les collections de textes, en objets de nature plus atomique sans perte de richesse du point de vue des relations intertextuelles. Ainsi les neuf volumes de l’édition papier de la Convention, avec leurs 6700 pages, seront découpés en 13 382 unités documentaires numériques accompagnées, chacune, de leur fiche de métadonnées. Pour ce faire, il a fallu extraire les données des logiciels d’éditique utilisés pour l’édition papier et les convertir au format texte Unicode. Une des difficultés de l’opération est qu’il faut aussi extraire les marques d’édition (styles italiques, gras, etc.) qui nous serviront d’indices pour produire ensuite un balisage rendant compte des composantes logiques des documents et de l’appareil critique mis en place par les auteurs des éditions papier existantes.
Deuxième étape : (re)construction. Cette seconde étape vise à rassembler ces unités documentaires au sein de corpus raisonnés, objets de la démarche expérimentale du chercheur. C’est là qu’intervient l’utilisation du logiciel SATO d’analyse de texte assistée par ordinateur.
On pourrait qualifier le logiciel SATO de tableur textuel. Il a été créé par François Daoust (Daoust 2007–2024). Le système sert à accueillir un corpus brut ou déjà annoté selon une syntaxe spécifique. Il permet de l’annoter ou de changer l’annotation déjà présente, de catégoriser le corpus selon des grilles définies par l’analyste et, une fois décrit, de l’exploiter de multiples manières. SATO garde une trace complète du processus de description et d’analyse du corpus.
Le logiciel offre aussi la possibilité de programmer des dispositifs de lecture électronique (Daoust 2002) et, donc, d’établir des protocoles d’analyse personnalisés et adaptés à chaque type de discours.
Chacun des milliers de documents que comporte la collection des procès-verbaux a été soumis à un ensemble de procédures et scénarios de commandes SATO dont les résultats ont été ensuite vérifiés par les chercheurs et les aides-étudiants associés au projet. Ces procédures permettent d’identifier les noms propres (personnes et lieux), les locutions terminologiques et les mots composés, de même que les diverses parties des documents (en-tête, signature, appel de note, etc.).
C’est aussi à cette étape d’analyse que les liens vers les index et les notes sont déposés sur le texte intégral et validés selon leur pertinence. Les index eux-mêmes, avec au-delà de 6400 entrées pour la seule Convention, ont exigé un travail important visant à les transformer en véritables ressources informatiques alimentant les scénarios de marquage des textes intégraux.
5. L’interface express
L’édition numérique une fois réalisée, nous avons entrepris d’y adjoindre une interface dédiée, dite Corpus express, pour en faciliter l’exploitation et initier l’utilisateur aux opérations que permet le logiciel. Un Menu express a donc été ajouté au menu complet des commandes de SATO. On a aussi construit une table des matières structurée qui recrée les relations hiérarchiques entre les documents. Ces cheminements de lectures exemplaires et d’interfaces adaptées permettent leurs applications aux questions que se posent les chercheurs dans leurs propres projets.
Les paragraphes qui suivent illustrent une utilisation de l’interface Corpus express.
Dans la saisie d’écran de la figure 1, on voit le Menu express dans le coin supérieur droit de l’écran. Sous ce menu, on a la table des matières que l’on a déployée en cliquant sur Tome I. Au centre, on trouve la fenêtre d’affichage des formulaires et des résultats. À gauche, on a le menu des ressources documentaires. On peut aussi y afficher le menu des commandes de SATO si on clique sur Commandes dans le Menu express. Enfin, tout en bas se trouve une fenêtre permettant d’afficher le journal des commandes ou le menu des opérations sur un mot ou une forme lexicale. Des fenêtres volantes feront aussi leur apparition pour afficher le texte des notes et des rubriques de l’index analytique et alphabétique (IAA) de Guillaume, comme l’illustre la figure 2.
La figure 2 montre l’affichage dans la fenêtre centrale du texte du procès-verbal de la séance 2 du Comité d’instruction publique. Dans cette capture d’écran, en cliquant sur Roland, on a obtenu le Menu de catégorisation dans la fenêtre inférieure. On y trouve toute l’information que le logiciel possède sur la forme lexicale et sur l’occurrence sélectionnée. Le menu propose plusieurs actions permettant de voir tous les contextes (kwic) ou d’annoter l’entrée lexicale ou l’occurrence. On a aussi cliqué sur le lien index à la droite de Roland dans le texte du procès-verbal afin de faire apparaître à droite la fenêtre volante de la rubrique Roland de l’IAA. Tous les mots de la rubrique sont aussi cliquables et peuvent renvoyer à d’autres rubriques de l’IAA. On a aussi cliqué sur note à la droite du numéro de la note 3 dans la fenêtre centrale, provoquant l’apparition d’une autre fenêtre volante en dessous de celle de l’index qui contient le texte de la note. On peut donc cheminer dans le corpus comme on le ferait pour un dictionnaire.
Si on déploie l’IAA depuis le sommaire de la table des matières, on verra une icône permettant d’afficher les passages du texte qui renvoient à l’index et de les analyser, comme l’illustre la figure 3.
La figure 3 reproduit une saisie d’écran avec la liste des rubriques de l’IAA que l’on a déroulé pour mettre en évidence la rubrique grégoire_henri. En cliquant sur le nom de la rubrique, on peut en afficher le texte avec ses hyperliens.
On peut aussi cliquer sur l’icône représentant la lettre « i » à la droite du nom pour afficher les métadonnées associées à la rubrique. En cliquant sur l’icône représentant une fiche, on obtient le nombre de références à la rubrique dans le corpus ou le sous texte de référence (item Sous-texte du Menu express). C’est ce que l’on voit dans le panneau central de la figure 3. Pour cet exemple, on a restreint le corpus au sous-texte des procès-verbaux sans les notes (pv). Le formulaire de commandes dans la fenêtre centrale permet diverses opérations. On peut afficher le texte des contextes référant à la rubrique ou se limiter aux références de pagination indiquant le nom du document et son numéro de page conforme à l’édition imprimée. On peut aussi déclencher l’analyseur Distance, comme illustré dans la figure 4.
L’analyseur Distance permet de comparer le lexique du vocabulaire utilisé dans les contextes (paragraphes) repérés par rapport au reste du corpus ou du sous-corpus. On peut choisir un seuil de fréquence des formes lexicales et leur catégorie grammaticale. Voici le résultat obtenu avec les paramètres indiqués (figure 5). L’astérisque à la fin du mot indique une sur-représentation du mot dans les contextes (ici les paragraphes référant à Grégoire) et son absence indique une sous-représentation.
Ce qui nous intéresse dans le tableau de la figure 5, ce sont surtout les mots dont l’utilisation diffère le plus entre les deux sous-textes. Voilà pourquoi les rangées du tableau, calculées ici sur les fréquences du mot, sont présentées dans l’ordre décroissant des facteurs de différenciation dont la somme nous donnera la distance. On peut modifier l’ordre du tri des lignes du tableau en cliquant sur le titre d’une colonne. Les différentes colonnes ont les fonctions suivantes :
Fréqtot correspond aux pourcentages d’occurrences des items lexicaux dans le sous-texte de référence (pondération).
Ctx correspond aux pourcentages d’occurrences des items lexicaux dans le sous-texte constitué de l’ensemble des contextes.
~Ctx correspond aux pourcentages d’occurrences des items lexicaux dans le sous-texte constitué du sous-texte complémentaire, c’est-à-dire de l’ensemble du sous-corpus de référence en excluant les contextes repérés.
explique indique l’apport en pourcentage d’une entrée lexicale donnée à la mesure de distance, calculée comme la somme des écarts de fréquence pour chacune des entrées lexicales.
cumul donne la somme des pourcentages jusqu’à la ligne courante. Ce cumul nous informe sur le nombre de lignes du tableau à considérer pour atteindre un seuil donné d’explication de la distance.
Item affiche l’item lexical. Un astérisque en fin de ligne indique que l’item mentionné est surreprésenté dans les contextes.
Certains mots attirent notre curiosité, par exemple habit, patois ou vandalisme. En cliquant sur un mot, patois dans la figure 5, on affiche, dans le tableau inférieur, plusieurs informations sur le mot. Par exemple, on voit dans quel tome le mot est le plus fréquent, ce qui nous donne une idée de la période historique concernée. Ainsi, le mot patois est surtout utilisé dans le tome 6 couvrant la période allant du 21 mars au 28 août 1794.
On a aussi à la gauche du tableau, un menu permettant d’effectuer diverses actions à partir du mot sélectionné. En particulier, on voudra voir dans quels contextes ce mot patois, dans cet exemple, est utilisé, comme l’illustre la figure 6.
Pour davantage d’information, on peut cliquer sur le signe « + » au bout d’une ligne de contexte afin d’obtenir un contexte élargi dans une fenêtre volante. Ainsi, en cliquant sur le « + » du contexte 14, on verra que ce contexte court fait partie de la phrase suivante.
RAPPORT SUR LA NÉCESSITÉ ET LES MOYENS D’ANÉANTIR LES PATOIS*{index} ET D’UNIVERSALISER LA LANGUE FRANÇAISE*{index}, PAR GRÉGOIRE*{index}. SÉANCE DU 16 PRAIRIAL, L’AN 2e DE LA RÉPUBLIQUE UNE ET INDIVISIBLE, SUIVI DU DÉCRET DE LA CONVENTION*{index} NATIONALE. IMPRIMÉS PAR ORDRE DE LA CONVENTION*{index} NATIONALE ET ENVOYÉS AUX AUTORITÉS CONSTITUÉES, AUX SOCIÉTÉS POPULAIRES*{index}, ET À TOUTES LES COMMUNES*{index} DE LA RÉPUBLIQUE. (EXTRAITS.)
L’analyse des résultats du tableau de distance peut nous suggérer une grille d’annotation sémantique permettant de marquer les traces de l’interprétation du chercheur. Ainsi, on pourra affecter une catégorie à divers mots appuyant une interprétation en utilisant la fonction catégorisation que l’on aperçoit à la gauche des contextes dans la figure 6. L’algorithme de Distance pourra ensuite être appliqué aux catégories de la grille d’annotation permettant d’en vérifier la portée en rassemblant tous les mots portant une même valeur dans la grille d’annotation.
Dans l’interface express, cette approche est aussi utilisée dans la comparaison des divers tomes du corpus. L’interface de commandes de SATO permet de généraliser ce qui est illustré dans l’interface express offrant au chercheur les outils pour construire son propre dispositif d’analyse.
En résumé, cet exemple montre une exploration des contextes de paragraphe dans lesquels on retrouve une référence à l’entrée grégoire_henri de l’IAA rédigé par Guillaume. À partir de cet exemple, on peut mener une variété d’explorations en parcourant les entrées de l’IAA, en changeant le sous-texte de référence (élément Sous-texte du Menu express) et le filtre constituant l’espace lexical utilisé pour la commande Distance. L’analyse des résultats peut suggérer une grille de catégorisation sémantique des unités lexicales. Il sera ensuite possible d’appliquer l’analyseur Distance sur les catégories de cette grille d’analyse.
6. Remarques conclusives
Une collaboration est en cours avec l’équipe ARTFL de l’Université de Chicago, notamment avec Mark Olsen et Clovis Gladstone, pour verser les textes du corpus, tels que retravaillés par SATO, dans le projet ARTFL, où ils seront exploitables grâce à l’outil PhiloLogic.1 Ainsi cet imposant monument de l’œuvre révolutionnaire est reproduit en son temps par James Guillaume, dans le nôtre par notre édition numérique, accompagnée de ressources électroniques novatrices. Nous mettons ce corpus à la disposition de la communauté des chercheurs, agrandie à l’échelle internationale et virtuelle d’aujourd’hui, et, surtout, au service de la créativité de chacun.
Pour saluer cette œuvre impérissable qui ne cessera de provoquer chez les générations qui se penchent sur elle pour l’étudier, les plus vives émulations, empruntons en conclusion les mots si justes de Michel Vovelle dans sa « Préface » à notre édition (Vovelle 1997, p.v–vi) :
[…] de la Révolution elle-même, aux années fondatrices de la Troisième République, mais également à aujourd’hui, la question demeure centrale […] ; elle renvoie, par le biais de la pédagogie et des projets qu’elle suscite comme des réalisations qu’elle amorce, aux choix que les hommes des Lumières, entrés en Révolution ont eu à affronter dans l’édification de l’homme nouveau, et à ce dialogue à plusieurs voix où Talleyrand, Condorcet, Romme, Lepeletier se répondent ou s’affrontent. Parce que ce débat met en jeu les valeurs essentielles de la Révolution, puis de la République, la liberté, la citoyenneté, le rôle de l’État, l’idée de progrès sous l’égide de la raison, il représente un moyen d’approche central pour toute réflexion non seulement sur la Révolution, mais sur les moyens de changer le monde.
Les renseignements, les leçons que l’on invite à tirer de l’édition numérique et à analyser par les voies informatiques devraient servir comme autant d’adjuvants propices aux stratégies de lecture, d’étude et d’interprétation pour les nombreux chercheurs s’intéressant à cette période fondatrice et foisonnante entre toutes. Nos objectifs seraient atteints si les instruments de référence et de travail que nous proposons se révèlent aussi dynamiques que nous l’avons souhaité.
7. Accès au corpus en version électronique
L’édition électronique des procès-verbaux du Comité d’instruction publique est accessible pour analyse en utilisant le logiciel SATO (Corpus express) : https://sato.ato.uqam.ca/. Les procès-verbaux sont répartis sur deux corpus selon l’assemblée dont dépend le Comité d’instruction publique.
Assemblée nationale législative 1791-1792
Convention 1792-1795
Pour les consulter, sélectionnez Corpus express. Cliquez Envoyer sans remplir les champs pour accéder anonymement aux corpus, ou créez votre compte. Cliquez sur le nom du corpus (Législative ou Convention) que vous désirez explorer.
Notes
Références
Boulad-Ayoub J. 1997. « Les partis-pris du premier président du Comité d’instruction publique, Condorcet ». In : Chouillet A.-M. et Crépel P. (éd.) Condorcet, homme des Lumières et de la Révolution. Paris : ENS Éditions, 109–20.
Boulad-Ayoub J. 2005. L’Abbé Grégoire, apologète de la République. Paris : Honoré Champion.
Boulad-Ayoub J. 2012. L’Abbé Grégoire et la naissance du patrimoine national. Suivi des Trois rapports sur le vandalisme. Québec : Presses de l’Université Laval.
Boulad-Ayoub J. 2022. « Liberté, égalité, salpêtre ». In : Bastien P. (éd.) Notre première modernité. Montréal : Leméac, 105–22.
Boulad-Ayoub J. et Grenon M. (éd.) 1997. Procès-verbaux du Comité d’instruction publique de l’Assemblée législative et de la Convention nationale [Corpus J. Guillaume]. 17 vol., Paris : L’Harmattan.
Boulad-Ayoub J., Grenon M. et Leroux S. 1992. Les Comités d’instruction publique sous la Révolution. Principaux rapports et projets de décrets. 3 vol., Montréal : Presses de l’Université du Québec.
Daoust F. 2002. « L’analyse de texte assistée par ordinateur, lunette de lecture des textes ». In : Communication présentée au colloque Publications et lectures numériques : problématiques et enjeux, 70e congrès de l’ACFAS . https://ebsi.umontreal.ca/public/FAS/ebsi/documents/recherche/colloques-congres-journees-d-etude/acfas2002/daoust.pdf.
Daoust F. 2007–2024. « Système d’analyse de texte par ordinateur SATO, Manuel de référence 4.4 ». https://sato.ato.uqam.ca/satoman-fr.html.
Daoust F., Duchastel J., Marcoux Y., Rizkallah E. 2008. « Pour un modèle de dépôt de données adapté à la constitution de corpus de recherche ». In : Actes des JADT-2008. 2 vol., Lyon : Presses universitaires de Lyon, t.1, 355–67. http://lexicometrica.univ-paris3.fr/jadt/jadt2008/pdf/daoust-duchastel-marcoux-rizkallah.pdf.
[Daunou P. C. F.] 1790. Plan d’éducation présenté à l’Assemblée nationale au nom des instituteurs publics de l’Oratoire. Paris : Volland.
Fabre P. A. 2023. « La Suppression de la Compagnie de Jésus (1773) ou l’expression d’une Europe mondialisée », Encyclopédie d’histoire numérique de l’Europe. https://ehne.fr/fr/node/22210.
Guillaume J. (éd). 1889. Procès-verbaux du Comité d’instruction publique de l’Assemblée législative. Paris : Imprimerie nationale.
Guillaume J. (éd.) 1891–1958. Procès-verbaux du Comité d’instruction publique de la Convention nationale. 8 vol., Paris : Imprimerie nationale.
Vovelle M. 1997. « Préface ». In : J. Boulad-Ayoub et M. Grenon (éd.) Procès-verbaux du Comité d’instruction publique de l’Assemblée législative et de la Convention nationale (Corpus J. Guillaume). Paris : L’Harmattan, t.1, i–vi.