Publié le 30 mai 2024 Mis à jour le 31 mai 2024
le 4 juillet 2024
Hors les campus, En co-modal
de 9h à 17h

Journée d’étude organisée à l’ENS de Lyon le 4 juillet 2024 dans le cadre du projet "Prépa-EMADIT : Travaux préparatoires en vue de l’étude métalexicographique et automatique du dictionnaire de Trévoux numérisé", soutenu par l'Université Lumière Lyon 2 dans le cadre de son appel à projets pluridisciplinaires interne (2024-2026).

Dans le paysage des dictionnaires universels français, le Dictionnaire Universel François et Latin dit de Trévoux (= DUFLT) a longtemps souffert de l’ombre de l’Encyclopédie de Diderot et d’Alembert (1751-1772). Son audience fut pourtant considérable : il ne connut pas moins de huit éditions (l'abrégé mis à part) entre 1704 et 1771.
Le présent projet APPI intitulé « Prépa-Emadit » vise à préparer le dépôt d’un projet de recherche collaborative auprès de l’Agence nationale de la recherche (ANR) pour sa campagne 2025 qui aura pour acronyme Emadit.
 
Conduit en interdisciplinarité (linguistique, métalexicographie historique, Traitement automatique du langage (TAL) et HN), Prépa-Emadit poursuivra trois objectifs :
- Conduire des études pilotes dans le domaine de l’océrisation et de l’encodage TEI le plus automatisé possible des pages du DUFLT.
- Conduire des études pilotes en vue de l’identification et de la classification des domaines de connaissance mobilisés dans le DUFLT.
- Mettre sur pied une journée d’étude organisée à Lyon autour du DUFLT et de sa numérisation en juillet 2024.
→ Pour participer à cette journée (en présentiel ou à distance par visio-conférence), il est nécessaire de s'inscrire auprès de Denis Vigier, par courriel.

 

Programme des interventions

Format des interventions : 20 minutes + 5 minutes de questions
MATIN
- 8h30 : Accueil, café

- 9h00-9h05 / D. Vigier (U. Lyon 2) . Mot d’introduction. 
- 9h05 - 9h30 / I. Turcan (U. Angers) . Pour une grammaire des marques de domaines : l’exemple de la marine.
- 9h30-9h55 / J.- F. Bianco (U. Angers) . Recherches sur la marque « terme de relation » dans le Trévoux (éd. 1743-1752). Un domaine transversal. 
- 9h55-10h20 / G. Kassiteridis (U. Avignon) & Ch. Wionet (U. Avignon) .  L'emploi de TEI Lex 0 au Dictionnaire universel de Trévoux (1721) 

Pause 10h20-10h35
 
- 10h35 -11h / I. Galleron (U. Paris Sorbonne Nouvelle) & G. Williams (U. Bretagne Sud) . Annoter le Dictionnaire universel : les leçons d'un projet.
- 11h - 11h25 / C. Rey (U. Paris Cergy) . Le Grand Vocabulaire Français (1767-1774) de Charles-Joseph Panckoucke : un anti-Trévoux notoire.
- 11h 25 - 11h 50 / G. Roe (U. Paris Sorbonne) . La présence du Chambers dans l’Encyclopédie: expériences de traduction automatique.

11h50 - 12h30 / Discussion
12h30-14h00 / Déjeuner
APRÈS-MIDI
- 14h00 -14h25 / H. Bohbot (U. Montpellier 3) . Numérisation d'éditions successives : retour d'expérience avec le projet Nénufar et le Petit Larousse.
- 14h25 - 14h50 / J. Chazalon (EPITA Paris) . Un exemple d’extraction et de représentation des données : les annuaires du commerce et cadastre napoléonien
- 14h50 - 15h 15 / V. Eglin (INSA Lyon) . Apport de la multimodalité texte et image pour l'analyse des documents anciens imprimés et manuscrits.
- 15h15- 15h 40 / T. Joliveau (Université St. Étienne) et A. Taroni (CNRS). Un projet cartographique pour l’Encyclopédie. Localiser et géovisualiser les articles géographiques de l'Encyclopédie de Diderot et d'Alembert.
- 15h40-16h05 / L. Moncla (INSA Lyon), J. Velcin (U. Lyon 2), D. Vigier (U. Lyon 2) . Pistes pour une classification automatique des domaines de connaissance dans le Trévoux
 
16h05-17h00 / Discussion finale.  

Titres et résumés (par ordre de passage)

I. TURCAN (Université Angers)
Pour une grammaire des marques de domaines : l’exemple de la marine.
Dans la continuité de nos premières réflexions sur le développement des marques de domaines dans les dictionnaires généraux de langue aux XVIIe et XVIIIe siècles et sur leur importance métalexicographique, nous proposons une réflexion sur les enjeux afférents à ces marques et sur leurs modalités d’exploitation automatisée en prenant l’exemple du vocabulaire de la marine dans le DUFLT
J.-F. BIANCO (Université Angers)
Recherches sur la marque terme de relation dans le Trévoux (éd. 1743-1752). Un domaine transversal ?
Le statut de la marque terme de relation pose question. Les Relations des voyageurs, genre florissant au dix-septième et au dix-huitième siècle, offrent une source aux lexicographes et ouvrent un champ de connaissances aux lecteurs. C'est une sorte de domaine qui croise plusieurs domaines. C'est un nouveau monde lexicologique qui se greffe sur l'ancien monde. Nous proposons, dans la perspective d'un traitement automatisé, quelques recherches sur l'usage et la grammaire de cette marque dans le Trévoux, en comparaison avec d'autres ouvrages, surtout le Dictionnaire de Furetière, évidemment, et l'Encyclopédie.
G. KASSITERIDIS (Université d’Avignon) et C. WIONET (Université d’Avignon)
L'emploi de TEI Lex 0 au Dictionnaire universel de Trévoux (1721)
Il s'agit d'une présentation du modèle de balisage TEI Lex 0 et de son application à un échantillon de la deuxième édition du Dictionnaire universel de Trévoux. Les avantages du modèle seront discutés, notamment, la possibilité d'interopérabilité qu'il permet entre différents dictionnaires informatisés, ainsi que ses limites par rapport au texte du Trévoux. Certaines difficultés liées à la transcription du texte, comme les ligatures, seront également abordées.
I. GALLERON (Université Paris Sorbonne Nouvelle) et G. WILLIAMS (Université Bretagne Sud)
Annoter le Dictionnaire universel : les leçons d'un projet
Le projet BASNUM a mené à bien l'océrisation, puis l'annotation massive du Dictionnaire universel de Basnage de Beauval. Toutefois, entre le point de départ du projet et le point d'arrivée, une distance palpable se constate, à la fois en ce qui concerne la finesse des informations annotées et leur précision. Notre présentation se concentrera sur trois aspects :
1° Ce que l'annotation initialement prévue avait de trop ambitieux.
2° Ce que GROBID a pu faire.
3° Comment il faudrait s'y prendre, si c'était à refaire.
C. REY (Université Paris Cergy)
Le Grand Vocabulaire Français (1767-1774) de Charles-Joseph Panckoucke : un anti-Trévoux notoire. 
En raison de sa filiation étroite avec l'Encyclopédie de Diderot et d’Alembert, le Grand Vocabulaire François (1767-1774) de Charles-Joseph Panckoucke s’est d’emblée inscrit dans la position d'un adversaire avéré et opiniâtre du Dictionnaire Universel français et latin de Trévoux. Nous nous proposons de revenir ici sur l’opposition entre ces deux ouvrages, en faisant état des nombreux griefs et attaques formulés au fil de leurs pages, nous plongeant ainsi dans une querelle lexicographique stimulante.
G. ROE (Université Paris Sorbonne)
La présence du Chambers dans l’Encyclopédie: expériences de traduction automatique
L’Encyclopédie, comme on le sait, a été lancée comme un simple projet de traduction du Cyclopaedia anglais d’Ephraïm Chambers. Vite abandonné, ce projet laisse néanmoins ses traces dans les articles encyclopédiques ; traces parfois difficiles à identifier d’une manière systématique. Cette communication explore une expérience avec des méthodes de traduction automatique et d'alignement de séquences pour comparer le texte de l'Encyclopédie à la Cyclopaedia. En utilisant des techniques avancées de traitement du langage naturel pour analyser les similitudes et les différences entre les textes, nous mettons en lumière les processus de traduction et d'adaptation au XVIIIe siècle.
H. BOHBOT (Université Montpellier 3)
Numérisation d'éditions successives : retour d'expérience avec le projet Nénufar et le Petit Larousse
Le projet Nénufar vise à rendre accessible toutes les éditions du Petit Larousse dans le domaine public (actuellement, 47 éditions de 1906 à 1953). Nous aborderons la stratégie mise en place pour n'avoir à numériser qu'un certain d'éditions clés, le développement d'interface de comparaisons et de corrections ainsi que l'automatisation autant que possible du balisage en XML-TEI et les difficultés rencontrées.
J. CHAZALON (EPITA Paris)
Annuaires du commerce et cadastre napoléonien : extraction et représentation des données.
Cette présentation rapide résumera les principaux enseignements tirés du projet ANR SODUCO concernant l'extraction massive d'entrées dans des annuaires du commerce parisiens du 19e siècle et leur structuration, puis identifiera les limites de cette approche pour l'analyse d'états de sections (tables) du cadastre napoléonien, et présentera finalement les derniers outils utilisés pour ce nouveau projet.
V. ÉGLIN (INSA Lyon)
Apport de la multimodalité texte et image pour l'analyse des documents anciens imprimés et manuscrits
Dans cet exposé seront présentés des résultats d'analyse de documents anciens, imprimés, manuscrits et cartographiques qui exploitent le texte et l'image de manière conjointe pour mieux détecter et reconnaître les informations présentes. Les techniques abordées permettront de montrer l'évolution des méthodes allant de l'OCRisation des images à leur compréhension par des transformers et LLMs. On ciblera également les enjeux liés à l'analyse de corpus rares, pour lesquelles il est nécessaire de compenser les données difficiles à annoter."
T. JOLIVEAU (Université Saint Étienne) et A. TARONI (CNRS)
Sur les 74 000 articles contenus dans  l'Encyclopédie de Diderot et d'Alembert (et Jaucourt), plus de 15 000 décrivent des entités de lieu : localités, rivières, montagnes ... Or l'Encyclopédie ne comprend ni index des lieux ni carte. Un des objectifs du projet Géode a été de localiser et cartographier ces entités en testant différentes méthodes : extraction des coordonnées anciennes du texte, recherche des coordonnées modernes, rattachement à des entités plus vastes ...
L. MONCLA (INSA Lyon), J. VELCIN (Université St. Étienne), D. VIGIER (Université  Lyon 2)
Pistes pour une classification automatique des domaines de connaissances dans le Trévoux
À partir d’une réflexion critique autour de la question des « domaines » dans le Trévoux (tensions notamment entre évolutions au sein de la série et possibilités d'une catégorisation), nous esquisserons quelques pistes possibles pour une classification automatique des domaines de connaissances associables aux articles du Trévoux.

Informations pratiques

Lieu(x)

Hors les campus, En co-modal

ENS Lyon, salle D4 179
La journée sera aussi accessible par visio-conférence.

Partenaires

Projet soutenu par l'Université Lumière Lyon 2 via le dispositif APPI 2024 (appel à projets pluridisciplinaires interne)
 

Contact

Denis VIGIER, professeur en sciences du langage (UFR LESLA / ICAR) :