~antoinentl/t

t/content/p/03/03-03.md -rw-r--r-- 24.1 KiB
e146a504antoinentl edit: versionnement des fichiers PDF a month ago
                                                                                
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
---
title: "Éditer avec le numérique : le cas d'Ekdosis"
chapitre: 3
section: 3
bibfile: "data/03.json"
_build:
  list: always
  publishResources: true
  render: never
---

La reconfiguration des modes de fabrication et d'édition du livre, induite par le numérique, pose la question de l'héritage du modèle imprimé, et de la façon dont les acquis épistémologiques et typographiques peuvent être réinvestis dans le modèle numérique.
L'édition critique est un terrain particulièrement fécond pour étudier ces évolutions et les efforts déployés pour obtenir des artefacts imprimés et numériques _avec_ le numérique.
Nous analysons ces questions avec l'étude de cas d'Ekdosis, chaîne d'édition pour l'édition critique imprimée et numérique, et plus spécifiquement une extension de LaTeX — aussi appelée _package_ ou paquet.
Il s'agit d'un dispositif technique qui invente plutôt qu'il ne duplique, et dont la modélisation présente plusieurs caractéristiques pertinentes pour notre recherche — qui concerne plus globalement les processus techniques d'édition.
Avant de détailler l'origine de ce projet mené par Robert Alessi et le fonctionnement de cet outillage complexe et puissant, nous apportons quelques éléments de contexte sur ce champ particulier qu'est l'édition critique, et nous présentons également le cadre technique et sémantique de LaTeX.
Cette étude de cas entend répondre à la question suivante : comment une chaîne d'édition déploie-t-elle un modèle conceptuel qui conjugue modélisations imprimée et numérique ?


### 3.3.1. L'édition critique : un carrefour scientifique et un défi typographique

L'édition critique relève d'une pratique d'édition bien spécifique, dont l'objectif est la reconstitution et la publication de textes classiques permettant leur étude, via la mise en relation de contenus de natures différentes tels que les sources ou des informations sur les choix éditoriaux.
L'édition critique implique la mise à disposition d'un texte, qui, sans un travail d'édition, serait soustrait à notre connaissance, et dont la forme livresque constitue une _version_ qui fait autorité dans un champ disciplinaire.
L'édition critique est complexe, elle se situe au _carrefour_ — pour reprendre un terme utilisé par Robert Alessi — de différents domaines et approches scientifiques.
Elle peut donner lieu à un objet dont le texte _original_ est la raison d'être d'un travail de reconstitution et de dépouillement, ou à un objet dont les apparats savants constituent l'intérêt d'une démarche profondément critique dans la confrontation de nombreuses sources et commentaires.
L'enjeu ici est de faire autorité avec la mise à disposition d'un artefact imprimé qui résulte d'un travail d'édition, travail qui repose essentiellement sur des choix concernant les textes, et qui dépend d'un art de la composition de la page.

{{< citation ref="alessi_les_2023" page="8" >}}
Faire une édition critique imprimée est de fait le geste qui représente le mieux un rapport scientifique au texte, qui en questionne l’authenticité, le contexte historique, la transmission et finalement le sens.
{{< /citation >}}

Une édition critique imprimée est le résultat de décisions éditoriales complexes qui sont implémentées dans l'espace de la page, la difficulté réside dans l'affichage de ces données textuelles et graphiques, souvent en grand nombre.
Ainsi l'apparat critique doit obligatoirement figurer sur la même page que le texte qu'il commente, tout en laissant suffisamment de place pour celui-ci afin qu'il reste visible et lisible.
Comme nous l'avons vu avec _L'Utopie_ de Thomas Moore et son analyse par Jean-François Vallée{{< renvoi chapitre="1" section="2" >}}, la page est le lieu de choix éditoriaux, les compromis en termes de production de l'objet imprimé conduisant à des pertes irrémédiables.
Les projets d'édition critique présentent des enjeux similaires, il est par exemple parfois nécessaire de disposer, sur un même espace, à la fois des leçons, des variantes, d'un apparat critique et d'un appareil critique {{< cite "cerquiglini_eloge_1989" >}}.
L'édition imprimée est parvenue à résoudre ce défi, faisant l'acquisition d'un savoir-faire en matière de composition typographique, qui s'inscrit dans une plus longue tradition qui débute bien avant les débuts de l'imprimerie à caractères mobiles.
L'édition critique imprimée a ainsi développé des codes sémiotiques qui sont partagés et compris, ils sont le résultat de décisions et d'un jeu de conventions où tout ne peut être montré, et où les contraintes techniques sont totalement intégrées dans les opérations éditoriales.

Le numérique vient fortement bouleverser ces éléments établis, d'une part avec la disponibilité des textes en ligne, et d'autre part avec les possibilités d'affichage des objets numériques (les sites web en premier lieu), remettant en cause la figure d'autorité d'une édition critique, pourtant acquise avec une édition critique imprimée.
Avec une édition numérique, le nombre de données n'est pas limité, il est ainsi possible d'envisager une certaine _exhaustivité informationnelle et communicationnelle_ — pour paraphraser Joana Casenave {{< cite "casenave_ledition_2023" >}}, qui pointe également la nécessité de déterminer des modes de classement et de hiérarchisation de ces informations, ainsi que la définition de trames narratives et de scénarisations pour circuler dans ces ensembles complexes.
L'autorité peut ainsi être reconstituée autour de ces parcours sémiotiques, mais aussi avec la publication des sources de ces objets numériques, dont le versionnement facilite la lecture et la visibilité de ses marqueurs (responsabilités et validations) {{< cite "alessi_quelques_2023" >}}.

Ekdosis, programme ou logiciel de fabrication d'éditions critiques imprimées et numériques, se place dans un double objectif de conserver une tradition paginée — avec le numérique —, tout en permettant d'envisager des usages adaptés au numérique — et donc potentiellement plus exhaustif.
Ekdosis est une implémentation de LaTeX pour faire de l'édition critique — plus spécifiquement un _paquet_ LaTeX —, et donc un système de balisage sémantique et de composition typographique, qui produit deux versions : un format PDF paginé et un format XML-TEI.
Pour mieux comprendre son fonctionnement il est nécessaire de présenter LaTeX en tant que chaîne d'édition.


### 3.3.2. Adopter et adapter LaTeX

Ekdosis est ainsi une application spécifique de LaTeX, et donc hérite d'un grand nombre de ses fonctionnements.
LaTeX est considéré comme un langage de balisage et un système de composition destiné à la mise en forme de documents imprimés, il s'agit de l'une des premières tentatives de séparation du fond et de la forme dans l'histoire des systèmes de publication numérique.
LaTeX consiste plus précisément en des commandes, qui correspondent à des fonctions, qui sont traitées par un interpréteur.
Si le texte est d'une certaine façon _balisé_, le fonctionnement de LaTeX ne repose pas sur des conversions mais plutôt sur des calculs.
Respectant des normes typographiques strictes tout en étant basé sur des fichiers au format texte et des _commandes_, LaTeX est un puissant système de programmation éditoriale {{< cite "guichard_lecriture_2008" >}}.
L'histoire de LaTeX prend part à celle plus large des technologies de l'édition numérique {{< cite "blanc_technologies_2018" >}}.
LaTeX a été développé par et pour les scientifiques, en lien avec plusieurs domaines comme l'informatique, les mathématiques ou la physique.

LaTeX est d'abord fait de TeX, un système de composition typographique qui repose sur un programme et une série de macros.
LaTeX correspond à un ensemble de macros qui facilitent l'usage de TeX, permettant de disposer d'un certain nombre de commandes déjà préformatées pour composer le texte.
TeX a été créé par Donald Knuth — un informaticien et mathématicien — afin de pallier des défauts de mise en forme d'un de ses livres, à la fin des années 1970 {{< cite "knuth_computers_1986" >}}.
Regrettant la pauvreté de la qualité de la composition typographique de la deuxième édition du second volume de son ouvrage _The Art of Computer Programming_, il se met en tête de créer un système informatique d'édition de documents.
Nous sommes à la fin des années 1970, les systèmes de composition et d'impression photographiques remplacent alors les systèmes d'impression mécanique par pression.
Ce qui doit prendre quelques mois à Donald Knuth l'occupe plusieurs années — suscitant au passage le beau projet de typographie générative Metafont.
Dans les années 1980i, Leslie Lamport crée LaTeX (d'où le "La" de LaTeX) pour faciliter l'utilisation de TeX, par l'implémentation d'un ensemble de macro-commandes {{< cite "lamport_latex_1986" >}}.
Sans Leslie Lamport l'utilisation de TeX serait bien plus difficile.

Dans LaTeX il faut distinguer le langage de balisage, le système de composition et la _distribution_.
Le langage de balisage permet d'appliquer des actions sur un texte, par le biais de _commandes_ qui commencent par une contre-oblique `\`, des commandes précises voire parfois complexes (sujettes à des conditions, et parfois verbeuses) qui permettent de gérer de nombreux détails typographiques.
Le sens du texte est qualifié, par extension nous considérons cela comme des déclarations sémantiques qui ont principalement un objectif de rendu graphique dans un document imprimé, via la production d'un fichier PDF — via un format `.dvi`.
LaTeX se situe à l'intersection de l'imprimé et du numérique, faisant usage de pratiques issues de la programmation informatique (format texte des fichiers, commandes textuelles pour indiquer les traitements d'éléments) pour réaliser des compositions typographiques (disposition du texte, calcul de l'affichage des éléments).
Enfin LaTeX requiert une _distribution_, c'est-à-dire un programme complet constitué de l'interpréteur (aussi appelé _compilateur_) LaTeX ainsi que des _paquets_ – des modules ou des extensions qui ont une fonction spécifique traduite par des commandes.
De nombreuses distributions existent, notamment pour prendre en compte des cas spécifiques comme la gestion linguistique dans des langues d'origine non latine, ou pour permettre une compatibilité face à divers systèmes d'exploitation.

LaTeX est utilisé dans plusieurs domaines, surtout académiques, pour la production d'articles, de thèses ou de livres, comme les mathématiques ou l'informatique, et notamment pour sa formidable gestion typographiques des formules mathématiques.
Certaines personnes en sciences humaines y ont également recours pour sa grande fiabilité typographique — parfois via le convertisseur Pandoc.
La communauté LaTeX, répartie selon les distributions et les applications, est importante, tout comme les diverses ressources mises à disposition (manuels, guides, forums, listes de diffusion, etc.){{< n >}}[https://ctan.org](https://ctan.org){{< /n >}}.
LaTeX nécessite un apprentissage, tant en termes de _rédaction_ avec l'utilisation de commandes textuelles, que pour générer les formats de sortie via un terminal.
LaTeX est un système exigeant qui, une fois le temps de prise en main passé et les ressources identifiées, est d'une grande efficacité, par exemple pour des langues non latines, des structurations complexes, ou la génération d'outils du livre comme des index.
Malgré son fonctionnement rigide, LaTeX est un système de composition puissant, extensif et évolutif.

En pratique l'utilisation de LaTeX suit plusieurs étapes.
L'écriture est réalisée dans un fichier au format TeX — avec l'extension `.tex` — via un éditeur de texte ou de code.
Ce fichier qui mêle _texte_ et code{{< n >}}Nous nous refusons à ce dualisme, mais nous distinguons ces deux éléments pour les besoins d'une présentation concise.{{< /n >}} est ensuite compilé par LaTeX pour produire une _sortie_ au format PDF (moyennant un passage par d'autres formats intermédiaires).
Pour modifier le document final (il s'agit la plupart du temps d'un fichier PDF), il faut intervenir à nouveau sur le fichier initial et recompiler LaTeX.

Une des critiques formulées à l'égard de LaTeX est le manque de séparation entre fond (ou structure) et forme (ou composition graphique), qui en fait un bon outil de _composition_ et moins un outil d'_écriture_.
Pour réaliser certaines opérations typographiques, des commandes doivent être intégrées _dans_ le fichier, qui sont parfois uniquement des indications pour l'obtention d'un rendu graphique et non des informations sémantiques.
LaTeX se situe du côté de l'édition plutôt que de celui de l'écriture :

{{< citation ref="allington_latex_2016" lang="en" >}}
What I call the ‘LaTeX fetish’ is the conviction that there is something about LaTeX that makes it good for writing in. As we shall see, arguments in favour of writing in LaTeX are unpersuasive on a rational level: LaTeX is in fact quite bad for writing in (although it could be worse, i.e. it could be TeX). This doesn't mean that people shouldn't use LaTeX at all, but it does mean that people probably ought to stop recommending it as a writing tool.
{{< /citation >}}

Enfin, LaTeX est un logiciel libre, cette caractéristique contribue fortement à sa découverte, son adhésion, et à la constitution d'une communauté active et ouverte.
De nombreux projets l'intègrent, tels que des éditeurs de texte, des services d'écriture et d'édition en ligne (tel que le populaire Overleaf{{< n >}}[https://www.overleaf.com](https://www.overleaf.com){{< /n >}}), ou encore des chaînes d'édition en tant que module permettant de générer un document paginé au format PDF (tels que Zettlr{{< n >}}[https://zettlr.com](https://zettlr.com){{< /n >}}, Quarto{{< n >}}[https://quarto.org](https://quarto.org){{< /n >}}, Stylo{{< n >}}[https://stylo.huma-num.fr](https://stylo.huma-num.fr){{< /n >}}, ou d'autres chaînes utilisant le convertisseur Pandoc).
LaTeX n'est pas en concurrence vis-à-vis de logiciels de publication assistée par ordinateur comme InDesign, QuarkXPress ou Scribus, il propose en effet une autre modélisation de la composition ou plus globalement de l'édition.

Ce détour nous permet de comprendre dans quel cadre s'inscrit Ekdosis, prolongeant une longue tradition typographique, tout en utilisant les potentialités programmatiques du numérique.
Nous pouvons mentionner d'autres usages de LaTeX pour l'édition critique, comme le paquet nommé reledmac {{< cite "dunning_reledmac_2020" >}}.
Celui-ci ne prévoit toutefois pas la génération d'un format XML-TEI et diffère sur certains choix — notamment l'affichage de différentes versions.


### 3.3.3. Le fonctionnement d'Ekdosis

Le nom du logiciel Ekdosis provient du grec ἔκδοσις, qui signifie "publication d'un livre" {{< cite "alessi_ekdosis_2020" >}}, ne laissant aucun doute sur son objet.
Il s'agit d'un paquet LaTeX, pour être plus précis Ekdosis utilise LuaLaTeX : même si la majorité des commandes sont les mêmes, LuaLaTeX se distingue notamment par l'utilisation d'Unicode et de scripts Lua, permettant une plus grande souplesse et une plus grande adaptabilité, notamment pour le multilinguisme — Ekdosis est d'ailleurs conçu pour des éditions critiques multilingues.

{{< citation ref="debouy_edition_2021" >}}
Ekdosis apparaît comme un outil qui combine deux impératifs : celui de produire une édition imprimée s’inscrivant dans une longue tradition philologique et celui de fournir ce que Donald J. Mastronarde et Richard J. Tarrant ont appelé « actionable texts for use in digital research ».
{{< /citation >}}

Ekdosis est un outil pensé pour produire des éditions critiques — imprimées et numériques — via l'utilisation de LaTeX et de ses commandes.
L'usage d'Ekdosis consiste à baliser du texte en indiquant un certain nombre d'informations propres aux éditions critiques, comme les apparats ou les appareils, les collations, les leçons, ou les variants.
Les pages sont composées en prenant en compte ces différentes informations, et un fichier est encodé dans un format numérique XML-TEI.
Ekdosis rassemble ainsi deux objectifs : produire un document imprimé dans la tradition philologique, et générer un format exploitable par les machines en respectant le schéma XML-TEI.
Il s'agit de la rencontre entre deux protocoles établis, à la fois différents et complémentaires.

{{< citation ref="debouy_edition_2021" >}}
[…] Ekdosis permet de réconcilier les deux approches : fournir des éditions critiques fiables et faisant autorité en tant qu’œuvres d’érudition pouvant être présentées aussi bien en version papier pour l’impression qu’en version électronique pour toutes sortes de requêtes sur les données.
{{< /citation >}}

Ekdosis applique deux modélisations, l'une _imprimée_ et l'autre _numérique_, à partir d'une source unique.
Le fait de pouvoir produire deux formats différents tout en ne travaillant que sur une seule source est un avantage important.
Ainsi il n'est pas nécessaire de devoir reporter une correction sur deux fichiers pour obtenir deux artefacts, ici le principe du _single source publishing_ — détaillé par la suite{{< renvoi chapitre="4" section="4" >}} — facilite l'édition.

Le balisage d'Ekdosis comprend des commandes spécifiquement créées pour l'édition critique, nous pouvons en présenter quelques-unes pour comprendre leur fonctionnement.
Nous passons outre les déclarations en en-tête nécessaires pour annoncer quelles éditions, témoins ou versions sont utilisées dans l'édition critique, Estelle Debouy les explicite très clairement dans son article.
Lors de la saisie de l'édition, il est possible de distinguer la leçon choisie des autres versions du même texte dans d'autres éditions (considérées comme secondaires), en indiquant les références de ces sources.

{{< code type="code" legende="Exemple d'une partie d'un document balisé avec Ekdosis, au format LuaTex, extrait d'un article d'Estelle Debouy" >}}
\begin{ekdosis}
  \begin{ekdverse}
  \note[type=testium, labelb=Pompon.20,
    lem=Bucco... manus]{\icite[830]{Lind}}
    Bucco
  \app{
    \lem[wit={E, H2, L, W}]{puriter}
    \rdg[wit={Ba, H1, P}]{furiter}}
  \app{
    \lem[wit=codd]{uti tractes}
    \rdg[source=Ribb]{ut rem tractes}
    \rdg[source=Bo]{ut te tractes}
    \rdg[source=Bergk]{tractes}}.
  \app{
    \lem[wit={E, H, L, P, W}]{-- Laui iam dudum}
    \rdg[wit=Ba]{lauuandunum}} manus.
  \end{ekdverse}
\end{ekdosis}
{{< /code >}}

Dans cet exemple nous pouvons voir comment une leçon est balisée avec l'indication du document source, `\lem[wit={E, H2, L, W}]{puriter}`, ainsi qu'une variante aussi accompagnée de sa source, `\rdg[wit={Ba, H1, P}]{furiter}}`.
`\lem` (_lemma_) correspond à la portion de texte concernée, l'_empan_, et `\rdg` (_reading_) à la _variante_ de ce texte.
Ces informations balisées sont utiles à la fois pour la production du PDF et la génération du XML-TEI.
En effet Ekdosis est en mesure de transformer ce balisage, d'abord en l'interprétant — il correspond à un scénario préalablement défini, les _commandes_ ou les _balises_ étant déterminées dans le logiciel — puis en convertissant ce balisage dans une autre expression — selon un autre scénario.
Ainsi les deux formats XML-TEI et PDF sont conjointement mais néanmoins distinctement générés.
Certaines données ne sont utilisées que pour l'export XML-TEI, c'est le cas du `labelb` du code ci-dessus, utile pour insérer une ancre dans le format encodé.
Cette ancre permet de lier deux données à l'intérieur d'un document TEI — par exemple la description d'une version et la version elle-même, via l'usage d'un identifiant.

Cette chaîne d'édition est un exemple de l'_adaptation_ d'un système de publication dans un contexte bien spécifique, tout en _adoptant_ des principes de calculabilité du texte à des fins d'édition.


### 3.3.4. Éditer _avec_ le numérique ou _en_ numérique

{{< citation ref="alessi_ekdosis_2020" lang="en" >}}
Yet ekdosis can select a handful of versions out of many and display them properly in print while building a database meant to stand for queries and extraction of data.
{{< /citation >}}

Ekdosis est pensé pour produire des éditions critiques _paginées_ de qualité, tout en générant une version numérique en devenir, en cela il relève d'une pratique d'édition _avec_ le numérique plutôt que _en_ numérique.
En effet, si le format de sortie PDF constitue un artefact prêt à être diffusé, qui ne nécessite pas forcément d'être modifié, le format XML-TEI est généré pour une utilisation postérieure qui doit faire l'objet de nouvelles décisions éditoriales quant à l'affichage des informations et à leur disposition — par exemple sur un site web.
Ekdosis se situe dans une position intermédiaire entre un modèle hérité de l'imprimé et un modèle numérique qui permet de produire une édition _en_ numérique.

Ekdosis se distingue des outils habituels d'édition, ceux-ci reposent sur un empilement des informations sémantiques et de leur possible rendu graphique, empilement qui crée une confusion entre le sens et sa signification dans un espace visuel.
Ekdosis, comme LaTeX, consiste en un balisage à la fois procédural et descriptif{{< renvoi chapitre="4" section="2" h3="4" >}} qui permet de renseigner la valeur sémantique de chaque portion de texte, valeur qui est ensuite traduite en une composition graphique ou un encodage numérique.
Dans le cas d'Ekdosis il est par exemple possible d'indiquer des liens avec des identifiants qui renvoient à des références dans différents endroits du document.
Le texte ainsi édité n'est plus une suite d'attributions de styles graphiques mais une série de déclarations auxquelles il est possible de faire correspondre une mise en forme.
Le prix de cette clarification est une certaine verbosité dans le balisage du texte comme nous pouvons le voir ci-dessous.

{{< code type="code" legende="Exemple d'un balisage avec Ekdosis, extrait du manuel de Robert Alessi" >}}

\begin{latin}
  \ekddiv{head=XIII, depth=2, n=6.13, type=section}
  \begin{segment}
  In omni Gallia eorum hominum qui \app{
    \lem[wit=a]{aliquo}
    \rdg[wit=b, alt=in al-]{in aliquo}}
  sunt numero atque honore genera sunt duo. Nam plebes paene
  seruorum habetur loco, quae \app{
    \lem[wit={A,M}, alt={nihil audet (aut et \getsiglum{A1})
      per se}]{nihil audet per se}
    \rdg[wit=A1,nordg]{nihil aut et per se}
    \rdg[wit={R,S,L,N}]{nihil habet per se}
    \rdg[wit=b]{per se nihil audet}}, \app{
    \lem[wit=a]{nullo}
    \rdg[wit=b]{nulli}} adhibetur \app{
    \lem{consilio}

{{< /code >}}

Pour permettre à l'éditeur ou à l'éditrice de suivre son texte, Ekdosis propose un mode d'édition et d'écriture via l'éditeur de texte Emacs, offrant la possibilité de _replier_ des portions de texte et ainsi de faciliter la rédaction.
Cette fonctionnalité est permise par le balisage d'Ekdosis sans pour autant y être intégrée directement, cette possibilité ouvre une perspective déterminante : la modélisation du texte n'a pas une incidence que sur le processus de fabrication des formats et sur les artefacts produits, mais aussi sur les modes d'écriture et d'édition.

Ekdosis, et donc aussi LaTeX, impliquent un certain rapport au texte, celui d'une _composabilité_ sous la forme d'_instructions_ — qui peuvent également être converties en un encodage —, plutôt qu'une série de _déclarations_ sémantiques.
Il s'agit là de deux modélisations du texte et de l'édition sur lesquelles nous revenons par la suite{{< renvoi chapitre="4" section="2" >}}.

L'étude d'Ekdosis démontre la pertinence de distinguer éditer _dans_, _avec_ ou _en_ numérique, avec ici l'élaboration d'un modèle épistémologique intermédiaire et original dans un contexte éditorial éminemment complexe.
Il s'agit d'un modèle parmi d'autres, ces modèles pouvant être observés notamment dans le champ des humanités numériques où de nombreuses expérimentations sont réalisées.
Avant d'aborder une seconde étude de cas, dédiée à une chaîne d'édition _numérique_, nous analysons l'émergence d'une _édition numérique_ en lien avec l'approche des humanités numériques.