Laissons le LaTeX aux sado-masochistes

François Ronan-Dubois est le dernier d’une série de chercheurs en sciences humaines à (vouloir) céder aux sirènes de LaTeX. « En fait, LaTeX est sans aucun doute l’une des meilleures manières de produire rapidement et efficacement des documents dans des formats universaux (sic), comme le RTF, le PDF ou le HTML », assure-t-il1. Pour immédiatement tempérer : « mais ça, c’est la théorie […] en pratique, cette fois-ci peut (sic) satisfait du résultat, j’ai repris mon texte et je l’ai rebalisé manuellement en HTML. » C’est que LaTeX n’est pas fait pour « produire rapidement et efficacement des documents dans des formats universaux (sic) ».

Donald Knuth a conçu TeX comme un système de composition, à l’époque de la transition des monotypes vers la photocomposition2. LaTeX facilite l’utilisation de TeX en offrant un accès de plus haut niveau à ses fonctions : il ne s’agit plus de composer un document de la manière la plus précise possible, mais de structurer un document de telle sorte que le logiciel puisse le composer de la manière la plus précise possible3.

LaTeXML et TeX4ht sont certes censés être capables de produire des fichiers HTML à partir d’une source LaTeX, mais ni l’un ni l’autre n’est particulièrement fiable4. Ce qui signifie par extension qu’aucun système ne permet de générer des fichiers ePub à partir d’une source LaTeX, du moins pas sans nécessiter une intervention humaine pour corriger les problèmes qui se présenteront à coup sûr5.

Non, la force de LaTeX réside bien dans sa capacité à débarrasser l’auteur d’un certain nombre de choix complexes comme la manière de composer le texte, de référencer illustrations et tables, de construire un index. Mais quand bien même se cantonnerait-on au print que l’on se tirerait quand même les cheveux : le système BibTeX de gestion des références bibliographiques pose par exemple des problèmes d’adaptation aux normes en vigueur6, et n’est pas exempt de sérieux bogues d’encodage.

LaTeX est sans doute ce qu’il se fait de mieux… si l’on écrit en anglais, que l’on doit afficher beaucoup d’équations et de tables, et que l’on doit générer un PDF sans fioritures. Autrement, c’est une impasse bouchée par une licence qui l’empêche d’évoluer autrement que sous la forme d’une variante.

Les défauts de LaTeX sont en grande partie le reflet des limites des langages de balisage et du concept de séparation de l’apparence et du contenu. (Xe)LaTeX appliqué aux sciences humaines en est un exemple d’autant plus cruel que le travail de Maïeul Rouquette est de premier ordre7. Avant même de pouvoir écrire un seul mot, il faut en passer par quarante pages d’explication des en-têtes d’un document LaTeX, qui règlent, pour la plupart, des aspects formels. Les 200 pages suivantes s’attachent à distinguer « mise en sens » et « mise en forme »… sans donner d’autre exemple de balise purement syntaxique que celle marquant les mots indexés.

Et même lorsqu’elles « mettent en sens », ces balises ont la fâcheuse tendance de s’opposer au sens. Ce n’est pas un problème spécifique à LaTeX : c’est le principal écueil des langages de balisage, aussi légers soient-ils. (Multi)Markdown en souffre aussi, surtout si l’on n’utilise pas les références, qui déportent le balisage dans un « espace » réservé. Mais c’est un problème particulièrement prégnant dans LaTeX : à la complexité de sa mise en place s’ajoute la lourdeur de son utilisation. J’ai du mal à croire que son imposante syntaxe n’ait aucun impact sur la formulation des idées.

La solution pourrait consister à baliser après coup — mais alors, à quoi bon écrire en LaTeX ? Autant écrire en texte brut, la source la plus universelle qui soit, puis appliquer des styles dans un éditeur WYSIWYG ou ajouter du balisage XML ou HTML dans un éditeur de code. Il n’y a que deux solutions apparentes : mettre au point des langages plus subtils, ou déporter la complexité vers des applications hautement spécialisées.

Sauf que les tenants de LaTeX ambitionnent justement de faire la peau à une application hautement spécialisée : Microsoft Word. Il serait temps qu’ils se fassent à l’idée que si Word est aujourd’hui encore utilisé par une majorité de chercheurs en sciences humaines, ce n’est pas uniquement parce que Microsoft a des poches profondes. C’est d’abord et avant tout parce que Word est un excellent outil de traitement de texte, qui a mis à la portée de tous des concepts aussi complexes que… la manière de composer le texte, de référencer illustrations et tables et de construire un index.

Le monde n’a pas besoin d’un logiciel qui a de grandes idées sur la subtile séparation de la forme et du fond ; le monde n’a pas besoin d’un système qui se réclame de l’open source pour cacher son statut d’expérience et justifier son abandon précoce ; le monde n’a pas besoin d’un nouveau langage dont la maîtrise serait réservée aux chantres des digital humanities regardant de haut la vieille garde des historiens marxisants ayant du mal à aligner deux clics. Nous avons besoin d’un outil qui soit meilleur que Microsoft Word.

Ce qui implique de remonter depuis la fin — et la fin, c’est la production d’un travail standardisé (notamment en matière de mise en page et de formatage des références) et agnostique (disponible dans de multiples formes et formats), de la manière la plus simple possible (puisque le but d’un outil est d’être au service de son utilisateur et que tous les chercheurs n’ont pas vocation à devenir des ingénieurs informaticiens). Que LaTeX soit sans doute ce qui se rapproche le plus de cet outil miracle ne fait que montrer le chemin qu’il reste à parcourir.

Peut-être faut-il trouver un juste milieu entre la puissance de l’environnement TeX et la souplesse de la syntaxe Markdown — autrement dit, peut-être faut-il faire évoluer Pandoc8. Markdown a le mérite d’être particulièrement souple : son « socle » simple9 peut-être étendu en fonction des besoins, sans être particulièrement complexifié. Le MultiMarkdown de Fletcher T. Penney est aujourd’hui incontournable10, Fountain est une alternative crédible à FinalDraft11, et j’ai écrit mon dernier livre avec ma propre variante de Markdown, qui explore la question des balises sémantiques.

Tant qu’il respecte les objectifs précités, le langage de balisage importe peu : même si Markdown pourrait bientôt être promu au rang de standard IETF12, la solution pourrait tout aussi bien s’appeler AsciiDoc, Rimu, ou même LaTeX313. Mais ce sont sûrement plus encore des applications permettant d’exploiter ce langage que viendront les plus grandes avancées. Je suis par exemple persuadé qu’une fonction comme le suivi de modifications ne devrait pas être intégrée à un langage, sous peine de le détourner de son usage premier, d’où mon aversion pour CriticMarkup14. Une application comme Ulysses est au contraire un parfait exemple de la manière dont un logiciel de balisage léger peut être dissimulé sous une interface accessible pour générer des fichiers HTML parfaits, de superbes fichiers ePub, et de magnifiques PDF15.

Reste que les fonctions des applications sont suggérées par la structure du langage : si aucune des applications gérant LaTeX n’est particulièrement user-friendly, c’est que le langage ne l’est pas. En attendant l’arrivée de l’outil miracle qui permettra de révéler tout le potentiel de simples fichiers texte aussi universels qu’ouverts et faciles à sauvegarder, on ne pourra que continuer à faire montre de pédagogie envers les utilisateurs de Microsoft Word. Ce qui ne veut pas dire qu’il faut continuer à leur vanter les mérites supposés de LaTeX, qui n’a prouvé qu’une seule chose en trente ans : que sa complexité ne vaut pas sa puissance, et qu’il ne convient donc pas à une majorité de chercheurs.


  1. François Ronan-Dubois, « LaTeX en amont des humanités numériques », Contagions, 04 août 2014. 

  2. Donald Knuth, « Preliminary description of TEX », Stanford Artificial Intelligence Lab DART Archive, 13 mai 1977. 

  3. « An introduction to LaTeX », The LaTeX Project, 09 février 2008. 

  4. Voir William F. Hammond, « The Challenge of Translating LaTeX to HTML », 28 mars 2014, et Heinrich Stamerjohanns, Michael Kohlhase, Deyan Ginev, et alii, « Transforming large collections of scientific publications to XML », Mathematics in Computer Science, 2010, vol. 3, no 3, p. 299–307. 

  5. Le seul des livres électroniques que j’ai édités sur lequel j’ai dû passer un temps fou à bricoler pour passer ePubCheck ? Le seul qui a été écrit en LaTeX et « converti » par TeX4ht. Ce ne sont pas les interventions d’un expert autoproclamé qui ont arrangé les choses, bien au contraire. 

  6. Léo Dumont, « Ajouter un style bibliographique .bst dans MacTeX », 15 juillet 2009. Le fichier de style conforme aux normes françaises, que j’ai eu l’occasion d’utiliser lors de la rédaction de mon mémoire, s’est visiblement perdu dans le déménagement du site du PIREH. 

  7. Maïeul Rouquette (éd.), (Xe)LaTeX appliqué aux sciences humaines, 2012. 

  8. Voir Jean-Daniel Bonjour, « Élaboration et conversion de documents avec Markdown et Pandoc », Informatique ENAC, 01 décembre 2013. 

  9. John Gruber, « Markdown », 17 décembre 2004. 

  10. Fletcher T. Penney, « MultiMarkdown User’s Guide », 23 juin 2014. MultiMarkdown prouve d’ailleurs que Markdown et LaTeX ne s’opposent pas, mais peuvent se compléter : les citations et les glossaires MultiMarkdown sont des citations et des glossaires LaTeX. MultiMarkdown se substitue à LaTeX partout où sa complexité est néfaste, mais exploite sa puissance quand il le faut. 

  11. John August, « Introducing Fountain », 08 février 2012. 

  12. Sean Leonard, « The text/markdown Media Type », 4 juillet 2014. 

  13. Mais plus probablement Markdown, au risque d’insister et de favoriser la querelle de clocher. À ce titre, les travaux sur une « édition » Markdown for scientific writing sont passionnants. 

  14. Gabe Weatherhead, « Everyone’s a Critic: The Critic Markup Language Proposal », 11 février 2013. 

  15. Grâce à un système de « styles », qui n’est pas sans évoquer certains aspects de LaTeX. Je m’en suis servi pour écrire déjà plusieurs centaines d’articles et trois livres, ainsi que pour éditer From the Banks of the Rhine to the Banks of the Mississippi, au départ entièrement écrit dans Microsoft Word.