Débugue tes humanités Saison 1
Séance 08 - Produire des documents
Structuration du texte, introduction à Pandoc et manipulations.
Chaire de recherche du Canada sur les écritures numériques, Bibliothèque des lettres et des sciences humaines, Ouvroir d'histoire de l'art et de muséologie numérique. — antoine.fauchie@umontreal.ca
Plan de la séance #
Rappels : qu’est-ce que structurer un texte ?
Transformer, convertir ou générer
Pandoc : “le couteau suisse de l’édition”
Découverte de Pandoc par la manipulation
1. Rappels : qu’est-ce que structurer un texte ? #
Donner du sens au texte.
1. Rappels : qu’est-ce que structurer un texte ? #
Ne pas attribuer un rendu graphique au texte avant d’avoir attribué un sens.
1. Rappels : qu’est-ce que structurer un texte ? #
1.2. Baliser le texte #
Qualifier le texte :
_Qualifier_ le texte
<em>Qualifier</em> le texte
<marquage typemarq="italique">Qualifier</marquage> le texte
Il s’agit alors de baliser le texte, c’est-à-dire d’indiquer par une convention de signes typographiques les éléments constitutifs du sens du texte, qui ensuite se traduiront par une mise en forme graphique spécifique.
2.1. Que faire du texte balisé ? #
Le balisage n’est qu’une étape intermédiaire.
Car il faut désormais rendre ce balisage lisible, utile ou interrogeable.
2.2. Passer d’un balisage à un autre #
D’un format texte/brut à un autre.
_Qualifier_ le texte
<em>Qualifier</em> le texte
Il s’agit de passer d’un format de fichier à un autre, en automatisant ces transformations.
Typiquement : transformer un fichier Markdown en fichier HTML.
Attention ici, lorsque l’on parle de conversion , il ne s’agit pas d’obtenir un format PDF.
La conversion est la transformation de balises en d’autres balises, et non la production d’une image graphique.
2.3. Paramètres de la conversion #
Les contenus en entrée :
texte balisé
métadonnées sérialisées
bibliographie structurée
Ce qu’il faut comprendre ici c’est que la conversion est un processus qui prendre un certain nombre de données en compte, et pas uniquement le texte balisé.
3. Pandoc : “le couteau suisse de l’édition” #
Pandoc est un logiciel libre (en ligne de commande) de conversion de fichiers texte, créé par John MacFarlane et sous licence GPL.
Markdown ⟷ HTML
Markdown ⟷ LaTeX
HTML ⟷ TEI
HTML ⟷ EPUB
3. Pandoc : “le couteau suisse de l’édition” #
3.1. Fonctionnement de Pandoc #
programme
option
fichier.entrée
Pandoc fonctionne en ligne de commande, avec un schéma classique d’options.
3. Pandoc : “le couteau suisse de l’édition” #
3.2. Exemples #
pandoc mon-fichier-markdown.md
pandoc -f markdown -t html mon-fichier-markdown.md -o mon-fichier-html.html
pandoc -f markdown -t html --template=mon-modele.html mon-fichier-markdown.md -o mon-fichier-html.html
La première commande convertit le fichier en HTML, le format de sortie par défaut de Pandoc.
La deuxième commande fait exactement la même chose, mais elle est plus verbeuse.
La troisième commande applique un modèle ou template , permettant ainsi de structurer le document d’une façon plus précise.
4. Découverte de Pandoc par la manipulation #
4. Découverte de Pandoc par la manipulation #
4.1. Installation de Pandoc #
Suivre les instructions sur cette page : https://docs.zettlr.com/fr/installing-pandoc/
Quelque soit votre système d’exploitation une solution existe.
4. Découverte de Pandoc par la manipulation #
4.2. Créer un document Markdown et le convertir en HTML #
créer un document Markdown avec des niveaux de titre, une liste, une citation longue et de l’emphase (italique et gras)
lancer la commande pandoc mon-fichier.md
en l’adaptant
ouvrir le fichier HTML obtenu
4. Découverte de Pandoc par la manipulation #
4.3. Ajouter des métadonnées #
ajouter des métadonnées à votre document avec un entête du type :
---
title: Le titre de mon document
author: Mon Nom
---
convertir ce fichier Markdown en HTML puis en DOCX
ouvrir les fichiers obtenus, que remarquez-vous ?
4. Découverte de Pandoc par la manipulation #
4.4. Appliquer un modèle #
créer un fichier HTML avec le code suivant :
<html>
<head>
<title>$titre$</title>
<meta name="author" content="$auteur$">
</head>
<body>
<h1 class="titre">$titre$</h1>
<p class="auteur">$auteur$</p>
$if(date)$
<p class="date">$date$</p>
$endif$
<div>$body$</div>
</body>
</html>
lancer la conversion en HTML en appliquant le modèle/template
ouvrir le document obtenu