Les outils d’IA générative se sont désormais immiscés dans tous nos logiciels d’édition, aussi bien pour la rédaction de mail, de documents textuels que pour de l’assistance à la rédaction de fiction ou de dissertation, mais comment faire la différence entre toutes les formes de corrections possibles et mesurer l’intérêt et l’impact de ces outils dans nos pratiques. Cet atelier vise à outiller les chercheur.se.s en SHS sur les outils existants et offrir des pistes pour mesurer leur impact dans leurs pratiques individuelles.
Chaire de recherche du Canada sur les écritures numériques, Bibliothèque des lettres et des sciences humaines, Centre de recherche interuniversitaire sur les humanités numériques. — louis-olivier.brassard@umontreal.ca
Théorie :
Format : 4 séances de 2 heures, sans inscription, participation libre (à justifier pour le certificat des Humanités Numériques)
Théorie et pratique.
Objectifs de la série d’atelier :
Objectifs de cet atelier :
Certificat canadien en Humanités Numériques
En quoi les outils d’aide à la rédaction basés sur l’IA transforme-t-ils le rapport des chercheur·euses à leur texte, au processus d’écriture et aux ?
Nous aborderons :
Des programmes informatiques que nous estimons à la hauteur de l’intelligence humaine ? Le développement des technologies fait évoluer cette définition de l’intelligence non seulement artificielle mais aussi humaine.
‘IA’ depuis 5 ans, a remplacé le ’numérique’ des années 2010, et le ‘cyberespace’ des années 1990 et 2000. (Citation: Vitali-Rosati, 2025) Vitali-Rosati, M. (2025). Manifeste pour des Études Critiques de l’Intelligence Artificielle. Consulté à l’adresse http://blog.sens-public.org/marcellovitalirosati/manifeste-ecia.html .
Définition pratique pour ces ateliers: “un programme informatique qui effectue une prédiction.”
C’est quoi la correction / révision ?
Historique technique des outils
D’après le TLFi → CORRECTEUR, TRICE, subst. et adj.
Homme, femme qui s’arroge ou à qui est dévolu le rôle de corriger des défauts, de rectifier des erreurs sans pour autant infliger de punition corporelle.
TYPOGR. Ouvrier spécialisé qui, dans une imprimerie, est chargé de lire et de corriger les épreuves. Les correcteurs ont deux maladies, les majuscules et les virgules, deux détails qui défigurent ou coupent le vers (HUGO, Corresp., 1859, p. 298).
Rem. 1. a) D’après la fonction, on distingue du correcteur qui révise les épreuves d’un journal le correcteur de labeur qui révise celles d’un ouvrage. b) D’après la hiérarchie on distingue les correcteurs en première (première épreuve), les correcteurs en second (ou en bon à tirer), les correcteurs en tierce (après la mise sous presse). 2. “Le correcteur femme existe aussi; mais cette espèce, du reste très rare”, travaille non pas dans l’atelier typographique, mais “au bureau du patron ou du prote” (d’apr. BOUTMY, Typogr. paris., 1874, p. 29). Sainte-Beuve dans la salle à manger, en famille, avec son secrétaire Troubat, sa correctrice d’épreuves, sa maîtresse (GONCOURT, Journal, 1867, p. 365).
TECHNOL. [Désigne un dispositif]
B. [L’instrument (matériel) de la correction dans diverses techniques]
C. [Le résultat lui-même]
J’en rajoute une autre : entre deux espace-temps différents :
Définition donnée par le Correcteur typographe de Brossard de 1924 :
La rectification, sur le plomb, des erreurs commises par le compositeur, ainsi que l’exécution des changements apportés par l’auteur à la composition du texte primitif sont connus sous la dénomination de correction. De, manière générale, ce mot s’emploie pour désigner toute modification, quelle, qu’elle soit : ajoutés, suppressions, transpositions, changements de texte, rectifications orthographiques, rappels de règles typographiques, etc. (Citation: Brossard, 1924) Brossard, L. (1924). Correcteur typographe. Les règles typographiques / L. -E. Brossard.
Les auteurs ne se font point faute d’ailleurs de se prévaloir en ces circonstances de la liberté que leur accordent les usages, et l’on peut dire qu’en pratique le nombre des épreuves en placards ou en pages à fournir est illimité : suivant ses besoins, et sur sa demande, l’auteur peut recevoir successivement une première d’auteur, une deuxième, une troisième, et même plus si, d’après les corrections ou les modifications qu’il apporte au texte, il l’estime nécessaire : il est seul juge en cette matière, et généralement il ne remet le bon à mettre en pages ou, le cas échéant, le bon à tirer, que s’il répute le texte « amené à son état à peu près définitif ». (Citation: Brossard, 1924) Brossard, L. (1924). Correcteur typographe. Les règles typographiques / L. -E. Brossard.
Signes de correction ortho-typo
La composition est un processus terriblement laborieux
La casse et la galée
Recommandation de @ramatRamatTypographie2008 :
Nombre de lecture en correction
- une lecture très rapprochée pour découvrir les fautes d’orthographe et de typographie.
- relire le texte sans s’occuper des fautes déjà mentionnées, s’attacher au fond et non plus à la forme.
L’inobservation des règles typographiques est, après la coquille, l’une des causes les plus fréquentes de correction : ce fait tient à l’ignorance dans laquelle trop d’ouvriers se trouvent des principes les plus élémentaires de leur art, au dédain même qu’ils affectent à leur égard, à la volonté et au désir de certains auteurs de s’affranchir des prescriptions d’un métier dont ils ne connaissent que des « bribes », à la multiplicité et aussi à un défaut de précision et de, fixité de ces prescriptions : celles-ci semblent en effet varier presque à l’infini, avec chaque région, avec chaque ville, avec chaque maison, avec chaque correcteur et, hélas! presque avec chaque labeur ; chacun ou chacune, a une marche particulière, ou un ensemble de règles typographiques qui leur est propre : dédale sans fin où se perdent même les meilleures volontés et où s’égarent les esprits les plus avertis. (Citation: Brossard, 1924) Brossard, L. (1924). Correcteur typographe. Les règles typographiques / L. -E. Brossard.
On peut aussi entendre révision au sens psycholinguistique => désigne une étape dans le processus scripturaire, étape liée à celle de la planification et de la textualisation.
La continuité révision / écriture s’incarne dans les outils.
Les outils ne se contentent plus de pointer, on est dans le paradigme de la génération de texte.
It’s a different kind of timing, a different rythm. First of all you correct faster and in a more or less indefinite way. Previously, after a certain number of versions (corrections, reasures, cutting and pasting, Tippex), everything came to a halt – that was enough. Not that you thought the text was perfect, but, after a certain period of metamorphosis, the process was interrupted. With the computer, everything is rapid and so easy; you get to thinking that you can go on revising forever. An interminable revision, an infinite analysis is already on the horizon […]. During this same time you no longer retain the slightest visible or objective trace of corrections made the day before.
There was a temporal resistance, a thickness in the duration of erasure.
Les outils incarnent une vision du monde centrée sur la productivité et la rapidité
Tâche de Traitement Automatique des Langues (TAL ou Natural Language Processing, NLP) voisine de la traduction automatique (TA ou machine translation, MT)
Système expert : limité par des grammaires complexes, questions de pragmatique et d’idiomaticité.
Systèmes inductifs ou approches data-driven : D’abord des classifieurs pour prédire le mots le plus probable dans une classe (préposition), puis statistical machine translation (SMT) dans les années 2010.
Alignement d’un corpus parallèle (fonctionne sur une paire de langue) : cooccurrences et tables de phrases. Exemple : Moses
Puis particulièrement Neural machine translation (NMT) depuis 2014 seq2seq
puis Transformers
(Citation: Vaswani
& al.,
2017)
Vaswani,
A.,
Shazeer,
N.,
Parmar,
N.,
Uszkoreit,
J.,
Jones,
L.,
Gomez,
A.,
Kaiser,
L. & Polosukhin,
I.
(2017).
Attention Is All You Need.
https://doi.org/10.48550/arXiv.1706.03762
La NMT : encodage d’un corpus dans les deux langues dans un espace vectoriel continu. Entraînement d’un modèle spécialisé pour la traduction sur des paires de phrases. Puis encodage de la phrase source et décodage dans la langue cible. Exemple : Google Traduction, DeepL.
Source : @wangComprehensiveSurveyGrammar2020; @bryantGrammaticalErrorCorrection2023
Un grand modèle de langue positionne chaque mot dans un espace vectoriel lors de sa phase d’apprentissage initiale à partir d’un grand volume de données en langue naturelle.
Afin de donner une réponse le LLM (GPT, Mistral, Qwen, Llama etc.) situe la requête utilisateur dans son espace vectoriel et sélectionne les tokens les plus probables à partir du contexte donné (la requête utilisateur ou prompt et les tokens qu’il a déjà généré).
Les LLMs sont donc généralistes, ils ne sont pas destinés à la traduction plus qu’à la correction d’erreurs grammaticales ou à l’écriture créative.
NMT : traduction plus littérale, modèle spécialisé.
LLM : traduction plus idiomatique, tendance à la confabulation.
« Furthermore, our frequency analysis of PoS tags reveals that LLMs align more closely with HT in their usage, especially in terms of adverbs, and auxiliary verbs, while NMT models tend to overproduce specific tags in shorter sentences. This suggests that LLMs, although not perfect, are making strides in mimicking human translation patterns. » (Citation: Sizov & al., 2024) Sizov, F., España-Bonet, C., Van Genabith, J., Xie, R. & Dutta Chowdhury, K. (2024). Analysing Translation Artifacts: A Comparative Study of LLMs, NMTs, and Human Translations. Association for Computational Linguistics. https://doi.org/10.18653/v1/2024.wmt-1.116
La fin de la NMT?
« What’s more, IBM announced the deprecation of Watson Language Translator, its NMT service, encouraging users to migrate to — guess what? — WatsonX LLMs. This move establishes IBM as one of the first tech giants to sunset its NMT efforts and focus on LLMs for automated translation purposes. » (Citation: Ciesielski, 2024) Ciesielski, J. (2024). Neural Machine Translation Versus Large Language Models. Consulté à l’adresse https://multilingual.com/magazine/june-2024/neural-machine-translation-versus-large-language-models/
We anticipate that, soon, LLMs will become a viable enterprise solution for translation. This will likely come when we move towards task-specific LLMs trained specifically for translation. These models will be smaller and more practical to deploy and maintain than today’s massive foundational models. (Citation: Ciesielski, 2024) Ciesielski, J. (2024). Neural Machine Translation Versus Large Language Models. Consulté à l’adresse https://multilingual.com/magazine/june-2024/neural-machine-translation-versus-large-language-models/
Les LLMs font la traduction et l’évaluation de la traduction.
La traduction automatique : score BLEU (comparaison de la phrase traduite avec un référentiel de phrases bien traduites, score de proximité), WER (calcul du nombre de mot mal ou non traduit), METEOR etc.
La Grammar Error Correction (GEC) compare la phrase source (avec erreurs), la phrase corrigée et une phrase de référence (la ground truth ou le gold standard donnée par un humain). Cette approche demande un corpus annoté en reference.
Ces mesures reposent sur l’alignement entre une hypothèse et une référence figée.
Les métriques basées sur un corpus de référence limitent la correction a une forme seulement.
Mesure sans référence (Citation: Napoles & al., 2016) Napoles, C., Sakaguchi, K. & Tetreault, J. (2016). There’s No Comparison: Reference-less Evaluation Metrics in Grammatical Error Correction. Association for Computational Linguistics. https://doi.org/10.18653/v1/D16-1228 : comparaison directe de la phrase source (avec erreurs) et de la phrase corrigée avec un LLM.
Méthodes d’évaluation avec un LLM:
« The decrease in correlation as the LLM scale decreases, such as with Llama 2 and GPT-3.5, suggests the importance of the LLM scale. Especially, the decrease in correlation when adding fluent corrected sentences (“+ Fluent corr.”) compared to “Base” implies that smaller-scale LLMs may not adequately consider the fluency of sentences. Possible reasons for this include issues such as LLM’s tendency to produce the same scores (Appendix C) and the inability to interpret the context of prompts as expected by users. However, GPT-4 consistently demonstrated a high correlation and provided more stable evaluations compared to traditional metrics. » (Citation: Kobayashi & al., 2024) Kobayashi, M., Mita, M. & Komachi, M. (2024). Large Language Models Are State-of-the-Art Evaluator for Grammatical Error Correction. https://doi.org/10.48550/arXiv.2403.17540
Les LLM-as-judge signifie que non seulement la correction est effectuée par le LLM mais cette correction est aussi évaluée par le LLM lui-même.
(et limites de l’utilisation de LLM pour évaluer d’autres LLMs : biais favorable du LLM pour ses propres productions (Citation: Wataoka & al., 2025) Wataoka, K., Takahashi, T. & Ri, R. (2025). Self-Preference Bias in LLM-as-a-Judge. https://doi.org/10.48550/arXiv.2410.21819 )
Avant les LLM, les outils de ‘corrections’ sont spécialisés pour la correction ortho-typographique. Maintenant les outils de correction dépassent les limites de la simple correction grammaticale.
Quelle valeur on accorde au travail de relecture et correction ?
Si écrire c’est avant tout réécrire : que signifie déléguer la (re)formulation à un LLM ?
Un gain de temps ?
Une déprise du texte ?
Mouvement de standardisation de la langue reposant sur une sur-norme « légitimée et maintenue par tout un édifice de croyances sur la nature de la langue et sur ce qui est correct ou incorrect, croyances qui sont dictées inévitablement par les valeurs sociales et esthétiques de la société concernée. » (Citation: Lodge, 1993) Lodge, R. (1993). French, from dialect to standard. London ; New York : Routledge.
Effondrement du modèle après entrainement sur ses propres sorties
Perte de diversité après entraînement sur des données synthétiques
We show that while the core content of texts is retained when LLMs polish and rewrite texts, not only do they homogenize writing styles, but they also alter stylistic elements in a way that selectively amplifies certain dominant characteristics or biases while suppressing others - emphasizing conformity over individuality. By varying LLMs, prompts, classifiers, and contexts, we show that these trends are robust and consistent. (Citation: Sourati & al., 2025) Sourati, Z., Karimi-Malekabadi, F., Ozcan, M., McDaniel, C., Ziabari, A., Trager, J., Tak, A., Chen, M., Morstatter, F. & Dehghani, M. (2025). The shrinking landscape of linguistic diversity in the age of large language models. Consulté à l’adresse https://arxiv.org/abs/2502.11266
Des compétences poussées en ingénierie de prompts sont nécessaires pour contourner les effets liés aux approches par défaut. Cependant, même avec l’expertise requise, les LLMs ont tendance à générer des réponses inexactes ou inventées, à revenir à leurs réglages par défaut, rendant les reformulations successives presque inévitables, parfois jusqu’à provoquer un effondrement du modèle. Par conséquent, cette « attraction par défaut » devient un paramètre dont il faut systématiquement tenir compte. (Citation: Paschalidis, 2025) Paschalidis, A. (2025). Vers un langage sans relief ? L’impact de l’IA sur nos mots.
Si une formulation est fortement présente dans le corpus d’entraînement est-ce que c’est nécessairement la meilleure ? L’approche par défaut vaut-elle pour tous les contextes ?
Existe-t-il un seuil, une limite, au-delà de laquelle le recours aux LLMs constitue une perte de maîtrise du texte ?
Dire la même chose avec des mots différents change-t-il le sens ?
« The problem of achieving agreement between our true preferences and the objective we put into the machine is called the value alignment problem: the values or objectives put into Value alignment problem the machine must be aligned with those of the human. » (Citation: Russell & al., 2022) Russell, S. & Norvig, P. (2022). Artificial intelligence: a modern approach (Fourth edition, global edition). Pearson.
L’intelligence humaine commence là où celle de la machine s’arrête. Si on découvre de nouvelles capacités à la machine alors on enlève cette capicité de la définition de l’intelligence humaine. « More than fifteen years ago Hilary Putnam identified the old problem we face to this day: ‘The question that won’t go away is how much what we call intelligence presupposes the rest of human nature’ (1988) » (Citation: McCarty, 2005) McCarty, W. (2005). Humanities Computing (Paperback edition). Palgrave Macmillan.
Autrement dit, si on laisse à la machine cette tâche c’est qu’on tend à l’estimer comme peu valorisante dans notre système de valeur actuel.
Alors que éviter les fautes d’orthographes devient de plus en plus facile, est-ce qu’on devient plus indulgents ?
Currently, academic publishers only allow the use of ChatGPT and similar tools to improve the readability and language of research articles. However, the ethical boundaries and acceptable usage of AI in academic writing are still undefined, and neither humans nor AI detection tools can reliably identify text generated by AI (Citation: Homolak, 2023) Homolak, J. (2023). Exploring the adoption of ChatGPT in academic publishing: insights and lessons for scientific writing. Croatian Medical Journal, 64(3). 205–207. https://doi.org/10.3325/cmj.2023.64.205
It is being increasingly observed that content generated by ChatGPT is going undeclared and undetected, resulting in its appearance in articles published in scholarly journals. […] The general policy among publishers states that AI tools must not be used to create, alter or manipulate original research data and results (Elsevier., 2023; Roche, 2024). (Citation: Strzelecki, 2025) Strzelecki, A. (2025). ‘As of my last knowledge update’: How is content generated by ChatGPT infiltrating scientific papers published in premier journals?. Learned Publishing, 38(1). e1650. https://doi.org/10.1002/leap.1650
Articles contenant des réponses de prompts
Articles contenant des réponses explicites de ChatGPT
Est-ce que négliger la correction revient à négliger la lecture et l’écriture ?
Les moins bons traducteurs sont aidés par la TA mais les meilleurs traducteurs sont désavantagés par la TA. Effet limitant car tendance à se laisser influencer : réduction des intuitions de traduction et de la créativité traductionnelle. (Citation: Schumacher, 2023) Schumacher, P. (2023). La post-édition de traduction automatique en contexte d’apprentissage. Universite de Liege.
Une influence pas négligeable : même quand un.e participant.e n’a plus les recommandations de la machine, iel reproduit les erreurs des recommandations (Citation: Vicente & al., 2023) Vicente, L. & Matute, H. (2023). Humans inherit artificial intelligence biases. Scientific Reports, 13(1). 15737. https://doi.org/10.1038/s41598-023-42384-8 : délégation cognitive ou cognitive offloading
Est-ce que vous avez l’impression, quand vous utilisez un LLM, que sa production est meilleure que la vôtre ? Est-ce que vous avez l’impression que même dans les cas où vous ne vous en servez pas/plus vous continuez à utiliser son vocabulaire ?
Quelle est l’autorité de la machine ?
LLMs non spécialisé : ChatGPT, Mistral, Llama, Claude etc., modèles téléchargés localement (ollama).
Tenir compte des biais du modèle et de son interaction avec lui.
La correction automatique existe avant ChatGPT et les LLM offraient des techniques poussées de GEC mais il fallait encore que de nouveaux usages s’ancrent et qu’il y ait un intérêt économique à maintenir l’utilisateur sur la même plateforme d’où l’intégration de LLM dans l’outil.
Sources sur les technologies d’Antidotes :
Reformulation et IA (décembre 2023)
[ChatGPT peut-il remplacer Antidote ?](août 2025)(https://www.antidote.info/fr/blogue/astuces-et-conseils/chatgpt-peutil-remplacer-antidote)
Une combinaison d’outils spécialisés et utilisant des techniques diverses.
ProLexis (pas de vidéos youtube depuis 3 ans, ProLexis7) Outil professionel, analyseur syntaxique, interface à l’ancienne, powerpoint à l’ancienne.
EditPad : AI detector, humanize AI text, Plagiarim checker, paraphrasing tool, story generator, text summarizer, AI essay writer etc. Probablement juste ChatGPT hooked à une interface avec un system-prompt. Apparamment mauvais according to @bordalejoScarletCloakForest2025
Screenshot Editpad
Corriger = masquer que le texte ne vient pas d’une machine, ou chercher à le détecter?
Writefull: Title generator, Abstract generator, paraphraser, academizer.
Effet de mode = disparition et apparition de solutions miracles (down le 22 septembre, up le 30 septembre mais bug)
Grammarly donne une note à partir des critères de formalité, 4 niveaux : correctness (corrige erreurs grammaticales), clarity (reformulation) engagement (option payante), delivery (payant), plagiarism detection (payant). Option ‘generative AI’ avec des prompts pre-écrits qui restreignent l’usage. Et un browser plugin qui permet de s’en servir avec tous les sites google (docs, gmail, youtube comments).
improve est une option liée à “Generative AI” juste ‘améliorer’.
“Is QuillBot considered AI writing? 2 years ago Updated Everyone’s talking about AI writing these days, and debate over its use — and misuse — rages. QuillBot has helped you grow and improve as a writer, but you may wonder if using it is considered AI writing. Good question. The short answer is “no.” QuillBot’s tools have specific uses, such as correcting grammar or paraphrasing sentences. It’s up to you to use the feedback and suggestions to create content that is solely your own. ChatGPT and similar AI writers, on the other hand, can generate essay-length text from a few prompts. That writing can then be presented with no changes. Since QuillBot is not considered AI writing, most plagiarism checkers will not flag its use.
That said, we make no guarantees if someone uses QuillBot on text generated by a tool like ChatGPT. Why not play it safe and craft the content yourself? (With QuillBot’s help, of course!)
Prise de note :
Notion : génération de texte.
Evernote: RAG
Rédaction de mail etc.