Déb/u/o/gue tes humanités
Saison 5 Séance 02

IA et la correction textuelle automatique : quels outils et quelles limites ?

Les outils d’IA générative se sont désormais immiscés dans tous nos logiciels d’édition, aussi bien pour la rédaction de mail, de documents textuels que pour de l’assistance à la rédaction de fiction ou de dissertation, mais comment faire la différence entre toutes les formes de corrections possibles et mesurer l’intérêt et l’impact de ces outils dans nos pratiques. Cet atelier vise à outiller les chercheur.se.s en SHS sur les outils existants et offrir des pistes pour mesurer leur impact dans leurs pratiques individuelles.

Chaire de recherche du Canada sur les écritures numériques, Bibliothèque des lettres et des sciences humaines, Centre de recherche interuniversitaire sur les humanités numériques. — louis-olivier.brassard@umontreal.ca

Plan de l’atelier

Théorie :

  1. Rappels sur les fondements de l’IA
  2. Mise en perspective
  3. Définition et présentation historico-technique des systèmes de GEC
  4. Enjeux/conséquence
  5. Présentation de certains outils
  6. Conclusion/ce qu’il faut retenir

Introduction

Présentation et objectif des ateliers

Format : 4 séances de 2 heures, sans inscription, participation libre (à justifier pour le certificat des Humanités Numériques)

Théorie et pratique.

Objectifs de la série d’atelier :

Objectifs de cet atelier :

Certificat canadien en Humanités Numériques

Certificat canadien en Humanités Numériques

Certificat canadien en Humanités Numériques

Information sur le certificat

IA et révision

En quoi les outils d’aide à la rédaction basés sur l’IA transforme-t-ils le rapport des chercheur·euses à leur texte, au processus d’écriture et aux ?

Nous aborderons :

Les fondamentaux : rappels de l’introduction

Qu’est ce que l’IA ?

Des programmes informatiques que nous estimons à la hauteur de l’intelligence humaine ? Le développement des technologies fait évoluer cette définition de l’intelligence non seulement artificielle mais aussi humaine.

‘IA’ depuis 5 ans, a remplacé le ’numérique’ des années 2010, et le ‘cyberespace’ des années 1990 et 2000. (Citation: , ) (). Manifeste pour des Études Critiques de l’Intelligence Artificielle. Consulté à l’adresse http://blog.sens-public.org/marcellovitalirosati/manifeste-ecia.html .

Définition pratique pour ces ateliers: “un programme informatique qui effectue une prédiction.”

Rappels de l’introduction

Rappels historiques sur l’IA

Démo visuelle

Les LLMs en contexte

Mise en perspective

C’est quoi la correction / révision ?

Historique technique des outils

Essayons de définir…

D’après le TLFi → CORRECTEUR, TRICE, subst. et adj.

Homme, femme qui s’arroge ou à qui est dévolu le rôle de corriger des défauts, de rectifier des erreurs sans pour autant infliger de punition corporelle.

TYPOGR. Ouvrier spécialisé qui, dans une imprimerie, est chargé de lire et de corriger les épreuves. Les correcteurs ont deux maladies, les majuscules et les virgules, deux détails qui défigurent ou coupent le vers (HUGO, Corresp., 1859, p. 298).

Rem. 1. a) D’après la fonction, on distingue du correcteur qui révise les épreuves d’un journal le correcteur de labeur qui révise celles d’un ouvrage. b) D’après la hiérarchie on distingue les correcteurs en première (première épreuve), les correcteurs en second (ou en bon à tirer), les correcteurs en tierce (après la mise sous presse). 2. “Le correcteur femme existe aussi; mais cette espèce, du reste très rare”, travaille non pas dans l’atelier typographique, mais “au bureau du patron ou du prote” (d’apr. BOUTMY, Typogr. paris., 1874, p. 29). Sainte-Beuve dans la salle à manger, en famille, avec son secrétaire Troubat, sa correctrice d’épreuves, sa maîtresse (GONCOURT, Journal, 1867, p. 365).

TECHNOL. [Désigne un dispositif]

B. [L’instrument (matériel) de la correction dans diverses techniques]

C. [Le résultat lui-même]

On peut relever un certain nombre de tensions

J’en rajoute une autre : entre deux espace-temps différents :

1. La révision comme protocole éditorial

Définition donnée par le Correcteur typographe de Brossard de 1924 :

La rectification, sur le plomb, des erreurs commises par le compositeur, ainsi que l’exécution des changements apportés par l’auteur à la composition du texte primitif sont connus sous la dénomination de correction. De, manière générale, ce mot s’emploie pour désigner toute modification, quelle, qu’elle soit : ajoutés, suppressions, transpositions, changements de texte, rectifications orthographiques, rappels de règles typographiques, etc. (Citation: , ) (). Correcteur typographe. Les règles typographiques / L. -E. Brossard.

Les auteurs ne se font point faute d’ailleurs de se prévaloir en ces circonstances de la liberté que leur accordent les usages, et l’on peut dire qu’en pratique le nombre des épreuves en placards ou en pages à fournir est illimité : suivant ses besoins, et sur sa demande, l’auteur peut recevoir successivement une première d’auteur, une deuxième, une troisième, et même plus si, d’après les corrections ou les modifications qu’il apporte au texte, il l’estime nécessaire : il est seul juge en cette matière, et généralement il ne remet le bon à mettre en pages ou, le cas échéant, le bon à tirer, que s’il répute le texte « amené à son état à peu près définitif ». (Citation: , ) (). Correcteur typographe. Les règles typographiques / L. -E. Brossard.

Le correcteur est le chef d’orchestre de la fabrique du livre

Signes de correction ortho-typo

Signes de correction ortho-typo

Les acteurs travaillent l’un après l’autre, faute après faute

La composition est un processus terriblement laborieux

La casse et la galée

La casse et la galée

Science ou artisanat ?

Une science ?

Recommandation de @ramatRamatTypographie2008 :

Nombre de lecture en correction

  • une lecture très rapprochée pour découvrir les fautes d’orthographe et de typographie.
  • relire le texte sans s’occuper des fautes déjà mentionnées, s’attacher au fond et non plus à la forme.

Un travail qui relève de l’artisanat ? voire un art ?

L’inobservation des règles typographiques est, après la coquille, l’une des causes les plus fréquentes de correction : ce fait tient à l’ignorance dans laquelle trop d’ouvriers se trouvent des principes les plus élémentaires de leur art, au dédain même qu’ils affectent à leur égard, à la volonté et au désir de certains auteurs de s’affranchir des prescriptions d’un métier dont ils ne connaissent que des « bribes », à la multiplicité et aussi à un défaut de précision et de, fixité de ces prescriptions : celles-ci semblent en effet varier presque à l’infini, avec chaque région, avec chaque ville, avec chaque maison, avec chaque correcteur et, hélas! presque avec chaque labeur ; chacun ou chacune, a une marche particulière, ou un ensemble de règles typographiques qui leur est propre : dédale sans fin où se perdent même les meilleures volontés et où s’égarent les esprits les plus avertis. (Citation: , ) (). Correcteur typographe. Les règles typographiques / L. -E. Brossard.

2. La correction au cœur de l’écriture

On peut aussi entendre révision au sens psycholinguistique => désigne une étape dans le processus scripturaire, étape liée à celle de la planification et de la textualisation.

La continuité révision / écriture s’incarne dans les outils.

Les outils ne se contentent plus de pointer, on est dans le paradigme de la génération de texte.

L’écriture et le numérique

Rapidité

(Citation: , ) (). Paper Machine. Stanford University Press.

It’s a different kind of timing, a different rythm. First of all you correct faster and in a more or less indefinite way. Previously, after a certain number of versions (corrections, reasures, cutting and pasting, Tippex), everything came to a halt – that was enough. Not that you thought the text was perfect, but, after a certain period of metamorphosis, the process was interrupted. With the computer, everything is rapid and so easy; you get to thinking that you can go on revising forever. An interminable revision, an infinite analysis is already on the horizon […]. During this same time you no longer retain the slightest visible or objective trace of corrections made the day before.

There was a temporal resistance, a thickness in the duration of erasure.

Correcteurs orthographiques et grammaticaux

Les outils incarnent une vision du monde centrée sur la productivité et la rapidité

Histoire de la GEC

La correction d’erreur grammaticales automatique Grammar Error correction

Tâche de Traitement Automatique des Langues (TAL ou Natural Language Processing, NLP) voisine de la traduction automatique (TA ou machine translation, MT)

Système expert : limité par des grammaires complexes, questions de pragmatique et d’idiomaticité.

Systèmes inductifs ou approches data-driven : D’abord des classifieurs pour prédire le mots le plus probable dans une classe (préposition), puis statistical machine translation (SMT) dans les années 2010.

Alignement d’un corpus parallèle (fonctionne sur une paire de langue) : cooccurrences et tables de phrases. Exemple : Moses

Puis particulièrement Neural machine translation (NMT) depuis 2014 seq2seq puis Transformers (Citation: & al., ) , , , , , , & (). Attention Is All You Need. https://doi.org/10.48550/arXiv.1706.03762

La NMT : encodage d’un corpus dans les deux langues dans un espace vectoriel continu. Entraînement d’un modèle spécialisé pour la traduction sur des paires de phrases. Puis encodage de la phrase source et décodage dans la langue cible. Exemple : Google Traduction, DeepL.

Source : @wangComprehensiveSurveyGrammar2020; @bryantGrammaticalErrorCorrection2023

Traduction automatique et LLMs

Un grand modèle de langue positionne chaque mot dans un espace vectoriel lors de sa phase d’apprentissage initiale à partir d’un grand volume de données en langue naturelle.

Afin de donner une réponse le LLM (GPT, Mistral, Qwen, Llama etc.) situe la requête utilisateur dans son espace vectoriel et sélectionne les tokens les plus probables à partir du contexte donné (la requête utilisateur ou prompt et les tokens qu’il a déjà généré).

Les LLMs sont donc généralistes, ils ne sont pas destinés à la traduction plus qu’à la correction d’erreurs grammaticales ou à l’écriture créative.

LLM vs NMT pour la Traduction automatique

NMT : traduction plus littérale, modèle spécialisé.

LLM : traduction plus idiomatique, tendance à la confabulation.

« Furthermore, our frequency analysis of PoS tags reveals that LLMs align more closely with HT in their usage, especially in terms of adverbs, and auxiliary verbs, while NMT models tend to overproduce specific tags in shorter sentences. This suggests that LLMs, although not perfect, are making strides in mimicking human translation patterns. » (Citation: & al., ) , , , & (). Analysing Translation Artifacts: A Comparative Study of LLMs, NMTs, and Human Translations. Association for Computational Linguistics. https://doi.org/10.18653/v1/2024.wmt-1.116

La fin de la NMT?

« What’s more, IBM announced the deprecation of Watson Language Translator, its NMT service, encouraging users to migrate to — guess what? — WatsonX LLMs. This move establishes IBM as one of the first tech giants to sunset its NMT efforts and focus on LLMs for automated translation purposes. » (Citation: , ) (). Neural Machine Translation Versus Large Language Models. Consulté à l’adresse https://multilingual.com/magazine/june-2024/neural-machine-translation-versus-large-language-models/

Le futur de la traduction automatique

We anticipate that, soon, LLMs will become a viable enterprise solution for translation. This will likely come when we move towards task-specific LLMs trained specifically for translation. These models will be smaller and more practical to deploy and maintain than today’s massive foundational models. (Citation: , ) (). Neural Machine Translation Versus Large Language Models. Consulté à l’adresse https://multilingual.com/magazine/june-2024/neural-machine-translation-versus-large-language-models/

Les LLMs font la traduction et l’évaluation de la traduction.

Question d’évaluation

La traduction automatique : score BLEU (comparaison de la phrase traduite avec un référentiel de phrases bien traduites, score de proximité), WER (calcul du nombre de mot mal ou non traduit), METEOR etc.

La Grammar Error Correction (GEC) compare la phrase source (avec erreurs), la phrase corrigée et une phrase de référence (la ground truth ou le gold standard donnée par un humain). Cette approche demande un corpus annoté en reference.

Métriques traditionnelles de GEC

Ces mesures reposent sur l’alignement entre une hypothèse et une référence figée.

Mesure de la correction sans référence

Les métriques basées sur un corpus de référence limitent la correction a une forme seulement.

Mesure sans référence (Citation: & al., ) , & (). There’s No Comparison: Reference-less Evaluation Metrics in Grammatical Error Correction. Association for Computational Linguistics. https://doi.org/10.18653/v1/D16-1228 : comparaison directe de la phrase source (avec erreurs) et de la phrase corrigée avec un LLM.

Méthodes d’évaluation avec un LLM:

« The decrease in correlation as the LLM scale decreases, such as with Llama 2 and GPT-3.5, suggests the importance of the LLM scale. Especially, the decrease in correlation when adding fluent corrected sentences (“+ Fluent corr.”) compared to “Base” implies that smaller-scale LLMs may not adequately consider the fluency of sentences. Possible reasons for this include issues such as LLM’s tendency to produce the same scores (Appendix C) and the inability to interpret the context of prompts as expected by users. However, GPT-4 consistently demonstrated a high correlation and provided more stable evaluations compared to traditional metrics. » (Citation: & al., ) , & (). Large Language Models Are State-of-the-Art Evaluator for Grammatical Error Correction. https://doi.org/10.48550/arXiv.2403.17540

Les LLM-as-judge signifie que non seulement la correction est effectuée par le LLM mais cette correction est aussi évaluée par le LLM lui-même.

Les limites des LLMs pour la GEC

(et limites de l’utilisation de LLM pour évaluer d’autres LLMs : biais favorable du LLM pour ses propres productions (Citation: & al., ) , & (). Self-Preference Bias in LLM-as-a-Judge. https://doi.org/10.48550/arXiv.2410.21819 )

Changement de paradigme

Avant les LLM, les outils de ‘corrections’ sont spécialisés pour la correction ortho-typographique. Maintenant les outils de correction dépassent les limites de la simple correction grammaticale.

Quels enjeux ?

Quelle valeur on accorde au travail de relecture et correction ?

Si écrire c’est avant tout réécrire : que signifie déléguer la (re)formulation à un LLM ?

Un gain de temps ?

Une déprise du texte ?

Homogénéisation de la langue

Mouvement de standardisation de la langue reposant sur une sur-norme « légitimée et maintenue par tout un édifice de croyances sur la nature de la langue et sur ce qui est correct ou incorrect, croyances qui sont dictées inévitablement par les valeurs sociales et esthétiques de la société concernée. » (Citation: , ) (). French, from dialect to standard. London ; New York : Routledge.

Effondrement du modèle après entrainement sur ses propres sorties

Effondrement du modèle après entrainement sur ses propres sorties

Perte de diversité après entraînement sur des données synthétiques

Perte de diversité après entraînement sur des données synthétiques

We show that while the core content of texts is retained when LLMs polish and rewrite texts, not only do they homogenize writing styles, but they also alter stylistic elements in a way that selectively amplifies certain dominant characteristics or biases while suppressing others - emphasizing conformity over individuality. By varying LLMs, prompts, classifiers, and contexts, we show that these trends are robust and consistent. (Citation: & al., ) , , , , , , , , & (). The shrinking landscape of linguistic diversity in the age of large language models. Consulté à l’adresse https://arxiv.org/abs/2502.11266

Des compétences poussées en ingénierie de prompts sont nécessaires pour contourner les effets liés aux approches par défaut. Cependant, même avec l’expertise requise, les LLMs ont tendance à générer des réponses inexactes ou inventées, à revenir à leurs réglages par défaut, rendant les reformulations successives presque inévitables, parfois jusqu’à provoquer un effondrement du modèle. Par conséquent, cette « attraction par défaut » devient un paramètre dont il faut systématiquement tenir compte. (Citation: , ) (). Vers un langage sans relief ? L’impact de l’IA sur nos mots.

Si une formulation est fortement présente dans le corpus d’entraînement est-ce que c’est nécessairement la meilleure ? L’approche par défaut vaut-elle pour tous les contextes ?

La rédaction académique : déprise du texte, déprise du sens ?

Existe-t-il un seuil, une limite, au-delà de laquelle le recours aux LLMs constitue une perte de maîtrise du texte ?

Dire la même chose avec des mots différents change-t-il le sens ?

L’alignement des valeurs et le système de valeurs

« The problem of achieving agreement between our true preferences and the objective we put into the machine is called the value alignment problem: the values or objectives put into Value alignment problem the machine must be aligned with those of the human. » (Citation: & al., ) & (). Artificial intelligence: a modern approach (Fourth edition, global edition). Pearson.

L’intelligence humaine commence là où celle de la machine s’arrête. Si on découvre de nouvelles capacités à la machine alors on enlève cette capicité de la définition de l’intelligence humaine. « More than fifteen years ago Hilary Putnam identified the old problem we face to this day: ‘The question that won’t go away is how much what we call intelligence presupposes the rest of human nature’ (1988) » (Citation: , ) (). Humanities Computing (Paperback edition). Palgrave Macmillan.

Autrement dit, si on laisse à la machine cette tâche c’est qu’on tend à l’estimer comme peu valorisante dans notre système de valeur actuel.

Alors que éviter les fautes d’orthographes devient de plus en plus facile, est-ce qu’on devient plus indulgents ?

Des ‘petites’ corrections finales ?

Currently, academic publishers only allow the use of ChatGPT and similar tools to improve the readability and language of research articles. However, the ethical boundaries and acceptable usage of AI in academic writing are still undefined, and neither humans nor AI detection tools can reliably identify text generated by AI (Citation: , ) (). Exploring the adoption of ChatGPT in academic publishing: insights and lessons for scientific writing. Croatian Medical Journal, 64(3). 205–207. https://doi.org/10.3325/cmj.2023.64.205

It is being increasingly observed that content generated by ChatGPT is going undeclared and undetected, resulting in its appearance in articles published in scholarly journals. […] The general policy among publishers states that AI tools must not be used to create, alter or manipulate original research data and results (Elsevier., 2023; Roche, 2024). (Citation: , ) (). ‘As of my last knowledge update’: How is content generated by ChatGPT infiltrating scientific papers published in premier journals?. Learned Publishing, 38(1). e1650. https://doi.org/10.1002/leap.1650

Articles contenant des réponses de prompts

Articles contenant des réponses de prompts

Articles contenant des réponses explicites de ChatGPT

Articles contenant des réponses explicites de ChatGPT

Est-ce que négliger la correction revient à négliger la lecture et l’écriture ?

Effet nivelant et influence de la machine

Les moins bons traducteurs sont aidés par la TA mais les meilleurs traducteurs sont désavantagés par la TA. Effet limitant car tendance à se laisser influencer : réduction des intuitions de traduction et de la créativité traductionnelle. (Citation: , ) (). La post-édition de traduction automatique en contexte d’apprentissage. Universite de Liege.

Une influence pas négligeable : même quand un.e participant.e n’a plus les recommandations de la machine, iel reproduit les erreurs des recommandations (Citation: & al., ) & (). Humans inherit artificial intelligence biases. Scientific Reports, 13(1). 15737. https://doi.org/10.1038/s41598-023-42384-8 : délégation cognitive ou cognitive offloading

Est-ce que vous avez l’impression, quand vous utilisez un LLM, que sa production est meilleure que la vôtre ? Est-ce que vous avez l’impression que même dans les cas où vous ne vous en servez pas/plus vous continuez à utiliser son vocabulaire ?

Quelle est l’autorité de la machine ?

Quelques outils

Outils généralistes

LLMs non spécialisé : ChatGPT, Mistral, Llama, Claude etc., modèles téléchargés localement (ollama).

Tenir compte des biais du modèle et de son interaction avec lui.

L’effet ‘AI-powered’

La correction automatique existe avant ChatGPT et les LLM offraient des techniques poussées de GEC mais il fallait encore que de nouveaux usages s’ancrent et qu’il y ait un intérêt économique à maintenir l’utilisateur sur la même plateforme d’où l’intégration de LLM dans l’outil.

Outils spécialisés

Les outils historiques (francophones)

Antidote

Sources sur les technologies d’Antidotes :

Reformulation et IA (décembre 2023)

[ChatGPT peut-il remplacer Antidote ?](août 2025)(https://www.antidote.info/fr/blogue/astuces-et-conseils/chatgpt-peutil-remplacer-antidote)

Une combinaison d’outils spécialisés et utilisant des techniques diverses.

ProLexis (pas de vidéos youtube depuis 3 ans, ProLexis7) Outil professionel, analyseur syntaxique, interface à l’ancienne, powerpoint à l’ancienne.

Les nouveaux outils

EditPad : AI detector, humanize AI text, Plagiarim checker, paraphrasing tool, story generator, text summarizer, AI essay writer etc. Probablement juste ChatGPT hooked à une interface avec un system-prompt. Apparamment mauvais according to @bordalejoScarletCloakForest2025

Screenshot Editpad

Screenshot Editpad

Corriger = masquer que le texte ne vient pas d’une machine, ou chercher à le détecter?

Writefull: Title generator, Abstract generator, paraphraser, academizer.

Effet de mode = disparition et apparition de solutions miracles (down le 22 septembre, up le 30 septembre mais bug)

Grammarly donne une note à partir des critères de formalité, 4 niveaux : correctness (corrige erreurs grammaticales), clarity (reformulation) engagement (option payante), delivery (payant), plagiarism detection (payant). Option ‘generative AI’ avec des prompts pre-écrits qui restreignent l’usage. Et un browser plugin qui permet de s’en servir avec tous les sites google (docs, gmail, youtube comments).

improve est une option liée à “Generative AI” juste ‘améliorer’.

quillbot

“Is QuillBot considered AI writing? 2 years ago Updated Everyone’s talking about AI writing these days, and debate over its use — and misuse — rages. QuillBot has helped you grow and improve as a writer, but you may wonder if using it is considered AI writing. Good question. The short answer is “no.” QuillBot’s tools have specific uses, such as correcting grammar or paraphrasing sentences. It’s up to you to use the feedback and suggestions to create content that is solely your own. ChatGPT and similar AI writers, on the other hand, can generate essay-length text from a few prompts. That writing can then be presented with no changes. Since QuillBot is not considered AI writing, most plagiarism checkers will not flag its use.

That said, we make no guarantees if someone uses QuillBot on text generated by a tool like ChatGPT. Why not play it safe and craft the content yourself? (With QuillBot’s help, of course!)

Intégration dans tous les autres outils

Prise de note :

Notion : génération de texte.

Evernote: RAG

Rédaction de mail etc.

Conclusion

À retenir

Prochaines séances

Bibliographie

Brossard (1924)
(). Correcteur typographe. Les règles typographiques / L. -E. Brossard.
Ciesielski (2024)
(). Neural Machine Translation Versus Large Language Models. Consulté à l’adresse https://multilingual.com/magazine/june-2024/neural-machine-translation-versus-large-language-models/
Corbı́-Bellot, Forcada, Ortiz-Rojas, Pérez-Ortiz, Ramı́rez-Sánchez, Sánchez-Martı́nez, Alegria, Mayor & Sarasola (2005)
, , , , , , , & (). An open-source shallow-transfer machine translation engine for the romance languages of Spain.
Derrida (2005)
(). Paper Machine. Stanford University Press.
Guo, Shang, Vazirgiannis & Clavel (2024)
, , & (). The Curious Decline of Linguistic Diversity: Training Language Models on Synthetic Text. https://doi.org/10.48550/arXiv.2311.09807
Homolak (2023)
(). Exploring the adoption of ChatGPT in academic publishing: insights and lessons for scientific writing. Croatian Medical Journal, 64(3). 205–207. https://doi.org/10.3325/cmj.2023.64.205
Kobayashi, Mita & Komachi (2024)
, & (). Large Language Models Are State-of-the-Art Evaluator for Grammatical Error Correction. https://doi.org/10.48550/arXiv.2403.17540
Lodge (1993)
(). French, from dialect to standard. London ; New York : Routledge.
Maity, Deroy & Sarkar (2024)
, & (). How Ready Are Generative Pre-trained Large Language Models for Explaining Bengali Grammatical Errors?. https://doi.org/10.48550/arXiv.2406.00039
McCarty (2005)
(). Humanities Computing (Paperback edition). Palgrave Macmillan.
Napoles, Sakaguchi & Tetreault (2016)
, & (). There’s No Comparison: Reference-less Evaluation Metrics in Grammatical Error Correction. Association for Computational Linguistics. https://doi.org/10.18653/v1/D16-1228
Paschalidis (2025)
(). Vers un langage sans relief ? L’impact de l’IA sur nos mots.
Russell & Norvig (2022)
& (). Artificial intelligence: a modern approach (Fourth edition, global edition). Pearson.
Schumacher (2023)
(). La post-édition de traduction automatique en contexte d’apprentissage. Universite de Liege.
Shumailov, Shumaylov, Zhao, Papernot, Anderson & Gal (2024)
, , , , & (). AI models collapse when trained on recursively generated data. Nature, 631(8022). 755–759. https://doi.org/10.1038/s41586-024-07566-y
Sizov, España-Bonet, Van Genabith, Xie & Dutta Chowdhury (2024)
, , , & (). Analysing Translation Artifacts: A Comparative Study of LLMs, NMTs, and Human Translations. Association for Computational Linguistics. https://doi.org/10.18653/v1/2024.wmt-1.116
Sourati, Karimi-Malekabadi, Ozcan, McDaniel, Ziabari, Trager, Tak, Chen, Morstatter & Dehghani (2025)
, , , , , , , , & (). The shrinking landscape of linguistic diversity in the age of large language models. Consulté à l’adresse https://arxiv.org/abs/2502.11266
Strzelecki (2025)
(). ‘As of my last knowledge update’: How is content generated by ChatGPT infiltrating scientific papers published in premier journals?. Learned Publishing, 38(1). e1650. https://doi.org/10.1002/leap.1650
Turing (1950)
(). Computing Machinery and Intelligence. Mind, LIX(236). 433–460. https://doi.org/10.1093/mind/LIX.236.433
Vaswani, Shazeer, Parmar, Uszkoreit, Jones, Gomez, Kaiser & Polosukhin (2017)
, , , , , , & (). Attention Is All You Need. https://doi.org/10.48550/arXiv.1706.03762
Vicente & Matute (2023)
& (). Humans inherit artificial intelligence biases. Scientific Reports, 13(1). 15737. https://doi.org/10.1038/s41598-023-42384-8
Vitali-Rosati (2025)
(). Manifeste pour des Études Critiques de l’Intelligence Artificielle. Consulté à l’adresse http://blog.sens-public.org/marcellovitalirosati/manifeste-ecia.html
Wataoka, Takahashi & Ri (2025)
, & (). Self-Preference Bias in LLM-as-a-Judge. https://doi.org/10.48550/arXiv.2410.21819
Yoshimura, Kaneko, Kajiwara & Komachi (2020)
, , & (). SOME: Reference-less Sub-Metrics Optimized for Manual Evaluations of Grammatical Error Correction. International Committee on Computational Linguistics. https://doi.org/10.18653/v1/2020.coling-main.573

Merci à vous !