17 подписчиков

Attribution des textes : théorie et pratique

1 октября 20191 окт 2019

4 мин

Est-il possible de déterminer la paternité d'un texte littéraire ? Oui, et surtout à l'aide de sources d'archives - des documents historiques. S'il est nécessaire de savoir à qui appartient tel ou tel article, qui peut être sous un pseudonyme ou non signé en principe, les chercheurs recherchent la paie dans les archives. Quel que soit le nom qu'une personne a donné en vertu de l'article, elle a reçu de l'argent sous son propre nom pour l'article. Nous pouvons donc comprendre si c'était Pisarev ou Chernyshevsky, Dostoïevski ou Goncharov. D'autres documents peuvent également participer à l'attribution. Par exemple, à l'entrée de Saint-Pétersbourg, des listes de visiteurs sont d'habitude dressées, et nous savons qu'une telle œuvre ne pourrait être publiée par une telle personne si elle n'était pas dans la ville. Tout document est plus important que d'autres moyens d'attribution, et travailler avec de telles sources peut être une véritable enquête.

Mais, par exemple, l'identité de Shakespeare soulève beaucoup de questions : sauf pour le testament, aucun document écrit par lui ne nous est parvenu. Il ya une vue que les œuvres de Shakespeare n'appartiennent pas à Shakespeare de Stradford, et quelqu'un d'autre - beaucoup de candidats. Ou, disons, il n'est pas clair si Homère, quel qu'il soit, a composé les œuvres qui lui sont attribuées - ce ne sont pas seulement des poèmes célèbres, mais aussi les soi-disant "hymnes d'Homère" : il a apparemment vécu à l'époque où il n'y avait aucune écriture en Grèce du tout.

Il y a aussi des situations où il y a des sources, mais elles sont si contradictoires qu'elles peuvent être interprétées en fonction de leur propre vision du sujet. Pour les partisans de la version que Sholokhov a réellement écrite "Quiet Don", le manuscrit survivant de l'œuvre confirme sa paternité, et les opposants à une telle version croient que c'est un texte écrit de sa main, mais composé par une autre personne.

Dans les cas où il n'y a pas de preuves concluantes sous forme de documents, les gens ont recours à des méthodes quantitatives d'analyse. Il s'agit d'un domaine de la linguistique informatique qui utilise un traitement de texte automatique pour identifier certains modèles dans le texte. L'attribution quantitative implique que l'auteur se manifeste d'une manière ou d'une autre dans l'œuvre, laissant une sorte d'"empreinte". On suppose qu'il y a un certain "signal de l'auteur", qui ne dépend pas de l'humeur de l'auteur ni du thème qu'il a écrit. C'est ce qu'on peut appeler le style de l'auteur. Cela signifie que cette "empreinte" peut être établie par des moyens de contrôle objectifs.

Apparition de l'attribution quantitative

L'idée de l'attribution quantitative est venue il y a longtemps. Dans la seconde moitié du XIXe siècle, il y a eu une nouvelle approche de la définition de la paternité des peintures. Elle a été formulée par Giovanni Morelli, qui a demandé une révision de l'approche de l'attribution dans son ensemble. Il a fait valoir qu'il est nécessaire de prêter attention aux détails, tels que la façon dont les oreilles ou les doigts sont dessinés. Il est fort probable que l'artiste ne pensera pas à la façon de dessiner son oreille, parce qu'il a l'habitude de la dessiner d'une manière spéciale. Au XXe siècle, Carlo Ginzburg revient à l'idée de Morelli et la qualifie de "paradigme de la preuve".

La preuve dans le texte est quelque chose que l'auteur ne semble pas contrôler, ce à quoi il ne pense pas quand il écrit. Quelqu'un croit qu'il est possible d'attribuer des textes sur la base des mêmes mots. Un exemple typique est le texte controversé de l'histoire de la littérature russe du XVIIIe siècle, intitulé "Un extrait du voyage B*** I***** T***". Certains critiques littéraires des années 60 du XXe siècle affirment que s'il y a un mot "voyage", cela signifie que l'auteur est Radichtchev, car il est l'auteur de "Voyage de Saint-Pétersbourg à Moscou". Bien sûr, cette hypothèse n'est pas très convaincante, ne serait-ce que parce que nous prêtons attention à un mot aussi significatif, nous l'utilisons consciemment, surtout dans le titre. La piste de l'auteur se trouve dans quelque chose qui ne sera pas surveillé de près par le lecteur, l'auteur, l'éditeur ou toute autre personne.

Thomas Mendenhall, à peu près à la même époque que G. Morelli, a suggéré qu'un tel paramètre incontrôlable pourrait être la longueur du mot. Il a compté la longueur des mots dans les textes de Shakespeare et est arrivé à la conclusion que Francis Bacon, dans les écrits de qui la longueur des mots était approximativement la même, était Shakespeare. Mais, premièrement, Mendenhall a fait une erreur dans les calculs, et deuxièmement, la longueur des mots eux-mêmes n'est pas le paramètre par lequel déterminer l'auteur. Plus tard, des mots, des lexèmes, des distributions de formes de cas et ainsi de suite ont été utilisés pour un tel paramètre. Cependant, tout cela n'a pas donné des résultats convaincants pour tous les résultats.

Méthode Delta

La fracture s'est produite en 2002. John Burrows a écrit un article intitulé "Delta : a measure of the stylistic difference", dans lequel il formule une approche de la quantification de l'auteur. Sa méthode s'appelait "Delta".

Pour chaque mot, nous considérons le z-score. Il est calculé comme le rapport de la différence de la fréquence des mots dans le texte en pourcentage et de la fréquence totale sur le corps par rapport à l'écart type de la fréquence des mots sur le corps. Ensuite, nous prenons la moyenne de toutes les différences entre le z-score et deux textes comparés. C'est le delta.