Ist es möglich, die Urheberschaft eines literarischen Textes zu bestimmen? Ja, und vor allem mit Hilfe von Archivquellen - historischen Dokumenten. Wenn es darum geht, herauszufinden, wem dieser oder jener Artikel gehört, der unter einem Pseudonym stehen kann oder prinzipiell nicht unterschrieben ist, suchen Forscher nach der Gehaltsliste im Archiv. Egal welchen Namen eine Person unter dem Artikel angegeben hat, sie hat dafür Geld unter ihrem eigenen Namen erhalten. So können wir verstehen, ob es Pisarev oder Chernyshevsky, Dostoevsky oder Goncharov war. Auch andere Dokumente können an der Attribution teilnehmen. So werden beispielsweise am Eingang von St. Petersburg in der Regel Besucherlisten erstellt, und wir wissen, dass ein solches Werk von einer solchen Person nicht veröffentlicht werden kann, wenn es nicht in der Stadt ist. Jedes Dokument ist wichtiger als andere Arten der Zuordnung, und die Arbeit mit solchen Quellen kann eine echte Untersuchung sein.
Aber zum Beispiel wirft die Identität von Shakespeare viele Fragen auf: Außer dem Testament haben uns keine von ihm verfassten Dokumente erreicht. Es gibt die Ansicht, dass Shakespeares Werke nicht zu Shakespeare of Stradford gehören, und jemand anderen - viele Kandidaten. Oder, sagen wir, es ist nicht klar, ob Homer, wer auch immer er ist, die ihm zugeschriebenen Werke komponiert hat - das sind nicht nur berühmte Gedichte, sondern auch die sogenannten "Homer-Hymnen": Er lebte anscheinend in einer Zeit, in der es in Griechenland überhaupt kein Schreiben gab.
Es gibt auch Situationen, in denen es Quellen gibt, aber sie sind so widersprüchlich, dass sie je nach ihrer eigenen Sichtweise auf das Thema interpretiert werden können. Für die Anhänger der Version, die Sholokhov wirklich "Quiet Don" geschrieben hat, bestätigt das erhaltene Manuskript des Werkes seine Urheberschaft, und die Gegner einer solchen Version glauben, dass es sich um einen Text handelt, der von seiner Hand geschrieben, aber von einer anderen Person verfasst wurde.
In Fällen, in denen es keine überzeugenden Beweise in Form von Dokumenten gibt, greifen die Menschen auf quantitative Analysemethoden zurück. Dies ist ein Bereich der Computerlinguistik, der die automatische Textverarbeitung beinhaltet, um bestimmte Muster in ihr zu identifizieren. Quantitative Attribution bedeutet, dass sich der Autor irgendwie im Werk manifestiert und eine Art "Fingerabdruck" hinterlässt. Es wird angenommen, dass es ein "Autorensignal" gibt, das nicht davon abhängt, in welcher Stimmung der Autor war oder zu welchem Thema er geschrieben hat. Dies kann als Autorenstil bezeichnet werden. Das bedeutet, dass dieser "Fingerabdruck" durch ein objektives Kontrollmittel ermittelt werden kann.
Aussehen der quantitativen Attribution
Die Idee der quantitativen Attribution ist schon vor langer Zeit entstanden. In der zweiten Hälfte des XIX. Jahrhunderts gab es einen neuen Ansatz für die Definition der Autorenschaft von Gemälden. Es wurde von Giovanni Morelli formuliert, der eine Überprüfung des Ansatzes der Attribution als Ganzes forderte. Er argumentierte, dass es notwendig sei, auf Details zu achten, wie z.B. die Zeichnung der Ohren oder Finger. Wahrscheinlich wird der Künstler nicht darüber nachdenken, wie er sein Ohr zeichnen soll, denn er ist es gewohnt, es auf eine besondere Weise zu zeichnen. Im 20. Jahrhundert kehrte Carlo Ginzburg zu Morellis Idee zurück und nannte sie "ein Beweisparadigma".
Die Beweise im Text sind etwas, das der Autor nicht zu kontrollieren scheint, woran er beim Schreiben nicht denkt. Jemand glaubt, dass es möglich ist, Texte auf der Grundlage der gleichen Wörter zu attributieren. Ein typisches Beispiel ist der umstrittene Text in der Geschichte der russischen Literatur des XVIII. Jahrhunderts, der "Ein Auszug aus der Reise B*** I*** T*** T***" genannt wird. Einige Literaturkritiker in den 60er Jahren des XX. Jahrhunderts behaupteten, dass, wenn es ein Wort "Reisen" gibt, dies bedeutet, dass der Autor Radischtschew ist, weil er der Autor von "Reise von St. Petersburg nach Moskau" ist. Natürlich ist diese Hypothese nicht sehr überzeugend, schon allein weil wir auf ein so bedeutendes Wort achten, verwenden wir es bewusst, vor allem im Titel. Die Spur des Autors liegt in etwas, das vom Leser, dem Autor, dem Herausgeber oder sonst jemandem nicht genau beobachtet wird.
Thomas Mendenhall, etwa zur gleichen Zeit wie G. Morelli, schlug vor, dass ein so unkontrollierbarer Parameter die Länge des Wortes sein könnte. Er zählte die Länge der Wörter in Shakespeares Texten und kam zu dem Schluss, dass Francis Bacon, in dessen Schriften die Länge der Wörter ungefähr gleich war, Shakespeare war. Aber erstens hat Mendenhall einen Fehler in den Berechnungen gemacht, und zweitens ist die Länge der Wörter selbst nicht der Parameter, um die Autorschaft zu bestimmen. Spätere Wörter, Lexeme, Verteilungen von Fallformen und so weiter wurden für einen solchen Parameter verwendet. All dies führte jedoch nicht zu überzeugenden Ergebnissen für alle Ergebnisse.
Delta-Verfahren
Die Fraktur erfolgte im Jahr 2002. John Burrows schrieb einen Artikel mit dem Titel "Delta: a measure of the stylistic difference", in dem er einen Ansatz für die Aufgabe der Quantifizierung der Autorenschaft formulierte. Seine Methode wurde "Delta" genannt.
Für jedes Wort betrachten wir den z-Score. Sie wird berechnet als das Verhältnis der Differenz der Wortfrequenz im Text in Prozent und der Gesamtfrequenz am Körper zur Standardabweichung der Wortfrequenz am Körper. Dann nehmen wir den Durchschnitt für alle Unterschiede zwischen z-Score und zwei verglichenen Texten. Das ist das Delta.
Um die Methode zu überprüfen, nahm Burrows den Text in Bezug auf den Kessel.