Presumably, each national literature has its own famous unsolved attribution case, such as the Shakespearean canon, a collection of Polish erotic poems of the 16th century ascribed to Mikołaj Sęp Szarzyński, the Russian epic poem The Tale of Igor’s Campaign, and many other.
Уже двести лет не прекращается дискуссия о том, что представляет собой «Слово о полку Игореве», — подлинное древнерусское произведение или искусную подделку под древность, созданную в XVIII веке. <...> Гибель единственного списка этого произведения лишает исследователей возможности произвести анализ почерка, бумаги, чернил и прочих материальных характеристик первоисточника. Наиболее прочным основанием для решения проблемы подлинности или поддельности «Слова о полку Игореве» оказывается в таких условиях язык этого памятника.
Речь ведь идет не о простых вещах, вроде того, чтобы помнить, как будет «хлеб» или «ходить» или как образуется прошедшее время от такого-то глагола, а о деталях несравненно более тонких и, главное, чрезвычайно многочисленных
Очень сильно различаются по трудности имитация единичных фактов и имитация системных фактов. Например, изображая деревенскую речь, имитатор может вставлять время от времени несколько запомненных им словечек вроде давеча или намедни — это довольно просто. Гораздо сложнее правильно воспроизвести некоторое системное явление, скажем, яканье. Имитатор произнесет (или напишет) бяда, дяревня, но он вполне может вставить в свою речь и пясать вместо писать, а это уже неверно: и в действительности не участвует в яканье.
1851 — математик А. де Морган предлагает длину слова как признак авторства
1873 — "New Shakspeare Society" Furnival, Fleay et al
1887 — Томас Менденхолл (T. Mendenhall), The Characteristic Curves of Composition, первая известная работа по количественному определению авторства
1867 — Campbell L. The Sophisties and Polilicus of Plato.
1880 — W. Dittenberger,
Sprachliche Kriterien für die Chronologie der Platonischen Dialoge
1890 — W. Lutosławski, Principes de stylométrie
1915 — Морозов Н.А. Лингвистические спектры
(вдохновлен Лютославским)
In summary, the following points are clear:
Most readers and critics behave as though common prepositions, conjunctions, personal pronouns, and articles — the parts of speech which make up at least a third of fictional works in English — do not really exist. But far from being a largely inert linguistic mass which has a simple but uninteresting function, these words and their frequency of use can tell us a great deal about the characters who speak them.
Preface to Computation into Criticism, 1987
<...> a new visualization technique, which combines the idea of nearest neighborhood derived from cluster analysis, the idea of hammering out a clustering consensus from bootstrap consensus tre es, with the idea of mapping textual similarities onto a form of a network. Additionally, network analysis seems to be a good solution for large datasets.
А кто такая Мэри Вестмакотт?
Consecutive segments of Edwards's Mind (1723); throughout the work, Edward's signal (red) dominates over the (absent) signal of Foxcroft.
Consecutive segments of Edwards's Humble Inquiry (1749); in many other fragments, dominated by Edwards (red), Foxcroft's impact is still visible. The lower band shows the strongest signal; the upper, the second strongest.
Unabomber Theodore Kaczynski perpetrated a number of bomb attacks on universities and airlines between 1978 and 1995
Promised to stop if his 35,000-word anti-industrialist “manifesto” was published in major newspapers
Distinctive writing style and turns of phrase enabled him to be identified
Скандал в Консервативной партии
Авторство книги Primary Colors
Дело Дерека Бентли
Adversarial stylometry
Виноградов В. В. (1961) Проблема авторства и теория стилей
М. Ю. Михеев, Л. И. Эрлих (2017 доклад). Идиостиль и определение авторства текста по частотам служебных слов (люди переизобрели Delta, не зная о ней... 🚲 🚲)