это статистический анализ отклонений между литературными стилями разных авторов или жанров
Oxford Dictionary
лежит гипотеза о том, что у авторского стиля есть как осознаваемая, так и не осознаваемая автором составляющая
Encyclopaedia of Statistical Sciences
in all their variety of material and method, have two features in common: the <...> texts they study have to be coaxed to yield numbers, and the numbers themselves have to be processed via statistics.
M. Eder, M. Kestemont, J. Rybicki. ‘Stylo’: a package for stylometric analyses
По-видимому, в разных стилях книжной и разговорной речи <...> частота употребления разных типов слов различна. Точные изыскания в этой области помогли бы установить структурно-грамматические, а отчасти и семантические различия между стилями <...>
В.В. Виноградов (1938) Введение в грамматическое учение о слове
Споры об авторстве
Presumably, each national literature has its own famous unsolved attribution case, such as the Shakespearean canon, a collection of Polish erotic poems of the 16th century ascribed to Mikołaj Sęp Szarzyński, the Russian epic poem The Tale of Igor’s Campaign, and many other.
Eder M. (2011) Style-markers in authorship attribution: A cross-language study of the authorial fingerprint.
Уже двести лет не прекращается дискуссия о том, что представляет собой «Слово о полку Игореве», — подлинное древнерусское произведение или искусную подделку под древность, созданную в XVIII веке. <...> Гибель единственного списка этого произведения лишает исследователей возможности произвести анализ почерка, бумаги, чернил и прочих материальных характеристик первоисточника. Наиболее прочным основанием для решения проблемы подлинности или поддельности «Слова о полку Игореве» оказывается в таких условиях язык этого памятника.
A.А. Зализняк. "Слово о полку Игореве": взгляд лингвиста.
Лоренцо Валла (1407 – 1457)
1851 — математик А. де Морган предлагает длину слова как признак авторства
1873 — New Shakespeare Society (Furnival, Fleay et al)
1887 — Томас Менденхолл (T. Mendenhall), The Characteristic Curves of Composition, первая известная работа по количественному определению авторства
1867 — Campbell L. The Sophisties and Polilicus of Plato.
1880 — W. Dittenberger,
Sprachliche Kriterien für die Chronologie der Platonischen Dialoge
1890 — W. Lutosławski, Principes de stylométrie
1915 — Морозов Н.А. Лингвистические спектры
(вдохновлен Лютославским)
1937 — Bolling, G.M. The Past Tense of 'To Be' in Homer
1938 — Carroll, J.B. Diversity of vocabulary and the harmonic series law of word-frequency distribution
как обычно, прорыв случился в 60-е
In summary, the following points are clear:
Most readers and critics behave as though common prepositions, conjunctions, personal pronouns, and articles — the parts of speech which make up at least a third of fictional works in English — do not really exist. But far from being a largely inert linguistic mass which has a simple but uninteresting function, these words and their frequency of use can tell us a great deal about the characters who speak them.
Preface to Computation into Criticism, 1987
Виноградов В. В. (1961) Проблема авторства и теория стилей
А кто такая Мэри Вестмакотт?
Что это за две группы?
То же самое! But wait:)
Consecutive segments of Edwards's Mind (1723); throughout the work, Edward's signal (red) dominates over the (absent) signal of Foxcroft.
Consecutive segments of Edwards's Humble Inquiry (1749); in many other fragments, dominated by Edwards (red), Foxcroft's impact is still visible. The lower band shows the strongest signal; the upper, the second strongest.
Unabomber Theodore Kaczynski perpetrated a number of bomb attacks on universities and airlines between 1978 and 1995
Promised to stop if his 35,000-word anti-industrialist “manifesto” was published in major newspapers
Distinctive writing style and turns of phrase enabled him to be identified
Скандал в Консервативной партии
Авторство книги Primary Colors
Дело Дерека Бентли
Adversarial stylometry
stylo(gui = FALSE, corpus.dir = "corpus", analysis.type = "PCV")
stylo(gui = FALSE, corpus.dir = "corpus", analysis.type = "PCV" , write.png.file = TRUE)