or how we learned that J.K. Rowling was also Robert Galbraith
Daniil Skorinkin, German Palchikov
Yerevan, August 2023
Стилометрия — это не магия и не «волшебная пуля»
Есть случаи, когда никакая статистика вам автора не определит
Но есть метод, который при определенных условиях работает (т.е. не на конкретном наборе авторов/ книг, а регулярно и на любом языке)
Есть применения за пределами авторства
Dimensionality reduction methods (PCA MDS tSNE etc)
Hierarchical philogenetic tree style dendrograms
Weighted graphs
(Weighted networks)
Применять к разным языкам
Stylochronology
Collaboration
Translation
1851 — A. De Morgan suggests mean word-length as an authorship feature
1873 — New Shakespeare Society (Furnival, Fleay et al)
1887 — T. Mendenhall, The Characteristic Curves of Composition, the first known work on quantitative authorship attribution