But the study of literature and authorship is not only who wrote what, and who didn’t: it can be also about similarities and differences between texts by different authors
Maciej Eder, Jan Rybicki (2016). Go Set A Watchman while we Kill the Mockingbird in Cold Blood, with Cats and Other People
Жанры: Шекспир
Датировка: Диккенс
Датировка: Толстой
Датировка: 1000 романов
Агата Кристи
Агата Кристи
А кто такая Мэри Вестмакотт?
Оригиналы и переводы
Оригиналы
Maciej Eder, Jan Rybicki
Переводы на английский
Maciej Eder, Jan Rybicki
Переводы на польский
Maciej Eder, Jan Rybicki
Переводы на польский
Maciej Eder, Jan Rybicki
Набоков
Jan Rybicki
"Ночь и день" Вирджинии Вулф, перевод на польский
Anna Kołyszko -> Magda Heydel
Maciej Eder, Jan Rybicki
Влияние редактора
Влияние редактора
Consecutive segments of Edwards's Mind (1723); throughout the work, Edward's signal (red) dominates over the (absent) signal of Foxcroft.
Влияние редактора
Consecutive segments of Edwards's Humble Inquiry (1749); in many other fragments, dominated by Edwards (red), Foxcroft's impact is still visible. The lower band shows the strongest signal; the upper, the second strongest.
rolling.classify()
- еще нет GUI :((
- для русского: rolling.classify(corpus.lang = "Other")
- можно использовать не только Delta — например, авторы stylo и статьи про Харпер Ли используют обычно SVM:
- rolling.classify(corpus.lang = "Other", classification.method = "svm")
Стилеметрия вне литературы
За пределами литературы
-
Unabomber Theodore Kaczynski perpetrated a number of bomb attacks on universities and airlines between 1978 and 1995
-
Promised to stop if his 35,000-word anti-industrialist “manifesto” was published in major newspapers
-
Distinctive writing style and turns of phrase enabled him to be identified
За пределами литературы
-
Скандал в Консервативной партии
-
Авторство книги Primary Colors
-
Дело Дерека Бентли
-
Adversarial stylometry
Стилометрия и контр-стилометрия
- деанонимизация
- разработка стилевых анонимизаторов
- определение демографических параметров
- определение родного языка по стилю языка неродного
И даже по стилю кода! :-0
Стилометрия в СМИ
Источники по стилометрии:
- Style-markers in authorship attribution: A cross-language study of the authorial fingerprint (хорошая статья Мачея Эдера)
- А тут его прочие статьи: scholar.google.com/citations?user=Kn3f_uIAAAAJ&hl=en
- ... и статьи его коллеги Яна Рыбицкого (тут, в частности, про переводы): scholar.google.de/citations?user=6HavmgcAAAAJ&hl=en
- Лекция Рыбицкого: youtu.be/XoZ2HMYw2U4
- Про Харпер Ли: dh2016.adho.org/static/data/169.html
- Сайт Stylo и вся документация: sites.google.com/site/computationalstylistics/stylo
Кстати, а у нас-то что, не было после Морозова стилометристов?
Meanwhile in (Soviet) Russia
-
Виноградов В. В. (1961) Проблема авторства и теория стилей
- Мартыненко Г.Я. (1988) Основы стилеметрии
- Мухин М.Ю. (2011) Лексическая статистика и идиостиль автора: корпусное идеографическое исследование на материале произведений М. Булгакова, В. Набокова, А. Платонова и М. Шолохова
-
М. Ю. Михеев, Л. И. Эрлих (2017 доклад). Идиостиль и определение авторства текста по частотам служебных слов (люди переизобрели Delta, не зная о ней... 🚲 🚲)
Beyond authorship
By danilsko
Beyond authorship
- 1,114