Names in novels: An experiment in computational stylistics
By Karina van Dalen-Oskam
Huygens Institute for the History of the Netherlands (Royal Netherlands Academy of Arts and Sciences), The Netherlands
Введение
Имя персонажа в произведениях несет разные функции:
- В основном, как и в жизни, это идентификация
- Однако также с помощью имени зачастую передается определенная характеристика и идея о персонаже
Введение
При этом описание функций определенного имени в определенном тексте становится актуальным тогда, когда
исследователь может указать, как оно сравнивается с функциями других имен и
самими именами в других текстах
Введение
Исследование Карины ван Дален-Оскам заключается в том, чтобы показать, каким образом квантитативный анализ может помочь достичь более высокий уровень релевентности описаний.
Также предполагается, что разные авторы в разное время в разных жанрах могут применять разные функции имен разными способами, что может указать на тренды с стилизации произведений
Подобное исследование можно охарактеризовать как "сравнительная литературная ономастика"
Введение
Корпус:
- 22 голландских романа
- 22 английских
- 10 переводов с одного языка на другой
-
4,499,999 токенов
- посчитать, сколько форм имен встречается в текстах
- сколько из них личных, названий мест и т.д.
Анализ использования имен относительно очевиден, и квантитативные метода хорошо подходят для подобных задач:
Однако с анализом функций имен есть сложности:
- имя может означать определенный "подконтекст", который измерить не просто: это может быть как ассоциативная значимость, манипуляция эмоциями и ожиданиями читателя и прочее
- имя может нести несколько функций
Типы и функции имен
Типы и функции имен
Также в сюжете могут присутствовать как "внутренние" имена, так и "внешние"
- "внутренние" относятся к персонажам, местам и остальным сущностям, которые существуют только в сюжете
- "внешние" - к сущностям, существующих в реальном мире
Например, большинство названий мест в романах - внешние, и несут функцию "приближения к реальности".
Однако в фантастике это не так, и в данном случае функция обратная: добавление "фантастичности" повествованию.
Типы и функции имен
Количество имен в тексте может быть выражено в отношении к числу токенов текста. Но для этого нужно их аккуратно группировать.
-
Patrick and Patrick’s’ - это одна лемма PATRICK
-
Нужно уметь склеивать имена одной сущности (ALFRED ISSENDORF)
Также полезно добавить еще два уровня агрегации: упоминания и токены имени.
Например, на голландском Gerrit-Jan - это один токен, однако на английском Gerrit Jan - уже два
Исследование
Исследование
Исследование
Исследование
Исследование
Исследование
Names in novels: An experiment in computational stylistics
By Artur Kenzhaev
Names in novels: An experiment in computational stylistics
- 613