By Karina van Dalen-Oskam
Huygens Institute for the History of the Netherlands (Royal Netherlands Academy of Arts and Sciences), The Netherlands
Имя персонажа в произведениях несет разные функции:
При этом описание функций определенного имени в определенном тексте становится актуальным тогда, когда
исследователь может указать, как оно сравнивается с функциями других имен и
самими именами в других текстах
Исследование Карины ван Дален-Оскам заключается в том, чтобы показать, каким образом квантитативный анализ может помочь достичь более высокий уровень релевентности описаний.
Также предполагается, что разные авторы в разное время в разных жанрах могут применять разные функции имен разными способами, что может указать на тренды с стилизации произведений
Подобное исследование можно охарактеризовать как "сравнительная литературная ономастика"
Корпус:
4,499,999 токенов
Анализ использования имен относительно очевиден, и квантитативные метода хорошо подходят для подобных задач:
Однако с анализом функций имен есть сложности:
Также в сюжете могут присутствовать как "внутренние" имена, так и "внешние"
Например, большинство названий мест в романах - внешние, и несут функцию "приближения к реальности".
Однако в фантастике это не так, и в данном случае функция обратная: добавление "фантастичности" повествованию.
Количество имен в тексте может быть выражено в отношении к числу токенов текста. Но для этого нужно их аккуратно группировать.
Patrick and Patrick’s’ - это одна лемма PATRICK
Нужно уметь склеивать имена одной сущности (ALFRED ISSENDORF)
Также полезно добавить еще два уровня агрегации: упоминания и токены имени.
Например, на голландском Gerrit-Jan - это один токен, однако на английском Gerrit Jan - уже два