Names in novels: An experiment in computational stylistics

By Karina van Dalen-Oskam

Huygens Institute for the History of the Netherlands (Royal Netherlands Academy of Arts and Sciences), The Netherlands

Введение

Имя персонажа в произведениях несет разные функции:

  • В основном, как и в жизни, это идентификация
  • Однако также с помощью имени зачастую передается определенная характеристика и идея о персонаже

Введение

При этом описание функций определенного имени в определенном тексте становится актуальным тогда, когда
исследователь может указать, как оно сравнивается с функциями других имен и
самими именами в других текстах

Введение

Исследование Карины ван Дален-Оскам заключается в том, чтобы показать, каким образом квантитативный анализ может помочь достичь более высокий уровень релевентности описаний.

Также предполагается, что разные авторы в разное время в разных жанрах могут применять разные функции имен разными способами, что может указать на тренды с стилизации произведений 

Подобное исследование можно охарактеризовать как "сравнительная литературная ономастика"

Введение

Корпус:

  • 22 голландских романа
  • 22 английских
  • 10 переводов с одного языка на другой
  • 4,499,999 токенов

  • посчитать, сколько форм имен встречается в текстах
  • сколько из них личных, названий мест и т.д.

Анализ использования имен относительно очевиден, и квантитативные метода хорошо подходят для подобных задач:

Однако с анализом функций имен есть сложности:

  • имя может означать определенный "подконтекст", который измерить не просто: это может быть как ассоциативная значимость, манипуляция эмоциями и ожиданиями читателя и прочее
  • имя может нести несколько функций

Типы и функции имен

Типы и функции имен

Также в сюжете могут присутствовать как "внутренние" имена, так и "внешние"

  • "внутренние" относятся к персонажам, местам и остальным сущностям, которые существуют только в сюжете
  • "внешние" - к сущностям, существующих в реальном мире

Например, большинство названий мест в романах - внешние, и несут функцию "приближения к реальности".

Однако в фантастике это не так, и в данном случае функция обратная: добавление "фантастичности" повествованию.

Типы и функции имен

Количество имен в тексте может быть выражено в отношении к числу токенов текста. Но для этого нужно их аккуратно группировать.

  • Patrick and Patrick’s’ - это одна лемма PATRICK

  • Нужно уметь склеивать имена одной сущности (ALFRED ISSENDORF)

Также полезно добавить еще два уровня агрегации: упоминания и токены имени.

Например, на голландском Gerrit-Jan - это один токен, однако на английском Gerrit Jan - уже два

Исследование

Исследование

Исследование

Исследование

Исследование

Исследование

Names in novels: An experiment in computational stylistics

By Artur Kenzhaev

Names in novels: An experiment in computational stylistics

  • 529