graph Tolstoy

 

Extracting character networks to explore literary plot dynamics

 

Daniil Skorinkin
DH Centre @ the Higher School of Economics

Talk outline

  1. Literary network analysis. Is it a thing?
  2. Network analysis of 'War and peace'
    1. Extracting networks from 'War and peace'
    2. Do these networks reflect plot dynamics?
    3. War vs peace: testing a literary hypothesis

Literary network analysis 

Is it a thing?

Literary network analysis 

Literary network analysis 

  • Nodes — usually characters
  • Edges — formalized interactions/relations

Why?

Eye candy! 

Not just pretty

  • Combines intuitive visual analysis with strict mathematical formalism (#WinningCombo)

A

Not just pretty

  • Combines intuitive visual analysis with strict mathematical formalism (#WinningCombo)
  • Allows (semi) automatic analysis

A

has the highest degree

has the highest betweenness centrality

Large-scale analysis

Large-scale analysis

RusDraCor 

https://rusdracor.shinyapps.io/showcase/

Seeing the 'unseen'

Seeing the 'unseen'

Network-driven classification (typology)? 

vs

Network analysis of 'War and peace'

Why?

Testing a literary hypothesis

Hypothesis

  • Scholars pinpoint the opposition of 'war' and 'peace' in War and Peace 
  • 'Wartime' and 'peaceful' parts of the novel might have different intensity of interactions
  • Networks are about interactions

=> 

  • ​This difference can be measured with network statistics (network density, diameter, average degree)...
  • ...and maybe even seen with naked eye

I hoped for something like

How?

Extraction steps

  1. Character mentions (Nodes)
    • NER program 
    • + list of characters from Wikipedia
  2. Character interactions (Edges)
    • How to automate extraction?
    • I used simplistic syntax-based IE

Extracting interactions: in search of an optimal way

Cooccurrence network?

  • It works, but the network is rather dense and dirty
  • One example of unwanted interaction:

Александр I, умиротворитель Европы, человек, с молодых лет стремившийся только к благу своих народов, первый зачинщик либеральных нововведений в своем отечестве, теперь, когда, кажется, он владеет наибольшей властью и потому возможностью сделать благо своих народов, в то время как Наполеон в изгнании делает детские и лживые планы о том, как бы он осчастливил человечество, если бы имел власт

Conversational network (dialogue interactions)

  • Much cleaner and more interpretable
  • Hard to extract (speaker is often implicit/anaphoric, listerner almost always implicit)
  • Not all interactions are verbal

NLP-style information extraction (interactions/relations, events)

Голубчик, Денисов! - взвизгнула  Наташа, не помнившая себя от восторга, подскочила к нему,  обняла и  поцеловала  его.

“Darling Denísov!” screamed Natásha, beside herself with rapture, springing to him, putting her arms round him, and kissing him. 

NLP-style information extraction (interactions/relations, events)

  • Again, cleaner and more interpretable
  • Again, harder to extract
  • Available NLP systems tuned for contemporary non-fictional texts

Character interactions:

simplified syntax-based quasi IE

  • Siblings in a syntactic tree (~=заполнение персонажами валентностей одной вершины)

​[Берг] подал руку [Вере]. [Улыбающаяся Жюли Карагина] пошла Николаем] к столу.

Том I, часть 1, глава 15

[Berg] gave his arm [to Véra]. [The smiling Julie Karágina] went in [with Nicholas].

BOOK ONE, CHAPTER XVIII

Character interactions:

simplified quasi IE

  • Siblings in a syntactic tree (~=заполнение персонажами валентностей одной вершины)
  • Easier to extract than a conversational network
  • Much cleaner than a cooccurrence network
  • Appears to be closer to handcrafted standard networks (when compared to 30 handcrafted networks for separate chunks of War and peace)

Interactions (edges):

  • - Что же ты не пьян нынче? - сказал Несвицкий Денисову, когда он подъехал к нему.

  • Пьер, все более и более приходивший в волнение во время этого разговора, встал и подошел к княгине.
    он [Николай] вызвал Наташу и спросил, что такое

  • Голубчик, Денисов! - взвизгнула Наташа, не помнившая себя от восторга, подскочила к нему, обняла и поцеловала его

Interactions (edges):

  • •Our dear countess was too clever with Véra,” said the count. “Well, what of that? She’s turned out splendidly all the same,” he added, winking at Véra.

    •“Sit down; nonsense! Have a drink!” said Anatole, giving a glass to Pierre

    •All Nicholas’ animation vanished. He waited for the first pause in the conversation, and then with a distressed face left the room to find Sónya.

    •About twenty people were present, including Dólokhov and Denísov.

What sort of interactions are they?

Conversations

  • Il faut que vous sachiez que c'est une femme,- сказал  Андрей  Пьеру
  • Это что-то было тончайшее духовное извлечение из вчерашнего его разговора с Каратаевым.
  • - Ah! ne me parlez pas de ce départ, ne m'en parlez pas. Je ne veux pas en entendre parler,- заговорила княгиня таким капризно-игривым тоном, каким она говорила с Ипполитом в гостиной <...>
  • Пьер опять вопросительно посмотрел на Анну Михайловну, спрашивая теперь, что ему делать.

Spatial proximity

  • Только подъезжая к Багратиону, Ростов опять пустил свою лошадь в галоп и, держа руку у козырька, подъехал к нему.
  • Пьер, все более и более приходивший в волнение во время этого разговора, встал и подошел к княгине. Он, казалось, не мог переносить вида слез и сам готов был заплакать.
  • Ростов, тяжело чувствовавший отсутствие своего друга, не имея со времени его отъезда никаких известий о нем и беспокоясь о ходе его дела и раны, воспользовался перемирием и отпросился в госпиталь проведать Денисова.

Physical contact

  • Анна Михайловна мгновенно поняла, в чем дело, и уж нагнулась, чтобы в должную минуту ловко обнять графиню.
  • - Вы, графинюшка, мотовка известная,- проговорил граф и, поцеловав у жены руку, ушел опять в кабинет.
  • Голубчик, Денисов! - взвизгнула Наташа, не помнившая себя от восторга, подскочила к нему, обняла и поцеловала его.

Perception, thought

  • Борис замолчал и, не снимая шинели, вопросительно смотрел на мать
  • <...> Ростов мгновенно узнал своего оплакиваемого обожаемого государя.

Living in the same place

  • И несмотря на то, что Анатоль проживал десятки тысяч, Долохов жил с ним и успел себя поставить так, что Анатоль и все знавшие их уважали Долохова больше, чем Анатоля.
  •  - Я живу у графини Ростовой,- сказал Борис, опять прибавив,- ваше сиятельство.

Visual analysis (simply looking at them)

Entire network

A bit too much

Let's try separate parts of the novel

I том 

III том

Эпилог

Let's try separate parts of the novel

How we visualise

  • Layout: Force Atlas 2 (force-based layout)
  • Node size proportional to node degree 
  • Node color: modularity clustering 1
  • Edge weight & thickness: number of interactions

1Blondel V.D., Guillaume J., Lambiotte R., Lefebvre E., (2008), Fast unfolding of communities in large networks, in Journal of Statistical Mechanics: Theory and Experiment (10), p. 1000 )

1 том 1 часть

1 том 2 часть

 First two parts, different vizualization:

Том 1, часть 2 ("война")

Том 1, часть 1 ("мир")

One can easily see higher network density and higher average degree

1 том 3 часть

2 том 1 часть

2 том 2 часть

2 том 3 часть

2 том 4 часть

And you can always go back to the numbers and to the text

 

The numbers behind Sonya and Nikolai getting closer

Text

Network for 2 том 4 часть

Том 2, часть 4, глава 11

Том 2, часть 4, глава 11

Играли ли в колечко, в веревочку или рублик, разговаривали ли, как теперь, Николай не отходил от Сони и совсем новыми глазами смотрел на нее

<...>

Соня шла, закутавшись в шубку. Она была уже в двух шагах, когда увидала его; она увидала его тоже не таким, каким она знала и какого всегда немножко боялась. Он был в женском платье с спутанными волосами и с счастливой и новой для Сони улыбкой. Соня быстро подбежала к нему.

2 том 5 часть

3 том 1 часть

3 том 3 часть

4 том 1 часть

 Comparing again:

Том 4, часть 3 ("война")

Том 2, часть 1 ("мир")

So, we

  • Came up with a way to extract character networks
  • Checked that these networks correspond to human understanding of interactions between characters 
  • Now we can measure the parameters of the networks and test the hypothesis!

Testing a hypothesis

(at last!)

"War" and "peace" parts

annotated manually, 1 for "peace", 0 for "war"

Number of nodes

Density

Diameter

Average degree

Av. clustering coefficient

Network parameter Correlation with war/peace value
Density 0.65
Diameter -0.533
Average degree 0.73
Average weighted degree 0.714
N conn. components -0.491

Correlation of network parameters with war/peace value 

...and this is somewhat visible:

Next

  • Combine network extraction approaches (syntax + co-occurrence with weight threshold )
  • More fine-grained split 
    • Cut wherever settings changes (60-70 chunks)
  • Compare the distributions

 

Network value distributions

Peace versus war

Thank you for your attention!

Thank you for your attention!

В «Войне и мире» очень много значат семейные объединения, принадлежность героя к «породе». Собственно, Болконские или Ростовы — это больше чем семьи, это целые жизненные уклады <...>.

С. Г. Бочаров. Роман Л. Толстого "Война и мир"

 

 

Группы персонажей 

Точка зрения читателя и центральность героя

Толстой в «Войне и мире», как правило, представляет события и картины в восприятии кого-либо из персонажей, пользуясь его «субъективной призмой».

С. Г. Бочаров. Роман Л. Толстого "Война и мир"

 

 

Indeed, the pace was so slow, and the plot so elusive, that many reviewers were unable to distinguish who the main characters were going to be! <...>

For example we now take for granted that  the principal characters are Pierre, Andrei and Natasha. Thus we may be surprised that reviewers of the first installmentseither couold not identify who the main characters were or else identified them incorrectly

Gary Saul Morson. (1987) Hidden in Plain View: Narrative and Creative Potentials in 'War and Peace'

 

 

Например, 1 том

I

II

III

Спасибо за внимание!

Graph Tolstoy _ Krasnoyarsk

By danilsko

Graph Tolstoy _ Krasnoyarsk

  • 1,293