Quantitative Ansätze zur Untersuchung des frühneuzeitlichen Dramas
Luca Giovannini
Universität Potsdam • Universität Padua
X. DHd-Tagung: Quo vadis, DH?
Passau, 18. Februar 2024
Überblick
- Forschungsfrage
- Vorgehensweise
- Korpus
- Methodologie
- Experimente
- Diskussion
Folien: plu.sh/dhd24
1. Forschungsfrage
Eine literaturwissenschaftliche Frage:
Wie hat sich die Struktur des europäischen Dramas im Lauf der frühen Neuzeit entwickelt?
Forschungslücke
Laut Küpper (2018): fehlende komparatistische Perspektive auf den Entwicklungsprozess der dramatischen Gattung



Ausgangspunkt
Franco Moretti, "Modern European Literature: A Geographical Sketch" (1994)
Kernbegriff aus der Biologie: Allopatrische Artbildung
(Entstehung neuer Tierarten durch die Bewegung in neuen geografischen Räumen)

Entstehung neuer Literaturformen durch die politische und geografische Verteilung Europas
Während der Frühneuzeit "the stable, common features of European drama are replaced by a rapid succession of major formaI mutations.
By the mid seventeenth century, the tragedy of western Europe has branched out in three or four separate versions, where everything has changed: the relationship between word and action, the number of characters, stylistic register, temporal span, plot conventions, spatial movements, verse forms."
(Moretti 2013: 11)
Morettis Sicht auf die Entwicklung der europäischen Tragödie
1400 1500 1600 1700 1800
Einheitliches Modell von europäischer Tragödie
(Einfluss von Seneca und mittelalterlichen Theater)
Nationale Varianten
von Drama
... visualisiert
Was ist hier geschehen?
Fragestellungen / Forschungsziele
-
Wie lässt sich diese Theorie über eine "Verzweigung" der europäischen Tragödie im Lauf des 17. Jahrhunderts empirisch überprüfen?
-
Betrifft ein ähnliches Phänomen auch andere dramatische Gattungen der Zeit (v. a. die Komödie)?
-
Inwiefern lässt sich dieser Entwicklungsprozess durch die Methode der computational literary studies (CLS) erforschen?
- Aufbau eines Korpus von frühneuzeitlichen Dramen ✔️
- Enkodierung und Integrierung in die DraCor-Plattform ✔️
- Berechnung und Vergleich verschiedener Textmetriken✔️
- Reihe von Experimenten zur dramatischen Evolution ⏳
- Literaturwissenschaftliche Auswertung der Ergebnisse 🔜
2. Vorgehensweise
3. Korpus
-
Bestand: 150 Dramen
-
Zeitraum: 150 Jahre (1561-1710) - die Texte verteilen sich gleichmäßig darüber
-
Sprachen: 🇫🇷 🇮🇹 🇩🇪 🇪🇸 🇬🇧

Geburtsorte der Autor:innen im Korpus (durch Wikidata, unvollständig)
Übersicht
Textauswahl und -enkodierung
- Anpassung von Texten, die schon in XML oder in anderen elektronischen Formaten verfügbar sind
- Eigene Enkodierung von Texten, die nur als Scans verfügbar sind (OCR + ezdrama-Tool)
Pipeline:

vgl. Giovannini et al. 2023
-
DraCor (Drama Corpora) ist eine Open-Access-Plattform für Forschung zum europäischen Drama.
-
Derzeit: 17 „programmierbare Korpora“ in 12 verschiedenen Sprachen; mehr als 3000 Texte im XML-TEI-Format.
-
Anwendungen und Werkzeuge für die CLS durch die API (z. B. Berechnung von Netzwerkmetriken und Sprecherverteilung, SPARQL-Suchen auf Linked Open Data usw.)

Integration des Korpus im DraCor-Projekt
Dockerisierung
- Erstellung einer lokal gehosteten Version der DraCor-Plattform, auf der das eigene Korpus hochgeladen werden kann
- Dadurch können alle DraCor-Tools auf eigene Texte angewendet werden
- Dazu: Reproduzierbarkeit der Ergebnisse
- Vgl. Börner et al. 2023

EmDraCor
v1.0

4. Methodologie
- Im Umfeld der Stanford Literary Lab entwickelten Konzept (vg. Allison et al. 2011)
- Die Morphologie eines Werkes (Propp) durch die Messung einzelner textueller Elemente untersuchen
- Auseinandernehmen einer ästhetischen Form bis zu ihren grundlegenden Elementen
- Computationelle/quantitative Analyse dieser Komponenten
Quantitativer Formalismus
Woraus besteht ein Drama?
Die "elementare Bausteinen" der Gattung Drama (nach Kretz 2012: 105)
DIALOG
dialogue
(Hauptraum der Informationsvergabe)
der dialogische Charakter ist die "erste äußere Grundlage" eines Dramas (A. W. Schlegel)
FIGUR
character
"nicht eine physische Entität, sondern eine literarische Konstruktion" (Pfister)
HANDLUNG
plot
"eine Verknüpfung von Begebenheiten" (Lessing) ≈ Fabel (Pfister), sjužet (Formalisten)
Wie kann man diese "elementare Bausteinen" quantifizieren bzw. den Begriff von "Drama" operationalisieren?
Grundansatz:
Netzwerkanalyse
"In der Netzwerkanalyse werden zuvor bestimmte Größen (z. B. Figuren, Autoren, Orte) in ihrer Beziehung zueinander als Netzwerk aus Knotenpunkten (oder Ecken) und Verbindungslinien (auch Kanten, Relationen) untersucht."
(Schumacher 2018, leicht ver.)

Literaturwissenschaftliche Netzwerkanalyse (LiNA)
- LiNA ermöglicht quantitative Untersuchung von Handlung durch die Herstellung von Charakternetzwerken (vgl. Trilcke 2013, Labatut und Bost 2020)
- "We are not analyzing the actual text of the play, but a strict formalization of it". (Fischer und Skorinkin 2021: 522)
LiNA für eine komparative Studie des frühneuzeitlichen Dramas


Beispiel: https://dracor.org/id/ger000008
LiNA über die DraCor-Plattform
LiNA ist nicht genug...
- Netzwerkbasierte Repräsentationen eines Textes sind nützlich, aber limitiert
- Man muss so viel Komponenten eines Dramas wie möglich erfassen, um eine zufriedenstellende Abbildung seiner Struktur zu bieten
Vorbild:
Boris Yarkho (1889-1942)
Mitglied der Moskauer Formalistengruppe
“a very early forerunner of contemporary research practice in the Digital Humanities”
(Fischer, Akimova, und Orekhov, 2019: 7)

Yarkhos Werke zum Drama
- "Die Komödien und Tragödien von Corneille. Eine Studie zur Gattungstheorie" (1920-30?)
- "Sprachverteilung in Fünf-Akt-Tragödien. Eine Frage des Neoklassizismus und der Romantik" (1920-30?)
-
In seinem Hauptwerk Methodik für das genaue Studium der Literatur (2006) enthalten
Berechnung und Betrachtung mehrerer formeller Eigenschaften als Grundlage für die Textanalyse
Operationalisierung
des Begriffes von Drama
Type | Features |
---|---|
Network | Size; Average clustering coefficient; Density; Average path length; Average degree; Diameter; Maximum degree; Number of edges; Number of connected components; Ratio, average degree to maximum degree; Ratio, maximum degree to number of characters; Weighted degree distribution; Protagonism; Mediateness |
Cast and speech | Average characters per scene; Average length of character speech; Speech intensity; Gendered speakers; Collective speakers |
Size | Number of acts; Number of Segments; Word count, whole text; Word count, spoken text; Word count, stage directions; Number of prose lines; Number of verse lines |
Plot | All-in index; Final scene size; Drama change rate |
Kernmethode: Vektorisierung
1. Extraktion/Berechnung einer breiten Palette von Textstatistiken durch die DraCor-API und ad hoc Python-Skripten
2. Verwendung dieser Statistiken zur Aufbau von Vektoren, die die formelle Eigenschaften der Stücken zusammenfassen
num_speakers | num_speakers_ groups |
density (SNA) | avg_degree (SNA) | word_count_sp | |
Musterstück_1 | 10 | 2 | 0.5714 | 3 | 16792 |
Musterstück_2 | 26 | 6 | 0.3422 | 2 | 40098 |
Musterstück_1 = {10, 2, 0.5714, 3, 16792}
Musterstück_2 = {26, 6, 0.3422, 2, 40098}
play embeddings
5. Experimente
- Dramen als Punkte in einem Koordinatensystem repräsentieren (durch Dimensionsreduktion, z.B. PCA)
- Distanzen berechnen (Euklidisch, Kosinus, usw.)
- Cluster identifizieren, die strukturellen Ähnlichkeiten entsprechen sollen
Anwendungsfall der Vektoren
Wenn sich im Verlauf des 17. Jahrhunderts tatsächlich eine fortschreitende formale Differenzierung der Gattung Drama ergab, sollten die Vektoren eine solche Konstellation abbilden:
1561 (Homogeneität) 1710 (Differentiation)
🇫🇷
🇬🇧
🇪🇸
🇮🇹
🇩🇪
Vorläufige Ergebnisse
-
Es gab tatsächlich eine Zunahme der formalen Vielfalt im Korpus...
-
... aber keine deutliche Aufteilung auf nationaler Ebene (vgl. Theorie des kulturellen Netzwerks von Küpper / Clubbs theatergrams)
-
Es ist jedoch möglich, quantitative Profile nationaler Theaterliteraturen auf der Grundlage strukturellen Eigenschaften zu erstellen (work-in-progress)

Nachfolge der Evolution einzelner Metriken

Messung der prozentualen Veränderung von Metriken aller Arten über die Korpora
Metriktypen:
Netzwerk
Charaktere
Ausmaß
Handlung
6. Diskussion
- Kriterien der Korpuszusammenstellung im Hinblick auf das Untersuchungsziel?
-
Ausgestaltung und Vergleich der Vektoren?
- Optionen zur Verkürzung der Vektoren (Featurreduktion)?
- Auswahl der geeigneten Distanzmaße?
-
Bedarf/Nichtbedarf eines Referenzkorpus?
- Replikationsexperiment mit breiteren DraCor-Korpora (🇫🇷 🇬🇧) schon geplant
Input der Begutachter:innen
Vielen Dank für Ihre Aufmerksamkeit!
📧 giovannini@uni-potsdam.de


Danke an: Henny Sluyter-Gäthje, Daniil Skorinkin
- Allison, Sarah, et al. (2011). "Quantitative Formalism: An Experiment". Stanford Literary Lab Pamphlet 1.
- Algee-Hewitt, Mark. "Distributed Character: Quantitative Models of the English Stage, 1550–1900". New Literary History 48, 4, 2017, S. 751-782.
-
Börner, Ingo, et al. "Dockerizing DraCor: A Container-Based Approach to Reproducibility in Computational Literary Studies", in DH2023 Book of Abstracts. Graz: Universität Graz, 2023.
-
Fischer, Frank und Skorinkin, Daniil. "Social Network Analysis in Russian Literary Studies", in: Gritsenko, Daria, Wijermars, Marielle, and Kopotev, Mikhail (hrsg.), The Palgrave Handbook of Digital Russia Studies. Cham: Palgrave Macmillan, 2021, S. 517-536.
-
Fischer, Frank, et al. "Programmable Corpora: Introducing DraCor, an Infrastructure for the Research on European Drama", in DH2019 Book of Abstracts. Utrecht: Universiteit Utrecht, 2019.
-
Giovannini, Luca, et al. (2023). "Distributed Corpus Building in Literary Studies: The DraCor Example". In: DH2023 Book of Abstracts. Universität Graz, 2023.
-
Giovannini, Luca, and Daniil Skorinkin. "Computational approaches to opera libretti". Journal of Computational Literary Studies 2, 2024 (demnächst erscheinend, preprint).
Literatur
-
Küpper, Joachim. The Cultural Net: Early Modern Drama as a Paradigm. Berlin und Boston: De Gruyter, 2018.
-
Kretsch, Nicolette. "Grundelemente (I): Bausteine des Dramas (Figur, Handlung, Dialog)", in Peter Marx (hrsg.), Handbuch Drama. Stuttgart: Metzler, 2012, S. 105-121.
-
Labatut, Vincent and Bost, Xavier. “Extraction and Analysis of Fictional Character Networks: A Survey”. ACM Computing Surveys 52, 5, 2020, S. 1-40.
-
Moretti, Franco. "Modern European Literature: A Geographical Sketch", in Distant Reading. London und New York: Verso, 2013 [1994], S. 1-42 .
-
Pfister, Manfred. Das Drama. Theorie und Analyse. München: Fink, 2001 [1977].
-
Schöch, Christof. "Ein digitales Textformat für die Literaturwissenschaft: Die Richtlinien der Text Encoding Initiative und ihr Einsatz bei Textkonstitution und Textanalyse". Romanische Studien 1, 4, 2016, S. 325–364.
-
Schumacher, Mareike. "Netzwerkanalyse". forTEXT - Literatur digital erforschen, 2018.
-
Szemes, Botond, and Bence Vida. "Tragic and Comical Networks: Clustering Dramatic Genres According to Structural Properties". Workshop on Computational Drama Analysis, Universität Köln, 2022.
-
Trilcke, Peer. "Social Network Analysis (SNA) als Methode einer textempirischen Literaturwissenschaft", in Ajouri, Philip, Mellmann, Katja, und Rauen, Christoph (hrsg.), Empirie in der Literaturwissenschaft. Münster: Brill, 2013, S 201–47.
Literatur
"Morphological variety needs a broader space than the nation; with more cultural 'niches' for mutations to take root, and later contribute to literary evolution. [...] Discontinuous, fractured, the European space functions as a sort of archipelago of (national) sub-spaces, each of them specializing in one formaI variation" (Moretti 2013: 11-12)
#DHd24: Quantitative Ansätze zur Dramenforschung
By luca-giovannini
#DHd24: Quantitative Ansätze zur Dramenforschung
- 35