Dramen als ›Small Worlds‹?
Netzwerkdaten zur Geschichte und Typologie deutschsprachiger Dramen 1730-1930
https://lina.digital
Peer Trilcke¹, Frank Fischer², Mathias Göbel², Dario Kampkaspar³, Christopher Kittel⁴
- Seminar für Deutsche Philologie, Univ. Göttingen
- Staats- und Universitätsbibliothek Göttingen
- Herzog August Bibliothek Wolfenbüttel
- Karl-Franzens-Universität Graz
Präsentation: http://lina.digital/presentations/2016-leipzig/
Leipzig, »DHd 2016«, 10.3.2016
Präsentation lizenziert unter CC-BY 4.0.
Gliederung
- Einleitung
- Dramen als ›Small Worlds‹? Idee
- Dramen als ›Small Worlds‹? Studie
- Ausblick
Die dlina-Arbeitsgruppe
Team
- dlina = digital literary network analysis
- interinstitutionelle Arbeitsgruppe aus Literaturwissenschaftlern und Informatikern
- Mitglieder: Frank Fischer, Dario Kampkaspar, Christopher Kittel, Mathias Göbel, Hanna-Lena Meiners, Peer Trilcke, Andreas Vogel
- Dokumentation …
Die dlina-Arbeitsgruppe
Derzeitiges Arbeitskorpus: »dlina Corpus 15.07«
Die dlina-Arbeitsgruppe
Ziel
- automatisierte, philologisch kuratierte Extraktion, Analyse und Interpretation von Netzwerkdaten aus dramatischen Texten
- Netzwerkdaten = Interaktionen zwischen Figuren
- Operationalisierung von ›Interaktion‹: Wenn zwei Figuren innerhalb eines vorgegebenen Segments (Szene/Auftritt; Akt/Aufzug) des Dramas jeweils einen Sprechakt vollziehen, dann interagieren sie miteinander.
Die dlina-Arbeitsgruppe
- Informationen zur automatisierten Extraktion und Analyse der Netzwerkdaten
- Fokus heute: Wie interpretiert man die gewonnenen Daten?
2. Dramen als ›Small Worlds‹?
Idee
Interpretationsszenarien,
zum Beispiel
Typen von Dramen-Netzwerken
Literaturtheoretische Hintergrund-Hypothesen
- Dramen als kontextsensible ästhetische Modelle sozialer Formationen, d.h. …
- … Dramen stellen soziale Formationen dar (z.B. Kleinfamilie, Königshof, ›Gesellschaft‹);
- … diese sozialen Formationen bestehen nur in der ästhetischen Darstellung, als Modelle;
- … diese Modelle sind (zumindest potenziell) kontextsensibel, stehen also in Wechselwirkung mit realen sozialen Formationen.
Typen von Dramen-Netzwerken:
›Small World‹-Idee
Ansatz: Bezug auf netzwerkanalytische Typologie
- Netzwerktyp der ›Small World‹ (zuerst bei Watts & Strogatz 1998; cf. Watts 2004);
- »widespread in biological, social and man-made systems« (Watts & Strogatz 1998, 442)
- »highly clustered, like regular lattices, yet have small characteristic path lengths, like random graphs« (Watts & Strogatz 1998, 440)
- Vorläufer in der Anwendung auf Dramen (hier: Shakespeare): Stiller, Nettle & Dunbar 2003; Stiller & Hudson 2005
- im Folgenden: Anwendung auf die automatisiert (zugleich philologisch kuratiert) extrahierten Netzwerkdaten des dlina-Korpus
Typen von Dramen-Netzwerken:
›Small World‹-Idee
Definition von ›Small World‹-Netzwerken
- 1. Kriterium: Clustering Coefficient (C) des beobachteten Netzwerks ist signifikant höher als der C eines entsprechenden Random-Netzwerks
- 2. Kriterium: Average Path Length (APL) des beobachteten Netzwerks weicht nicht signfikant ab von der APL eines entsprechenden Random-Netzwerks
Typen von Dramen-Netzwerken:
›Small World‹-Idee
Zusatzkriterium: ›Scale Free‹
- ›Scale Free‹-Netzwerke als Variante von ›Small World‹-Netzwerken (beschrieben von Albert & Barabási 2002);
- weisen zusätzlich eine Node Degree Distribution mit Power Law auf
Typen von Dramen-Netzwerken:
›Small World‹-Idee
Kriterien (Indikatoren) im Überblick
- 1. Kriterium: Clustering Coefficient (C) des beobachteten Netzwerks ist signifikant höher als der C eines entsprechenden Random-Netzwerks
- 2. Kriterium: Average Path Length (APL) des beobachteten Netzwerks weicht nicht signfikant ab von der APL eines entsprechenden Random-Netzwerks
- 3. Kriterium (Scale Free): Die Node Degree Distribution lässt sich am besten mit einer Power Law-Regression beschreiben
3. Dramen als ›Small Worlds‹?
Studie
1. Kriterium: Clustering Coefficient
- Der Clustering Coefficient (C) des beobachteten Netzwerks ist signifikant höher als der C eines entsprechenden Random-Netzwerks
- Vorgehen
- Berechnung von 1000 Randomnetzwerke zu jedem einzelnen Dramen-Netzwerk
- Berechnung des Mittelwerts für die Randomnetzwerke → Clustering Coefficient (C Random)
- Bildung des Quotienten aus C und C Random → Clustering Coefficient Abweichung (C Abw)
- Identifizierung der Dramen mit einem signifikant höheren C Abw (signifikant höher = größer als Mean+2*SD)
1. Kriterium: Clustering Coefficient
2. Kriterium: Average Path Length
- Die Average Path Length (APL) des beobachteten Netzwerks weicht nicht signfikant ab von der APL eines entsprechenden Random-Netzwerks
- Vorgehen
- Berechnung von 1000 Randomnetzwerke zu jedem einzelnen Dramen-Netzwerk
- Berechnung des Mittelwerts für die Randomnetzwerke → Average Path Length (APL Random)
- Bildung des Quotienten aus APL und APL Random → Average Path Length Abweichung (APL Abw)
- Aussortierung der Dramen, die Kriterium 1 erfüllen, aber bei APL Abw signifikant abweichen (kleiner als Mean-2*SD bzw. größer als Mean+2*SD)
2. Kriterium: Average Path Length
2. Kriterium: Average Path Length
Zwischenstand
übrig nach Kriterium 1 & 2
Titel | Autor | Jahr |
Götz | Goethe | 1773 |
Doktor Faust | Soden | 1797 |
Prinz Zerbino | Tieck | 1799 |
Die Jungfrau von Orleans | Schiller | 1801 |
Die Hermannsschlacht | Kleist | 1808 |
Halle | Arnim | 1811 |
Jerusalem | Arnim | 1811 |
Der Eheteufel | Gleich | 1812 |
Faust | Voß | 1823 |
Der Barometermacher | Raimund | 1823 |
Die unheilbringende Zauberkrone | Raimund | 1829 |
Die Walpurgisnacht | Birch-Pfeiffer | 1830 |
Der böse Geist | Nestroy | 1833 |
Andreas Hofer | Immermann | 1835 |
Faust | Vischer | 1862 |
Nero | Panizza | 1898 |
Faust | Avenarius | 1919 |
3. Kriterium: Power Law Distribution
- Die Node Degree Distribution lässt sich am besten mit einer Power Law-Regression beschreiben
- Vorgehen
- Berechnung der Node Degree Distribution
- Berechnung der Bestimmtheitsmaße (R²) für diverse Regressionen (linear, quadratisch, exponentiell, logarithmisch, Power Law)
- Aussortierung aller Dramen, die Kriterium 1 & 2 erfüllen, aber keine Power Law-Regression aufweisen
3. Kriterium: Power Law Distribution
3. Kriterium: Power Law Distribution
›Small-World‹-Test (plus ›Scale Free‹)
Endergebnis
(übrig nach Kriterien 1, 2 & 3)
Titel | Autor | Jahr |
Götz | Goethe | 1773 |
Doktor Faust | Soden | 1797 |
Jerusalem | Arnim | 1811 |
Der Barometermacher | Raimund | 1823 |
Der böse Geist | Nestroy | 1833 |
Diskussion
Drei Fragen (von vielen)
- 1. Was heißt eigentlich: Dramen als ›Small Worlds‹?
- 2. Wenn ›Small World‹-Dramen die seltene ›Abweichung‹ sind: Was ist dann die ›Norm‹?
- 3. Gibt es neben ›Small World‹-Dramen weitere ›Abweichungen‹?
1. Was heißt ›Dramen als Small Worlds‹?
1. Was heißt ›Dramen als Small Worlds‹?
Zentrale Figur(en) plus Cliquenbildung
hier am Bsp. von Goethe, "Götz"
1. Was heißt ›Dramen als Small Worlds‹?
Arnim, "Jerusalem" |
Raimund, "Der Barometermacher" |
 |
 |
 |
 |
Soden, "Doktor Faustus" |
Nestroy, "Der böse Geist" |
2. Was ist die ›Norm‹?
›Abweichung‹: u.a. Power Law z.B. in "Götz"
viele ›untere‹ Figuren - wenig ›mittlere‹ Figuren - sehr wenig ›obere‹ Figuren
2. Was ist die ›Norm‹?
In der Regel (›Norm‹) jedoch andere Verteilungen
|
 |
 |
|
viele ›mittlere‹ Figuren |
3. Weitere Abweichungen?
Z.B.: Die ›umgekehrte‹ Power Law-Regression
3. Weitere Abweichungen?
|
|
Goethe, "Götz" Drama des ›großen Individuums‹ |
Mühsam, "Judas" Drama des ›Kollektivs‹ |
 |
 |
aristokratisches Modell? |
kommunistisches Modell? |
Ausweitung, Verfeinerung und Vertiefung der Datenerhebung
- Granulierung des Interaktionsbegriffs
- u.a. differenziertere Erfassung von Konfigurationen (Figuren auf/ab) notwendig für philologisch exaktere Analysen und Interpretationen
- Anreicherung der Interaktions- und Figurendaten
- quantitative Figurenattribute (z.B. wie viel spricht eine Figur?) → Daten werden teilweise bereits erhoben
- quantitative Interaktionsattribute (z.B. wie häufig wird interagiert?) → Daten werden teilweise bereits erhoben
- qualitative Figurenattribute (z.B. Geschlecht) → Erhebung über »Play(s)« ist vorgesehen
- qualitative Interaktionsattribute (z.B. Verwandschaft) → geplant
Optimierung von Korpus und Workflow/Tool
- Verbesserung der Analysegrundlage
- Korpusoptimierung als Voraussetzung für umfassendere und philologisch belastbarere Analysen
- derzeit läuft: gemeinsamer DFG-Antrag mit der BBAW (Deutsches Textarchiv)
- Optimierung des Extraktions- und Analyse-Workflows: Entwicklung eines originären ›dlina-Tools‹
- vollständige Implementierung der Python-Pipeline (»dramavis«): Input einer TEI-Datei → Output von Werten/Diagrammen/Graphen
- Integration des Social Editing-Tools »Play(s)« in den Workflow
- GUI
Literatur
- Réka Albert & Albert-László Barabási: Statistical Mechanics of Complex Networks, in: Reviews of Modern Physics 74 (2002), 47–97.
- Albert Lászlo Barabási & Bonabeau, Eric: Scale Free Networks, in: Scientific American 288 (2003) 50–59.
- Frank Fischer, Mathias Göbel, Dario Kampkaspar & Peer Trilcke: [Blog] Network Analysis of Dramatic Texts, URL: https://dlina.github.io/
- Franco Moretti: Network Theory, Plot Analysis, in: Stanford Literary Lab Pamphlets, No. 2 (May 1st, 2011).
- James Stiller, Daniel Nettle & Robin I. M. Dunbar: The Small World of Shakespeareʼs Plays, in: Human Nature 14 (2003), 397–408.
- James Stiller & Matthew Hudson, Weak Links and Scene Cliques Within the Small World of Shakespeare, in: Journal of Cultural and Evolutionary Psychology 3 (2005), 57–73.
- Peer Trilcke: Social Network Analysis (SNA) als Methode einer textempirischen Literaturwissenschaft, in: Philip Ajouri, Katja Mellmann & Christoph Rauen (Hg.): Empirie in der Literaturwissenschaft, Münster 2013, 201–247.
- Duncan J. Watts & Steven H. Strogatz: Collective Dynamics of ›Small World‹ Networks, in: Nature 393 (1998), 440-442.
- Duncan J. Watts: Six Degrees. The Science of a Connected Age, New York 2003.

Dramen als ›Small Worlds‹?
Netzwerkdaten zur Geschichte und Typologie deutschsprachiger Dramen 1730-1930
https://lina.digital
Peer Trilcke¹, Frank Fischer², Mathias Göbel², Dario Kampkaspar³, Christopher Kittel⁴
Seminar für Deutsche Philologie, Univ. Göttingen
Staats- und Universitätsbibliothek Göttingen
Herzog August Bibliothek Wolfenbüttel
Karl-Franzens-Universität Graz
Präsentation: http://lina.digital/presentations/2016-leipzig/
Leipzig, »DHd 2016«, 10.3.2016
Präsentation lizenziert unter CC-BY 4.0.