In die Tiefe gehen:
Lektüre und Nutzung
digitaler Repräsentationen historischer Textzeugen.
Christian Thomas (HU & BBAW)


Digital-Humanities-Kolloquium an der BBAW, 6.10.2017
Gliederung
Teil I: 
Thesen zur Lektüre (von (digitalen) Editionen)
im Zeitalter digitaler Medien;
Folgen für Produktion und Rezeption
Teil II: 
Illustration der Thesen anhand konkreter Nutzungsbeispiele einer digitalen Edition
Thesen zur 'Lektüre' digitaler Editionen:
- Eine Edition stellt 1, 2, 3, ... von n Lektürevorschlägen dar.
 - Die Exploration der Grunddaten eröffnet weitere, eigene Lektüren (alternativ, konkurrierend, kontextualisierend z. Edition).
 
Digital-Humanities-Kolloquium an der BBAW, 6.10.2017
Thesen zur 'Lektüre' digitaler Editionen:
- 
Eine Edition stellt 1, 2, 3, ... von n Lektürevorschlägen dar.
	
- Edition = Auswahl, Interpretation, i.d.R. Vereinfachung.
 - Die Edition wird über ein Interface – (e-)Buch, Website, HTML-/PDF-/etc.-Ausgabe – zugänglich gemacht und die Präsentation der Grunddaten wird für dieses Interface optimiert ==> weitere Auswahl, Interpretation, i.d.R. Vereinfachung.
 - Beides sollte ausführlich dokumentiert werden, denn:
 - Beide Prozesse sollten bei der Lektüre berücksichtigt werden!
 
 
Digital-Humanities-Kolloquium an der BBAW, 6.10.2017
Thesen zur 'Lektüre' digitaler Editionen:
- 
Eine Edition stellt 1, 2, 3, ... von n Lektürevorschlägen dar.
	
- Das Interface stellt den edierten Text dar, dabei je nach Medium mehr oder weniger tief strukturiert/annotiert.
 - Die zugrunde liegenden Daten (und Metadaten) sind i.d.R. reichhaltiger als im Interface darstellbar; sie enthalten mehr Informationen als dort recherchierbar. (Bsp. Hybrid-Ed. MoE)
 - > zur Lektüre: Menschen und Maschinen sollten diese Daten lesen können (und lesen dürfen)! (Negativ-Bsp. Asiatische Banise, s. Rez. AR)
 
 
Inspiriert vom Symposium DSEs as Interfaces (Graz 16), #DH2017, esp. @eerstewart1, @GretaFranzini #1, @GretaFranzini#2 u.v.a.
Digital-Humanities-Kolloquium an der BBAW, 6.10.2017
Thesen zur 'Lektüre' digitaler Editionen:
- 
Eine Edition stellt 1, 2, 3, ... von n Lektürevorschlägen dar.
	
- Das Interface ((e-)Buch, Website, HTML-/PDF-/etc.-Ausgabe) zeigt 1, 2, 3, ... von n Lektürewegen, kuratiert durch EditorIn.
 - Die zugrunde liegenden Daten (und Metadaten) sind i.d.R. reichhaltiger als im Interface darstellbar; d.h. sie enthalten mehr Informationen als dort recherchierbar. (Bsp. Hybrid-Ed. MoE)
 - > zur Lektüre: Menschen und Maschinen sollten diese Daten lesen können (und lesen dürfen)! (Negativ-Bsp. Asiatische Banise, s. Rez. AR)
 
 
Inspiriert vom Symposium DSEs as Interfaces (Graz 16), #DH2017, esp. @eerstewart1, @GretaFranzini #1, @GretaFranzini#2 u.v.a.
NB zum erwähnten u. vielen anderen Negativbeispielen:
Der fehlende Zugang zu den Grunddaten bzw. deren ständiger Verlust hat keine technischen Ursachen.
Es handelt sich v.a. um ein sozialisatorisches
(und auch förderpolitisches) Problem.
Digital-Humanities-Kolloquium an der BBAW, 6.10.2017
Thesen zur 'Lektüre' digitaler Editionen:
- Eine Edition stellt 1, 2, 3, ... von n Lektürevorschlägen dar.
 - Die Exploration der Grunddaten eröffnet weitere, eigene Lektüren (alternativ, konkurrierend, kontextualisierend z. Edition).
==> Diese können u. sollten durch die LeserInnen/NutzerInnen der Edition erschlossen werden ==> Lektüre im Digitalen. 
Digital-Humanities-Kolloquium an der BBAW, 6.10.2017
Thesen zur 'Lektüre' digitaler Editionen:
- Eine Edition stellt 1, 2, 3, ... von n Lektürevorschlägen dar.
 - 
Exploration der Grunddaten durch NutzerInnen = n Lektüren; Voraussetzungen dafür sind unter anderem: 
- Gute Dokumentation (inhaltlich, editorisch und technisch)
 - Zugang zu den Grunddaten & 'Data Literacy'
 - Zugang zu geeigneten Tools¹ & 'Tool Literacy' (¹ z.B. für TEI-XML)
 - i.d.R. erforderlich: Datenvor- & aufbereitung; -visualisierung
 - Dokumentation der eigenen Lektüre (inhaltlich, (editorisch,) technisch); ggf. Bereitstellung der erzeugten Daten (z.B. edissPlus)
 
 
Digital-Humanities-Kolloquium an der BBAW, 6.10.2017
Einige Folgerungen für Produktion und Rezeption:
- Eine Edition stellt 1, 2, 3, ... von n Lektürevorschlägen dar.
 - 
Exploration der Grunddaten durch NutzerInnen = n Lektüren; daher umso wichtiger: 
	
- Lektürewege als vom Editor/in ausgewählt kennzeichnen.
 - Nicht (nur) das Interface wichtig, sondern Reichhaltigkeit u. flexible Nutzbarkeit der Daten (für Menschen u. Maschinen).
 - Traditionell: Lektüre auf autorisierten Pfaden (via Interface)
 - +Digital: Exploration der Daten (via Download/API/...)
= Lektüre auf eigenen Pfaden, lesend und mit Tools. 
 
Digital-Humanities-Kolloquium an der BBAW, 6.10.2017
II: Illustration der Thesen
Hintergrund:
Projekt "Hidden Kosmos":
Edition/Textkorpus
Nachschriften der 'Kosmos-Vorträge' A. v. Humboldts




Humboldts 'Kosmos-Vorträge'
- Berlin, 1827/28; ! ≠ Kosmos, 1845–62
	
- keine autorisierte Publikation der Vorträge durch Humboldt
 - Humboldt verbat sich Druck von Nachschriften, "Eingriff in mein Eigenthum" (Spenersche Zeitung, 12.12.1827)
 
 
nichts […] widerwärtiger, als publicirt
zu sehen, was ein Gemisch von Gehörtem
und Selbstzugesetztem ist.“
(A.v.H an R. Zeune, Berlin, 16.2.1857)
Anonym (Hrsg.) 1934
Hamel/Tiemann (Hrsg.) 1993 [2. A. 2004]


Humboldts 'Kosmos-Vorträge'
- Berlin, 1827/28, zwei Kurse:
	
- Berliner Universität, 62 Stunden,
~400 Studis, Staff, Gasthörern - 
Sing-Akademie, 16 Stunden,
~1000 HörerInnen 'gemischtes' Publikum 
 - Berliner Universität, 62 Stunden,
 
... ein Meilenstein der
Wissenschaftspopularisierung
(Hamel/Tiemann 1993)

(c) Schiller-Nationalmuseum, Marbach
Humboldts 'Kosmos-Vorträge'
- Berlin, 1827/28; ! ≠ Kosmos, 1845–62
	
- keine autorisierte Publikation der Vorträge durch Humboldt
 - A.v.H.s ursprüngliche Manuskripte
im Nachl. verstreut, aber (z.T.) erhalten
– entgegen Humboldts Angaben: 
 
Bei freier Rede habe ich [...]
nichts über meine Vorträge schriftlich aufgezeichnet
(A.v.H in der 'Vorrede' zum Kosmos, Bd. 1, S. X.)

Humboldts 'Kosmos-Vorträge'




SBB-PK, Nachl. A.v.H., diverse Fragmente des Manuskripts bzw. Materialien zu Humboldts Vorträgen
Projekt "Hidden Kosmos"

≈ 3600 Seiten,
≈ 4,5M Zeichen,
≈ 660K Tokens, 
≈ 103K Types.
Projekt "Hidden Kosmos"

≈ 3600 Seiten,
≈ 4,5M Zeichen,
≈ 660K Tokens, 
≈ 103K Types.
Nachschriften der 'Kosmos-Vorträge' A. v. Humboldts




| Projekt- Förderung  | 
Texterfassung und -anntoation | Publikation und ling. Erschließg. | Nachhaltigkeit & Dissemination | 
|---|



Nachschriften der 'Kosmos-Vorträge' A. v. Humboldts


| Texterfassung und -anntoation | Publikation und ling. Erschließg. | 
|---|


Texterfassung und -Annotation gemäß P5 Text Enoding Initiative
“The TEI-C is… a consortium which collectively develops and maintains
a standard for the representation of texts in digital form.” (http://www.tei-c.org/)
TEI-C = Herausgeber der TEI Guidelines:
- XML-basierter, freier, internationaler (de facto-) Standard
 - umfassend dokumentiert
 - plattformunabhängig, flexibel nutzbar
 - menschen- & maschinenlesbar
 - generische und TEI-spezifische Tools
 - (prinzipiell) interoperabel
 

DTA-Basisformat für Manuskripte



Cf. Haaf/Thomas 2017, https://jtei.revues.org/1650

Texterfassung und -Annotation
- erweitertes DTA-Basisformat (DTABf):
DTABf für Manuskripte (DTABf-M) - Metadaten, Dokument-Struktur, 'Typographie'
 
<!-- […] -->
<pb facs="#f0007" n="2r"/>
<!-- […] -->
      <div n="1">
        <head>Physikalische Geographie bei <persName resp="#CT" ref="http://d-nb.info/gnd/118554700">A. v. Humboldt</persName>.</head><lb/>
        <milestone rendition="#hr" unit="section"/><lb/>
        <div type="session" n="1">
          <head type="rightMargin">
            <!-- […] --><hi rendition="#b">1.</hi><space dim="horizontal"/> 3. <choice><abbr>Nov.</abbr><!-- […] -->
          </head><lb/>
          <p>Als Einleitung in die <choice><abbr>physik.</abbr><expan resp="#CT">physikalische</expan></choice> 
            <choice><abbr>Geogr.</abbr><expan resp="#CT">Geographie</expan></choice> gebe ich eine Übersicht<lb/>
            der Zustände im allgemeinen, in welchen die Materie uns<lb/>
            im Weltraume erscheint, und fange daher mit denjenigen<lb/>
            Körpern an<del rendition="#s">,</del> welche in der Lichtbildung begriffen scheinen.<lb/>
            <!-- […] -->
          </p><lb/>
<!-- […] -->
Texterfassung und -Annotation
- Manuskript-typische Textmerkmale wie Überschreibungen, @hand-Wechsel, <metamark/>s u.a.
 

Texterfassung und -Annotation
- Manuskript-typische Textmerkmale wie Überschreibungen, @hand-Wechsel, <metamark/>s u.a.
 - 
= wichtig (nicht nur)
für Nachschriften: Eingriffe Dritter, Unsicherheiten und Fehler(!) der Schreiber usw. 

Texterfassung und -Annotation:
Nutzungsmöglichkeiten
Beispiel: Bleistift-Gebrauch in parthey_msgermqu1711_1828 (XML)

Texterfassung und -Annotation:
Nutzungsmöglichkeiten
Beispiel: Bleistift-Gebrauch in parthey_msgermqu1711_1828 (XML)


Texterfassung und -Annotation:
Nutzungsmöglichkeiten
Beispiel: Bleistift-Gebrauch in parthey_msgermqu1711_1828 (XML)

> Mehrzahl im Abschnitt Geographie des Organischen
- 54. St.: Kennzeichen des Organischen
 - 55.–57. St.: Geographie der Pflanzen
 - 58. St.: Geographie der Thiere
 
Texterfassung und -Annotation:
Nutzungsmöglichkeiten



Texterfassung und -Annotation
- Auszeichnung von <persName> mit @ref GND/VIAF/Wikidata/...
 
<item>3, die <hi rendition="#u">englischen</hi> Messungen unter dem 
General <persName resp="#CT" ref="http://d-nb.info/gnd/130800600">
    R.<metamark><space dim="horizontal"/></metamark></persName> 
<metamark>(?)</metamark> und 
<persName resp="#CT" ref="http://d-nb.info/gnd/1055317457">M<metamark>....</metamark></persName>
    <add place="right"><metamark>?</metamark></add><lb/>
<!-- [...] -->              <item>4, Drei grosse Messungen in <hi rendition="#u">Ostindien</hi> von dem 
General <persName resp="#CT" ref="http://d-nb.info/gnd/117574406">
    L<metamark><space dim="horizontal"/></metamark></persName>
<metamark>?</metamark><lb/>
und <persName>T<metamark><space dim="horizontal"/></metamark></persName> <metamark>?</metamark></item><lb/>
Texterfassung und -Annotation
- Auszeichnung von <persName> mit @ref GND/VIAF/Wikidata/...
 

<choice><abbr>Rſe</abbr><expan resp="#SB">Reiſe</expan></choice> <choice><abbr>ds</abbr><expan resp="#SB">des</expan></choice>
<hi rendition="#aq">
<persName resp="#SB" ref="http://d-nb.info/gnd/100648282">
    Kuki</persName></hi><lb/>
Texterfassung und -Annotation


Texterfassung und -Annotation
- Ansetzung vs. Vorlage:
	
- Welche Namen waren dem Publikum bekannt, welche nicht?
 
 - Anzahl der Vorkommen pro Nachschrift und insgesamt:
	
- z.B. Uni vs. Sing-Akad.: Welches Personal für welchen Kurs?
 - Ältere vs. aktuelle Forschung: Nachwuchsförderer A.v.H?
 - Kosmos-Vorträge auf der Höhe der wiss. Forschung der Zeit?
 - Welcher Nachschreiber 'überhört' welche Personen?
 
 - Vernetzung: API/BEACON:
	
- z.B. Porträtindex/Wikimedia Comm.s, edition-humboldt.de ...
 
 
Personenregister: Nutzungsmöglichkeiten und Anschlussfragen



Siehe auch: Instrumente

Siehe auch: Bibliographie

Datensets für Coding da Vinci


Zugriff auf die Texte via DTA









Text-Bild-Ansicht:
- Text-Darstellung
(= XSLT-Transformation aus DTABf-M XML) - z.B. HTML: inklusive
graphischer Umsetzung einiger Elemente der Annotation 




dies fand 
<subst>
    <del rendition="#s" hand="#pencil">
        <subst>
                <del rendition="#ow">
                    <supplied reason="covered" cert="high" resp="#CT">ich</supplied>
                </del>
                <add place="across" hand="#ink2">
                    <persName ref="http://d-nb.info/gnd/118554700">Humbold</persName></hi>
                </add>
        </subst>
    </del>
    <add place="superlinear" hand="#pencil">ich</add>
</subst> auf dem Chimboraßo,
<!-- Beispiel vereinfacht: <hi> entfernt, cf. http://www.deutschestextarchiv.de/nn_msgermqu2345_1827/17 -->

Abriſſe liefern
    <subst>
        <del rendition="#ow">w<unclear reason="covered" cert="low" resp="#BF">ü</unclear></del>
        <add place="across">dü</add>
    </subst>r
    <subst>
        <del rendition="#ow"><unclear reason="covered" cert="low" resp="#CT">de</unclear></del>
        <add place="across">fte</add>
    </subst>, welches<lb/>


HTML
TEXT

Abriſſe liefern
    <subst>
        <del rendition="#ow">w<unclear reason="covered" cert="low" resp="#BF">ü</unclear></del>
        <add place="across">dü</add>
    </subst>r
    <subst>
        <del rendition="#ow"><unclear reason="covered" cert="low" resp="#CT">de</unclear></del>
        <add place="across">fte</add>
    </subst>, welches<lb/><TextCorpus>
    <tokens>    
        <!--[...]-->
        <token ID="w14c">Abriſſe</token>
        <token ID="w14d">liefern</token>
        <token ID="w14e">dürfte</token>
        <token ID="w14f">,</token>
        <token ID="w150">welches</token>
        <!--[...]-->
    </tokens>
    <sentences>
        <sentence ID="sc" tokenIDs="<!--[...]--> w14c w14d w14e w14f w150 <!--[...]-->"/>
    </sentences>
    <lemmas>
        <!--[...]-->
        <lemma tokenIDs="w14c">Abriß</lemma>
        <lemma tokenIDs="w14d">liefern</lemma>
        <lemma tokenIDs="w14e">dürfen</lemma>
        <lemma tokenIDs="w14f">,</lemma>
        <lemma tokenIDs="w150">welches</lemma>
        <!--[...]-->
    </lemmas>
    <POStags>
        <!--[...]-->
        <tag tokenIDs="w14c">NN</tag>
        <tag tokenIDs="w14d">VVINF</tag>
        <tag tokenIDs="w14e">VMFIN</tag>
        <tag tokenIDs="w14f">$,</tag>
        <tag tokenIDs="w150">PWS</tag>
        <!--[...]-->
    </POStags>
    <orthography>
        <!--[...]-->
        <correction tokenIDs="w14c" operation="replace">Abrisse</correction>
        <!--[...]-->
    </orthography>
</TextCorpus>TCF
<choice>
    <orig>Abriſſe</orig>
    <reg resp="#cab">Abrisse</reg>
</choice> liefern
<choice>
    <orig>
        <subst>
            <del rendition="#ow">w<unclear reason="covered" cert="low" resp="#BF">ü</unclear></del>
            <add place="across">dü</add>
        </subst>r
        <subst>
            <del rendition="#ow"><unclear reason="covered" cert="low" resp="#CT">de</unclear></del>
            <add place="across">fte</add>
        </subst>
    </orig>
    <reg resp="#cab">dürfte</reg>
</choice>, welches<lb/>DTA-'norm.xml'


Abriſſe liefern
    <subst>
        <del rendition="#ow">w<unclear reason="covered" cert="low" resp="#BF">ü</unclear></del>
        <add place="across">dü</add>
    </subst>r
    <subst>
        <del rendition="#ow"><unclear reason="covered" cert="low" resp="#CT">de</unclear></del>
        <add place="across">fte</add>
    </subst>, welches<lb/>Zugriff auf die Texte via DTA/DDC


DTA-Analysen, z.B. SemCloud

DTA-Analysen, z.B. DiaCollo

DDC-Suche mit GermaNet
DDC-Suche mit GermaNet-Erweiterung, Synset "Grundstoff; Urstoff"

Externe Tools: Voyant
Externe Tools: WCopyfind



Externe Tools: WCopyfind







Digital-Humanities-Kolloquium an der BBAW, 6.10.2017
Thesen zur 'Lektüre' digitaler Editionen:
- Eine Edition stellt 1, 2, 3, ... von n Lektürevorschlägen dar.
 - 
Exploration der Grunddaten durch NutzerInnen = n Lektüren; Voraussetzungen dafür sind unter anderem: 
	
- Gute Dokumentation (inhaltlich, editorisch und technisch)
 - Zugang zu den Grunddaten & 'Data Literacy'
 - Zugang zu geeigneten Tools¹ & 'Tool Literacy' (¹ z.B. für TEI-XML)
 - i.d.R. erforderlich: Datenvor- & aufbereitung; -visualisierung
 - Dokumentation der eigenen Lektüre (inhaltlich, (editorisch,) technisch); ggf. Bereitstellung der erzeugten Daten (z.B. edissPlus)
 
 
Digital-Humanities-Kolloquium an der BBAW, 6.10.2017
Literaturempfehlungen (Auswahl):
- 
	
John Unsworth: "Scholarly Primitives: what methods do humanities researchers have in common, and how might our tools reflect this?", [J. Unsworth' Blog], 2000 cf. http://www.people.virginia.edu/~jmu2m/Kings.5-00/primitives.html.
 - 
	
Patrick Sahle: Digitale Editionsformen. Zum Umgang mit der Überlieferung unter den Bedingungen des Medienwandels, 3 Bände, Norderstedt: Books on Demand 2013.
 - 
	
Ted Underwood: "It looks like you’re writing an argument against data in literary study …" In: The Stone and the Shell, 21. Sept. 2017.
 - 
	
Ders.: A Genealogy of Distant Reading. In: DHq, 11, 2 (2017).
 
#DHBBAW-Kollkquium 6.10.2017
By Christian Thomas
#DHBBAW-Kollkquium 6.10.2017
Christian Thomas (BBAW, HU Berlin) In die Tiefe gehen: Lektüre- und Nutzungsmöglichkeiten digitaler Repräsentationen historischer Textzeugen. Der Vortrag gibt zunächst einen Einblick in die Erstellung TEI-XML-basierter Text-Editionen mit einem Fokus auf Handschriften des 19. Jahrhunderts (am Beispiel der Nachschriften zu Humboldts Kosmos-Vorlesungen 1827/28 in Berlin). Anhand dessen wird erläutert, inwiefern sich die Repräsentation historischer Textzeugen im Zuge des Medien- bzw. Paradigmenwechsels von printorientierten Formaten hin zu genuin digitalen Editionsformen verändert. Dies hat zum einen Auswirkungen auf Produktionsseite, d.h. auf die editorische Praxis, vor allem aber – und hierauf wird der Schwerpunkt des Vortrags liegen – auf die Rezeptionsseite: Digitale Edition müssen nicht nur anders konzipiert und produziert, sondern auch anders gelesen werden, will man das Potential der (in der germanistischen Editionsphilologie teilweise immer noch:) ‘neuen’ Medien ausschöpfen. Die Editionspraxis schreitet von der linearen Auszeichnung textoberflächlicher Phänomene bzw. deren an- oder nachgelagerter diskursiver, spezifischer Beschreibung weiter in Richtung standardisierter, formalisierter Annotation, die in die mehrdimensionale, vielschichtige Tiefe des Textzeugen führt.
- 5,569
 


