In die Tiefe gehen:
Lektüre und Nutzung
digitaler Repräsentationen historischer Textzeugen.

Christian Thomas (HU & BBAW)

thomas@bbaw.de

Digital-Humanities-Kolloquium an der BBAW, 6.10.2017

Gliederung

Teil I:
Thesen zur Lektüre (von (digitalen) Editionen)
im Zeitalter digitaler Medien;
Folgen für Produktion und Rezeption

Teil II:
Illustration der Thesen anhand konkreter Nutzungsbeispiele einer digitalen Edition

Thesen zur 'Lektüre' digitaler Editionen:

  1. Eine Edition stellt 1, 2, 3, ... von n Lektürevorschlägen dar.
  2. Die Exploration der Grunddaten eröffnet weitere, eigene Lektüren (alternativ, konkurrierend, kontextualisierend z. Edition).

Digital-Humanities-Kolloquium an der BBAW, 6.10.2017

Thesen zur 'Lektüre' digitaler Editionen:

  1. Eine Edition stellt 1, 2, 3, ... von n Lektürevorschlägen dar.
    • Edition = Auswahl, Interpretation, i.d.R. Vereinfachung.
    • Die Edition wird über ein Interface  (e-)Buch, Website, HTML-/PDF-/etc.-Ausgabe – zugänglich gemacht und die Präsentation der Grunddaten wird für dieses Interface optimiert ==> weitere Auswahl, Interpretation, i.d.R. Vereinfachung.
    • Beides sollte ausführlich dokumentiert werden, denn:
    • Beide Prozesse sollten bei der Lektüre berücksichtigt werden!

Digital-Humanities-Kolloquium an der BBAW, 6.10.2017

Thesen zur 'Lektüre' digitaler Editionen:

  1. Eine Edition stellt 1, 2, 3, ... von n Lektürevorschlägen dar.
    • Das Interface stellt den edierten Text dar, dabei je nach Medium mehr oder weniger tief strukturiert/annotiert.
    • Die zugrunde liegenden Daten (und Metadaten) sind i.d.R. reichhaltiger als im Interface darstellbar; sie enthalten mehr Informationen als dort recherchierbar. (Bsp. Hybrid-Ed. MoE)
    • > zur Lektüre: Menschen und Maschinen sollten diese Daten lesen können (und lesen dürfen)! (Negativ-Bsp. Asiatische Banise, s. Rez. AR)

Inspiriert vom Symposium DSEs as Interfaces (Graz 16), #DH2017, esp. @eerstewart1, @GretaFranzini #1,  @GretaFranzini#2 u.v.a.

Digital-Humanities-Kolloquium an der BBAW, 6.10.2017

Thesen zur 'Lektüre' digitaler Editionen:

  1. Eine Edition stellt 1, 2, 3, ... von n Lektürevorschlägen dar.
    • Das Interface ((e-)Buch, Website, HTML-/PDF-/etc.-Ausgabe) zeigt 1, 2, 3, ... von n Lektürewegen, kuratiert durch EditorIn.
    • Die zugrunde liegenden Daten (und Metadaten) sind i.d.R. reichhaltiger als im Interface darstellbar; d.h. sie enthalten mehr Informationen als dort recherchierbar. (Bsp. Hybrid-Ed. MoE)
    • > zur Lektüre: Menschen und Maschinen sollten diese Daten lesen können (und lesen dürfen)! (Negativ-Bsp. Asiatische Banise, s. Rez. AR)

Inspiriert vom Symposium DSEs as Interfaces (Graz 16), #DH2017, esp. @eerstewart1, @GretaFranzini #1,  @GretaFranzini#2 u.v.a.

NB zum erwähnten u. vielen anderen Negativbeispielen:

Der fehlende Zugang zu den Grunddaten bzw. deren ständiger Verlust hat keine technischen Ursachen.

Es handelt sich v.a. um ein sozialisatorisches
(und auch förderpolitisches) Problem.

Digital-Humanities-Kolloquium an der BBAW, 6.10.2017

Thesen zur 'Lektüre' digitaler Editionen:

  1. Eine Edition stellt 1, 2, 3, ... von n Lektürevorschlägen dar.
  2. Die Exploration der Grunddaten eröffnet weitere, eigene Lektüren (alternativ, konkurrierend, kontextualisierend z. Edition).

    ==> Diese können u. sollten durch die LeserInnen/NutzerInnen der Edition erschlossen werden ==> Lektüre im Digitalen.

Digital-Humanities-Kolloquium an der BBAW, 6.10.2017

Thesen zur 'Lektüre' digitaler Editionen:

  1. Eine Edition stellt 1, 2, 3, ... von n Lektürevorschlägen dar.
  2. Exploration der Grunddaten durch NutzerInnen = n Lektüren; Voraussetzungen dafür sind unter anderem:
    • Gute Dokumentation (inhaltlich, editorisch und technisch)
    • Zugang zu den Grunddaten & 'Data Literacy'
    • Zugang zu geeigneten Tools¹ & 'Tool Literacy' (¹ z.B. für TEI-XML)
    • i.d.R. erforderlich: Datenvor- & aufbereitung; -visualisierung
    • Dokumentation der eigenen Lektüre (inhaltlich, (editorisch,) technisch); ggf. Bereitstellung der erzeugten Daten (z.B. edissPlus)

Digital-Humanities-Kolloquium an der BBAW, 6.10.2017

Einige Folgerungen für Produktion und Rezeption:

  1. Eine Edition stellt 1, 2, 3, ... von n Lektürevorschlägen dar.
  2. Exploration der Grunddaten durch NutzerInnen = n Lektüren; daher umso wichtiger:
    • Lektürewege als vom Editor/in ausgewählt kennzeichnen.
    • Nicht (nur) das Interface wichtig, sondern Reichhaltigkeit u. flexible Nutzbarkeit der Daten (für Menschen u. Maschinen).
    • Traditionell: Lektüre auf autorisierten Pfaden (via Interface)
    • +Digital: Exploration der Daten (via Download/API/...)
      = Lektüre auf eigenen Pfaden, lesend und mit Tools.

Digital-Humanities-Kolloquium an der BBAW, 6.10.2017

II: Illustration der Thesen

Hintergrund:
Projekt "Hidden Kosmos":
Edition/Textkorpus
Nachschriften der 'Kosmos-Vorträge' A. v. Humboldts

Humboldts 'Kosmos-Vorträge'

  • Berlin, 1827/28; ! Kosmos, 1845–62
    • keine autorisierte Publikation der Vorträge durch Humboldt
    • Humboldt verbat sich Druck von Nachschriften, "Eingriff in mein Eigenthum" (Spenersche Zeitung, 12.12.1827)

nichts […] widerwärtiger, als publicirt
zu sehen, was ein
Gemisch von Gehörtem
und Selbstzugesetztem
ist.“
(A.v.H an R. Zeune, Berlin, 16.2.1857)

Anonym (Hrsg.) 1934


Hamel/Tiemann (Hrsg.) 1993 [2. A. 2004]

Humboldts 'Kosmos-Vorträge'

  • Berlin, 1827/28, zwei Kurse:
    • Berliner Universität, 62 Stunden,
      ~400 Studis, Staff, Gasthörern
    • Sing-Akademie, 16 Stunden,
      ~1000 HörerInnen 'gemischtes' Publikum

... ein Meilenstein der
Wissenschaftspopularisierung

(Hamel/Tiemann 1993)

(c) Schiller-Nationalmuseum, Marbach

Humboldts 'Kosmos-Vorträge'

  • Berlin, 1827/28; ! Kosmos, 1845–62
    • keine autorisierte Publikation der Vorträge durch Humboldt
    • A.v.H.s ursprüngliche Manuskripte
      im Nachl. verstreut, aber (z.T.) erhalten
      – entgegen Humboldts Angaben:

Bei freier Rede habe ich [...]
nichts über meine Vorträge schriftlich aufgezeichnet

(A.v.H in der 'Vorrede' zum Kosmos, Bd. 1, S. X.)

Humboldts 'Kosmos-Vorträge'

SBB-PK, Nachl. A.v.H., diverse Fragmente des Manuskripts bzw. Materialien zu Humboldts Vorträgen

Projekt "Hidden Kosmos"

3600 Seiten,
4,5M Zeichen,
660K Tokens,
≈ 103K Types.

Projekt "Hidden Kosmos"

3600 Seiten,
4,5M Zeichen,
660K Tokens,
≈ 103K Types.

Nachschriften der 'Kosmos-Vorträge' A. v. Humboldts

Projekt-
Förderung
Texterfassung und -anntoation Publikation und ling. Erschließg. Nachhaltigkeit & Dissemination

Nachschriften der 'Kosmos-Vorträge' A. v. Humboldts

Texterfassung und -anntoation Publikation und ling. Erschließg.

Texterfassung und -Annotation gemäß P5 Text Enoding Initiative

“The TEI-C is… a consortium which collectively develops and maintains
a standard for the representation of texts in digital form.” (http://www.tei-c.org/)

TEI-C = Herausgeber der TEI Guidelines:

  • XML-basierter, freier, internationaler (de facto-) Standard
  • umfassend dokumentiert
  • plattformunabhängig, flexibel nutzbar
  • menschen- & maschinenlesbar
  • generische und TEI-spezifische Tools
  • (prinzipiell) interoperabel

DTA-Basisformat für Manuskripte

Cf. Haaf/Thomas 2017, https://jtei.revues.org/1650

Texterfassung und -Annotation

<!-- […] -->
<pb facs="#f0007" n="2r"/>
<!-- […] -->
      <div n="1">
        <head>Physikalische Geographie bei <persName resp="#CT" ref="http://d-nb.info/gnd/118554700">A. v. Humboldt</persName>.</head><lb/>
        <milestone rendition="#hr" unit="section"/><lb/>
        <div type="session" n="1">
          <head type="rightMargin">
            <!-- […] --><hi rendition="#b">1.</hi><space dim="horizontal"/> 3. <choice><abbr>Nov.</abbr><!-- […] -->
          </head><lb/>
          <p>Als Einleitung in die <choice><abbr>physik.</abbr><expan resp="#CT">physikalische</expan></choice> 
            <choice><abbr>Geogr.</abbr><expan resp="#CT">Geographie</expan></choice> gebe ich eine Übersicht<lb/>
            der Zustände im allgemeinen, in welchen die Materie uns<lb/>
            im Weltraume erscheint, und fange daher mit denjenigen<lb/>
            Körpern an<del rendition="#s">,</del> welche in der Lichtbildung begriffen scheinen.<lb/>
            <!-- […] -->
          </p><lb/>
<!-- […] -->

Texterfassung und -Annotation

  • Manuskript-typische Textmerkmale wie Überschreibungen, @hand-Wechsel, <metamark/>s u.a.

Texterfassung und -Annotation

  • Manuskript-typische Textmerkmale wie Überschreibungen, @hand-Wechsel, <metamark/>s u.a.
  • = wichtig (nicht nur)
    für Nachschriften
    : Eingriffe Dritter, Unsicherheiten und Fehler(!) der Schreiber usw.

Texterfassung und -Annotation:
Nutzungsmöglichkeiten

Beispiel: Bleistift-Gebrauch in parthey_msgermqu1711_1828 (XML)

Texterfassung und -Annotation:
Nutzungsmöglichkeiten

Beispiel: Bleistift-Gebrauch in parthey_msgermqu1711_1828 (XML)

Texterfassung und -Annotation:
Nutzungsmöglichkeiten

Beispiel: Bleistift-Gebrauch in parthey_msgermqu1711_1828 (XML)

> Mehrzahl im Abschnitt Geographie des Organischen

  • 54. St.: Kennzeichen des Organischen
  • 55.–57. St.: Geographie der Pflanzen
  • 58. St.: Geographie der Thiere

Texterfassung und -Annotation:
Nutzungsmöglichkeiten

Texterfassung und -Annotation

  • Auszeichnung von <persName> mit @ref GND/VIAF/Wikidata/...
<item>3, die <hi rendition="#u">englischen</hi> Messungen unter dem 
General <persName resp="#CT" ref="http://d-nb.info/gnd/130800600">
    R.<metamark><space dim="horizontal"/></metamark></persName> 
<metamark>(?)</metamark> und 
<persName resp="#CT" ref="http://d-nb.info/gnd/1055317457">M<metamark>....</metamark></persName>
    <add place="right"><metamark>?</metamark></add><lb/>
<!-- [...] -->              <item>4, Drei grosse Messungen in <hi rendition="#u">Ostindien</hi> von dem 
General <persName resp="#CT" ref="http://d-nb.info/gnd/117574406">
    L<metamark><space dim="horizontal"/></metamark></persName>
<metamark>?</metamark><lb/>
und <persName>T<metamark><space dim="horizontal"/></metamark></persName> <metamark>?</metamark></item><lb/>

Texterfassung und -Annotation

  • Auszeichnung von <persName> mit @ref GND/VIAF/Wikidata/...
<choice><abbr>Rſe</abbr><expan resp="#SB">Reiſe</expan></choice> <choice><abbr>ds</abbr><expan resp="#SB">des</expan></choice>
<hi rendition="#aq">
<persName resp="#SB" ref="http://d-nb.info/gnd/100648282">
    Kuki</persName></hi><lb/>

Texterfassung und -Annotation

  • alle <persName>s aus allen Nachschriften
  • Ansetzung vs. Vorlage
  • Anzahl der Vorkommen
  • Links zu den Texten
  • Links auf die Normdatensätze
  • Vernetzung: API, CSV, BEACON, ...

Texterfassung und -Annotation

  • Ansetzung vs. Vorlage:
    • Welche Namen waren dem Publikum bekannt, welche nicht?
  • Anzahl der Vorkommen pro Nachschrift und insgesamt:
    • z.B. Uni vs. Sing-Akad.: Welches Personal für welchen Kurs?
    • Ältere vs. aktuelle Forschung: Nachwuchsförderer A.v.H?
    • Kosmos-Vorträge auf der Höhe der wiss. Forschung der Zeit?
    • Welcher Nachschreiber 'überhört' welche Personen?
  • Vernetzung: API/BEACON:

Personenregister: Nutzungsmöglichkeiten und Anschlussfragen

Siehe auch: Instrumente

Siehe auch: Bibliographie

Datensets für Coding da Vinci

Zugriff auf die Texte via DTA

Text-Bild-Ansicht:

  • Text-Darstellung
    (= XSLT-Transformation aus DTABf-M XML)
  • z.B. HTML: inklusive
    graphischer Umsetzung einiger Elemente der Annotation
dies fand 
<subst>
    <del rendition="#s" hand="#pencil">
        <subst>
                <del rendition="#ow">
                    <supplied reason="covered" cert="high" resp="#CT">ich</supplied>
                </del>
                <add place="across" hand="#ink2">
                    <persName ref="http://d-nb.info/gnd/118554700">Humbold</persName></hi>
                </add>
        </subst>
    </del>
    <add place="superlinear" hand="#pencil">ich</add>
</subst> auf dem Chimboraßo,
<!-- Beispiel vereinfacht: <hi> entfernt, cf. http://www.deutschestextarchiv.de/nn_msgermqu2345_1827/17 -->
Abriſſe liefern
    <subst>
        <del rendition="#ow">w<unclear reason="covered" cert="low" resp="#BF">ü</unclear></del>
        <add place="across">dü</add>
    </subst>r
    <subst>
        <del rendition="#ow"><unclear reason="covered" cert="low" resp="#CT">de</unclear></del>
        <add place="across">fte</add>
    </subst>, welches<lb/>

HTML

TEXT

Abriſſe liefern
    <subst>
        <del rendition="#ow">w<unclear reason="covered" cert="low" resp="#BF">ü</unclear></del>
        <add place="across">dü</add>
    </subst>r
    <subst>
        <del rendition="#ow"><unclear reason="covered" cert="low" resp="#CT">de</unclear></del>
        <add place="across">fte</add>
    </subst>, welches<lb/>
<TextCorpus>
    <tokens>    
        <!--[...]-->
        <token ID="w14c">Abriſſe</token>
        <token ID="w14d">liefern</token>
        <token ID="w14e">dürfte</token>
        <token ID="w14f">,</token>
        <token ID="w150">welches</token>
        <!--[...]-->
    </tokens>
    <sentences>
        <sentence ID="sc" tokenIDs="<!--[...]--> w14c w14d w14e w14f w150 <!--[...]-->"/>
    </sentences>
    <lemmas>
        <!--[...]-->
        <lemma tokenIDs="w14c">Abriß</lemma>
        <lemma tokenIDs="w14d">liefern</lemma>
        <lemma tokenIDs="w14e">dürfen</lemma>
        <lemma tokenIDs="w14f">,</lemma>
        <lemma tokenIDs="w150">welches</lemma>
        <!--[...]-->
    </lemmas>
    <POStags>
        <!--[...]-->
        <tag tokenIDs="w14c">NN</tag>
        <tag tokenIDs="w14d">VVINF</tag>
        <tag tokenIDs="w14e">VMFIN</tag>
        <tag tokenIDs="w14f">$,</tag>
        <tag tokenIDs="w150">PWS</tag>
        <!--[...]-->
    </POStags>
    <orthography>
        <!--[...]-->
        <correction tokenIDs="w14c" operation="replace">Abrisse</correction>
        <!--[...]-->
    </orthography>
</TextCorpus>

TCF

<choice>
    <orig>Abriſſe</orig>
    <reg resp="#cab">Abrisse</reg>
</choice> liefern
<choice>
    <orig>
        <subst>
            <del rendition="#ow">w<unclear reason="covered" cert="low" resp="#BF">ü</unclear></del>
            <add place="across">dü</add>
        </subst>r
        <subst>
            <del rendition="#ow"><unclear reason="covered" cert="low" resp="#CT">de</unclear></del>
            <add place="across">fte</add>
        </subst>
    </orig>
    <reg resp="#cab">dürfte</reg>
</choice>, welches<lb/>

DTA-'norm.xml'

Abriſſe liefern
    <subst>
        <del rendition="#ow">w<unclear reason="covered" cert="low" resp="#BF">ü</unclear></del>
        <add place="across">dü</add>
    </subst>r
    <subst>
        <del rendition="#ow"><unclear reason="covered" cert="low" resp="#CT">de</unclear></del>
        <add place="across">fte</add>
    </subst>, welches<lb/>

Zugriff auf die Texte via DTA/DDC

DTA-Analysen, z.B. SemCloud

DTA-Analysen, z.B. DiaCollo

DDC-Suche mit GermaNet

DDC-Suche mit GermaNet-Erweiterung, Synset "Grundstoff; Urstoff"

Externe Tools: Voyant

Externe Tools: WCopyfind

Externe Tools: WCopyfind

Externe Tools: juXta, CollateX

Digital-Humanities-Kolloquium an der BBAW, 6.10.2017

Thesen zur 'Lektüre' digitaler Editionen:

  1. Eine Edition stellt 1, 2, 3, ... von n Lektürevorschlägen dar.
  2. Exploration der Grunddaten durch NutzerInnen = n Lektüren; Voraussetzungen dafür sind unter anderem:
    • Gute Dokumentation (inhaltlich, editorisch und technisch)
    • Zugang zu den Grunddaten & 'Data Literacy'
    • Zugang zu geeigneten Tools¹ & 'Tool Literacy' (¹ z.B. für TEI-XML)
    • i.d.R. erforderlich: Datenvor- & aufbereitung; -visualisierung
    • Dokumentation der eigenen Lektüre (inhaltlich, (editorisch,) technisch); ggf. Bereitstellung der erzeugten Daten (z.B. edissPlus)

Digital-Humanities-Kolloquium an der BBAW, 6.10.2017

Literaturempfehlungen (Auswahl):

#DHBBAW-Kollkquium 6.10.2017

By Christian Thomas

#DHBBAW-Kollkquium 6.10.2017

Christian Thomas (BBAW, HU Berlin) In die Tiefe gehen: Lektüre- und Nutzungsmöglichkeiten digitaler Repräsentationen historischer Textzeugen. Der Vortrag gibt zunächst einen Einblick in die Erstellung TEI-XML-basierter Text-Editionen mit einem Fokus auf Handschriften des 19. Jahrhunderts (am Beispiel der Nachschriften zu Humboldts Kosmos-Vorlesungen 1827/28 in Berlin). Anhand dessen wird erläutert, inwiefern sich die Repräsentation historischer Textzeugen im Zuge des Medien- bzw. Paradigmenwechsels von printorientierten Formaten hin zu genuin digitalen Editionsformen verändert. Dies hat zum einen Auswirkungen auf Produktionsseite, d.h. auf die editorische Praxis, vor allem aber – und hierauf wird der Schwerpunkt des Vortrags liegen – auf die Rezeptionsseite: Digitale Edition müssen nicht nur anders konzipiert und produziert, sondern auch anders gelesen werden, will man das Potential der (in der germanistischen Editionsphilologie teilweise immer noch:) ‘neuen’ Medien ausschöpfen. Die Editionspraxis schreitet von der linearen Auszeichnung textoberflächlicher Phänomene bzw. deren an- oder nachgelagerter diskursiver, spezifischer Beschreibung weiter in Richtung standardisierter, formalisierter Annotation, die in die mehrdimensionale, vielschichtige Tiefe des Textzeugen führt.

  • 4,509