In die Tiefe gehen:
Lektüre und Nutzung
digitaler Repräsentationen historischer Textzeugen.

Christian Thomas (HU & BBAW)

thomas@bbaw.de

"Lektüre im Zeitalter digitaler Medien", HU, IdL, 29./20.9.17

Gliederung

Teil I:
Thesen zur Lektüre (von (digitalen) Editionen)
im Zeitalter digitaler Medien;
Folgen für Produktion und Rezeption

Teil II:
Illustration der Thesen anhand konkreter Nutzungsbeispiele einer digitalen Edition

"Lektüre im Zeitalter digitaler Medien", HU, IdL, 29./20.9.17

Thesen zur 'Lektüre' digitaler Editionen:

  1. Eine Edition stellt 1, 2, 3, ... von n Lektürevorschlägen dar.
  2. Die Exploration der Grunddaten eröffnet weitere, eigene Lektüren (alternativ, konkurrierend, kontextualisierend z. Edition).

"Lektüre im Zeitalter digitaler Medien", HU, IdL, 29./20.9.17

Thesen zur 'Lektüre' digitaler Editionen:

  1. Eine Edition stellt 1, 2, 3, ... von n Lektürevorschlägen dar.
    • Edition = Auswahl, Interpretation, i.d.R. Vereinfachung.
    • Die Edition wird über ein Interface  (e-)Buch, Website, HTML-/PDF-/etc.-Ausgabe – zugänglich gemacht und die Präsentation der Grunddaten wird für dieses Interface optimiert ==> weitere Auswahl, Interpretation, i.d.R. Vereinfachung.
    • Beides sollte ausführlich dokumentiert werden, denn:
    • Beide Prozesse sollten bei der Lektüre berücksichtigt werden!

"Lektüre im Zeitalter digitaler Medien", HU, IdL, 29./20.9.17

Thesen zur 'Lektüre' digitaler Editionen:

  1. Eine Edition stellt 1, 2, 3, ... von n Lektürevorschlägen dar.
    • Das Interface stellt den edierten Text dar, dabei je nach Medium mehr oder weniger tief strukturiert/annotiert.
    • Die zugrunde liegenden Daten (und Metadaten) sind i.d.R. reichhaltiger als im Interface darstellbar; sie enthalten mehr Informationen als dort recherchierbar. (Bsp. Hybrid-Ed. MoE)
    • > zur Lektüre: Menschen und Maschinen sollten diese Daten lesen können (und lesen dürfen)! (Negativ-Bsp. Asiatische Banise, s. Rez. AR)

Inspiriert vom Symposium DSEs as Interfaces (Graz 16), #DH2017, esp. @eerstewart1, @GretaFranzini #1,  @GretaFranzini#2 u.v.a.

"Lektüre im Zeitalter digitaler Medien", HU, IdL, 29./20.9.17

Thesen zur 'Lektüre' digitaler Editionen:

  1. Eine Edition stellt 1, 2, 3, ... von n Lektürevorschlägen dar.
    • Das Interface ((e-)Buch, Website, HTML-/PDF-/etc.-Ausgabe) zeigt 1, 2, 3, ... von n Lektürewegen, kuratiert durch EditorIn.
    • Die zugrunde liegenden Daten (und Metadaten) sind i.d.R. reichhaltiger als im Interface darstellbar; d.h. sie enthalten mehr Informationen als dort recherchierbar. (Bsp. Hybrid-Ed. MoE)
    • > zur Lektüre: Menschen und Maschinen sollten diese Daten lesen können (und lesen dürfen)! (Negativ-Bsp. Asiatische Banise, s. Rez. AR)

Inspiriert vom Symposium DSEs as Interfaces (Graz 16), #DH2017, esp. @eerstewart1, @GretaFranzini #1,  @GretaFranzini#2 u.v.a.

NB zum erwähnten u. vielen anderen Negativbeispielen:

Der fehlende Zugang zu den Grunddaten bzw. deren ständiger Verlust hat keine technischen Ursachen.

Es handelt sich v.a. um ein sozialisatorisches
(und auch förderpolitisches) Problem.

"Lektüre im Zeitalter digitaler Medien", HU, IdL, 29./20.9.17

Thesen zur 'Lektüre' digitaler Editionen:

  1. Eine Edition stellt 1, 2, 3, ... von n Lektürevorschlägen dar.
  2. Die Exploration der Grunddaten eröffnet weitere, eigene Lektüren (alternativ, konkurrierend, kontextualisierend z. Edition).

    ==> Diese können u. sollten durch die LeserInnen/NutzerInnen der Edition erschlossen werden ==> Lektüre im Digitalen.

"Lektüre im Zeitalter digitaler Medien", HU, IdL, 29./20.9.17

Thesen zur 'Lektüre' digitaler Editionen:

  1. Eine Edition stellt 1, 2, 3, ... von n Lektürevorschlägen dar.
  2. Exploration der Grunddaten durch NutzerInnen = n Lektüren; Voraussetzungen dafür sind unter anderem:
    • Gute Dokumentation (inhaltlich, editorisch und technisch)
    • Zugang zu den Grunddaten & 'Data Literacy'
    • Zugang zu geeigneten Tools¹ & 'Tool Literacy' (¹ z.B. für TEI-XML)
    • i.d.R. erforderlich: Datenvor- bzw. aufbereitung; -visualisierung
    • Dokumentation der eigenen Lektüre (inhaltlich, (editorisch,) technisch); ggf. Bereitstellung der erzeugten Daten (z.B. edissPlus)

"Lektüre im Zeitalter digitaler Medien", HU, IdL, 29./20.9.17

Einige Folgerungen für Produktion und Rezeption:

  1. Eine Edition stellt 1, 2, 3, ... von n Lektürevorschlägen dar.
  2. Exploration der Grunddaten durch NutzerInnen = n Lektüren; daher umso wichtiger:
    • Lektürewege als vom Editor/in ausgewählt kennzeichnen.
    • Nicht (nur) das Interface wichtig, sondern Reichhaltigkeit u. flexible Nutzbarkeit der Daten (für Menschen u. Maschinen).
    • Traditionell: Lektüre auf autorisierten Pfaden (via Interface)
    • +Digital: Exploration der Daten (via Download/API/...)
      = Lektüre auf eigenen Pfaden, lesend und mit Tools.

II: Illustration der Thesen

Hintergrund:
Projekt "Hidden Kosmos":
Edition/Textkorpus
Nachschriften der 'Kosmos-Vorträge' A. v. Humboldts

Humboldts 'Kosmos-Vorträge'

  • Berlin, 1827/28, zwei Kurse:
    • 62 Stunden Berliner Universität, 3.11.1827–26.04.1828,
      ca. 400 Studis, Staff, Gasthörer
    • 16 Stunden Sing-Akademie,
      6.12.1827–27.03.1828,
      ca. 1000 Pers., 'gemischtes' Publikum

... ein Meilenstein der
Wissenschaftspopularisierung

(Hamel/Tiemann 1993)

(c) Schiller-Nationalmuseum, Marbach

Humboldts 'Kosmos-Vorträge'

  • Berlin, 1827/28; ! Kosmos, 1845–62
    • keine autorisierte Publikation der Vorträge durch Humboldt
    • A.v.H.s ursprüngliche Manuskripte
      im Nachl. verstreut, aber (z.T.) erhalten
      – entgegen Humboldts Angaben:

Bei freier Rede habe ich [...]
nichts über meine Vorträge schriftlich aufgezeichnet

(A.v.H in der 'Vorrede' zum Kosmos, Bd. 1, S. X.)

Nachl. A.v.H., Gr. K. 8, Nr. 15, Bl. 33

Humboldts 'Kosmos-Vorträge'

  • Berlin, 1827/28; ! Kosmos, 1845–62
    • keine autorisierte Publikation der Vorträge durch Humboldt
    • Humboldt verbat sich Druck von Nachschriften, "Eingriff in mein Eigenthum" (Spenersche Zeitung, 12.12.1827)

nichts […] widerwärtiger, als publicirt
zu sehen, was ein
Gemisch von Gehörtem
und Selbstzugesetztem
ist.“
(A.v.H an R. Zeune, Berlin, 16.2.1857)

Anonym (Hrsg.) 1934


Hamel/Tiemann (Hrsg.) 1993 [2. A. 2004]

Projekt "Hidden Kosmos"

3600 Seiten,
4,5M Zeichen,
660K Tokens,
≈ 103K Types.

Projekt "Hidden Kosmos"

3600 Seiten,
4,5M Zeichen,
660K Tokens,
≈ 103K Types.

Nachschriften der 'Kosmos-Vorträge' A. v. Humboldts

Projekt-
Förderung
Texterfassung und -anntoation Publikation und ling. Erschließg. Nachhaltigkeit & Dissemination

Nachschriften der 'Kosmos-Vorträge' A. v. Humboldts

Texterfassung und -anntoation Publikation und ling. Erschließg.

Texterfassung und -Annotation gemäß P5 Text Enoding Initiative

“The TEI-C is… a consortium which collectively develops and maintains
a standard for the representation of texts in digital form.” (http://www.tei-c.org/)

TEI-C = Herausgeber der TEI Guidelines:

  • XML-basierter, freier, internationaler (de facto-) Standard
  • umfassend dokumentiert
  • plattformunabhängig, flexibel nutzbar
  • menschen- & maschinenlesbar
  • generische und TEI-spezifische Tools
  • (prinzipiell) interoperabel

Texterfassung und -Annotation gemäß P5 Text Enoding Initiative

TEI-C = Herausgeber der TEI Guidelines:

  • XML-basierter, freier,
    internationaler (de facto-) Standard
  • umfassend dokumentiert
  • plattformunabhängig, flexibel nutzbar
  • menschen- & maschinenlesbar
  • generische und TEI-spezifische Tools
  • (prinzipiell) interoperabel

Aktuelle Version: 3.2.0., last updated
10th July 2017; as PDF: 1891 pp.
http://www.tei-c.org/release/doc/tei-p5-doc/en/Guidelines.pdf

TEI-XML gemäß DTA-Basisformat

TEI-XML gemäß DTA-Basisformat

> Haaf/Geyken/Wiegand: The DTA “Base Format”: A TEI Subset for the Compilation of a Large Reference Corpus of Printed Text from Multiple Sources, In: jTEI 8, 2014-2015,  http://jtei.revues.org/1114.

Das DTA-Basisformat DTABf, http://www.deutschestextarchiv.de/doku/basisformat/

  • = echte Untermenge des TEI-P5 Tagsets
  • Ziele: Reichhaltigkeit der TEI-Richtlinien reduzieren,
    nur je eine,
    eindeutige Tagging-Lösung vorgeben
  • > Reduktion der Elementauswahl,
    Festlegung erlaubter Attribute und Werte
  • Komponenten: Dokumentation, ODD, RelaxNG
  • DTABf = Ausgangsformat für DTA-Tools & (TEI-)XML-Tools

Umwandlung in HTML mit XSLT

<!-- processing-instruction, RNG-Schema, Schematron-Regelsatz usw. -->
<?xml version="1.0" encoding="UTF-8"?>    
<?xml-model href="http://www.deutschestextarchiv.de/basisformat_ms.rng" type="application/xml" schematypens="http://relaxng.org/ns/structure/1.0"?>
<?xml-model href="http://www.deutschestextarchiv.de/basisformat.sch" type="application/xml" schematypens="http://purl.oclc.org/dsdl/schematron"?>

<!-- Wurzelelement mit namespace -->
<TEI xmlns="http://www.tei-c.org/ns/1.0">
  <teiHeader>[Metadaten]</teiHeader>
  <text>
    <front>[Elemente vor Beginn des Buchtextes]</front>
    <body>     <!-- Textkörper -->
      <p>      <!-- Beginn eines Absatzes (öffnender Tag des Elements <p>) -->
          TEXT, <hi rendition="#b">FETTER TEXT</hi><lb/>    <!-- Zeilenwechsel -->
          <del rendition="#erased">GESTRICHENER TEXT (ausrasiert)</del><lb/>    <!-- Zeilenwechsel -->
      </p>    <!-- Ende eines Absatzes (schließender Tag des Elements <p>) -->
    </body>
    <back>[Elemente nach Abschluss des Buchtextes]</back>
  </text>
</TEI>
<!-- processing-instruction, RNG-Schema, Schematron-Regelsatz usw. -->
<?xml version="1.0" encoding="UTF-8"?>    
<?xml-model href="http://www.deutschestextarchiv.de/basisformat_ms.rng" type="application/xml" schematypens="http://relaxng.org/ns/structure/1.0"?>
<?xml-model href="http://www.deutschestextarchiv.de/basisformat.sch" type="application/xml" schematypens="http://purl.oclc.org/dsdl/schematron"?>

<!-- Wurzelelement mit namespace -->
<TEI xmlns="http://www.tei-c.org/ns/1.0">
  <teiHeader>[Metadaten]</teiHeader>
  <text>
    <front>[Elemente vor Beginn des Buchtextes]</front>
    <body>     <!-- Textkörper -->
      <p>      <!-- Beginn eines Absatzes (öffnender Tag des Elements <p>) -->
          TEXT, <hi rendition="#b">FETTER TEXT</hi><lb/>    <!-- Zeilenwechsel -->
          <del rendition="#erased">GESTRICHENER TEXT (ausrasiert)</del><lb/>    <!-- Zeilenwechsel -->
      </p>    <!-- Ende eines Absatzes (schließender Tag des Elements <p>) -->
    </body>
    <back>[Elemente nach Abschluss des Buchtextes]</back>
  </text>
</TEI>

Umwandlung in HTML mit XSLT

Texterfassung und -Annotation

Texterfassung und -Annotation

  • DTABf für Manuskripte (DTABf-M) (jTEI-Artikel im Ersch.)
  • Manuskript-typische Textmerkmale wie Überschreibungen, @hand-Wechsel, <metamark>s u.a.

Texterfassung und -Annotation

  • Manuskript-typische Textmerkmale wie Überschreibungen, @hand-Wechsel, <metamark>s u.a.
  • = wichtig (nicht nur)
    für Nachschriften
    : Eingriffe Dritter, Unsicherheiten und Fehler(!) der Schreiber usw.

Texterfassung und -Annotation:
Nutzungsmöglichkeiten

Beispiel: Bleistift-Gebrauch in parthey_msgermqu1711_1828 (XML)

Texterfassung und -Annotation:
Nutzungsmöglichkeiten

Beispiel: Bleistift-Gebrauch in parthey_msgermqu1711_1828 (XML)

Texterfassung und -Annotation:
Nutzungsmöglichkeiten

Beispiel: Bleistift-Gebrauch in parthey_msgermqu1711_1828 (XML)

> Mehrzahl im Abschnitt Geographie des Organischen

  • 54. St.: Kennzeichen des Organischen
  • 55.–57. St.: Geographie der Pflanzen
  • 58. St.: Geographie der Thiere

Texterfassung und -Annotation

  • Auszeichnung von <persName> mit @ref GND/VIAF/Wikidata/...
<item>3, die <hi rendition="#u">englischen</hi> Messungen unter dem 
General <persName resp="#CT" ref="http://d-nb.info/gnd/130800600">
    R.<metamark><space dim="horizontal"/></metamark></persName> 
<metamark>(?)</metamark> und 
<persName resp="#CT" ref="http://d-nb.info/gnd/1055317457">M<metamark>....</metamark></persName>
    <add place="right"><metamark>?</metamark></add><lb/>
<!-- [...] -->              <item>4, Drei grosse Messungen in <hi rendition="#u">Ostindien</hi> von dem 
General <persName resp="#CT" ref="http://d-nb.info/gnd/117574406">
    L<metamark><space dim="horizontal"/></metamark></persName>
<metamark>?</metamark><lb/>
und <persName>T<metamark><space dim="horizontal"/></metamark></persName> <metamark>?</metamark></item><lb/>

Texterfassung und -Annotation

  • Auszeichnung von <persName> mit @ref GND/VIAF/Wikidata/...
<choice><abbr>Rſe</abbr><expan resp="#SB">Reiſe</expan></choice> <choice><abbr>ds</abbr><expan resp="#SB">des</expan></choice>
<hi rendition="#aq">
<persName resp="#SB" ref="http://d-nb.info/gnd/100648282">
    Kuki</persName></hi><lb/>

Texterfassung und -Annotation

  • alle <persName>s aus allen Nachschriften
  • Ansetzung vs. Vorlage
  • Anzahl der Vorkommen
  • Links zu den Texten
  • Links auf die Normdatensätze
  • Vernetzung: CSV, BEACON, ...

Texterfassung und -Annotation

  • Ansetzung vs. Vorlage:
    • Welche Namen waren dem Publikum bekannt, welche nicht?
  • Anzahl der Vorkommen pro Nachschrift und insgesamt:
    • z.B. Uni vs. Sing-Akad.: Welches Personal für welchen Kurs?
    • Ältere vs. aktuelle Forschung: Nachwuchsförderer A.v.H?
    • Kosmos-Vorträge auf der Höhe der wiss. Forschung der Zeit?
    • Welcher Nachschreiber 'überhört' welche Personen?
  • Vernetzung: API/BEACON:

Personenregister: Nutzungsmöglichkeiten und Anschlussfragen

Siehe auch: Instrumente

Siehe auch: Bibliographie

Zugriff auf die Texte via DTA

Text-Bild-Ansicht:

  • Text-Darstellung via XSLT-Transformation aus DTABf-M (=XML)
  • z.B. HTML: inkl. graphischer Umsetzung einiger Elemente der Annotation
dies fand 
<subst>
    <del rendition="#s" hand="#pencil">
        <subst>
                <del rendition="#ow">
                    <supplied reason="covered" cert="high" resp="#CT">ich</supplied>
                </del>
                <add place="across" hand="#ink2">
                    <persName ref="http://d-nb.info/gnd/118554700">Humbold</persName></hi>
                </add>
        </subst>
    </del>
    <add place="superlinear" hand="#pencil">ich</add>
</subst> auf dem Chimboraßo,
<!-- Beispiel vereinfacht: <hi> entfernt, cf. http://www.deutschestextarchiv.de/nn_msgermqu2345_1827/17 -->

Zugriff auf die Texte via DTA/DDC

http://www.deutschestextarchiv.de/search/ddc/search?ctx=8&q=Europa%20verdankt%20Clima%20%23cntxt3%20%23less_by_date%20;start=1;limit=13;fmt=kwic

DTA/DDC, GermaNet integriert

DDC-Suche mit GermaNet-Erweiterung, Synset "Grundstoff; Urstoff"

@ref-erenzieren mit Normdaten

<!-- [...] --> <persName ref="http://d-nb.info/gnd/118534912">Franklin</persName><lb/>
hat die wichtige Entdeckung gemacht, wie man nach dem<lb/>

Projekt "Hidden Kosmos"

Ziel: Publikation sämtlicher bis dato bekannter Nachschriften verschiedener Hörer der 'Kosmos-Vorträge' (1827/28):

  • Ermittlung bekannter und weiterer Nachschriften,
  • Bilddigitalisierung, Volltexterfassung, Annotation (TEI-XML),
  • digitale Publikation im Deutschen Textarchiv,
  • exemplarische Verknüpfung der Dokumente,

[somit Humboldts] Vorlesungen
als Forschungsfeld erstmals erschließen.

(Erdmann/Hug/Kassung/Thomas: Antrag auf Förderung des Projekts, Exzellenz-Initiative HU)

<!-- [...] --> <persName ref="http://d-nb.info/gnd/118534912">Franklin</persName><lb/>
hat die wichtige Entdeckung gemacht, wie man nach dem<lb/>

@ref-erenzieren mit Normdaten

A picture

Version A

Die Natur ist
Einheit und Vielheit,
sie ist der Inbegriff der Naturdinge und
Naturkräfte... 

Version B

Die Natur ſelbſt iſt
Einheit in der Vielheit;
ſie iſt der Inbegriff der Naturdinge und der Naturkräfte...

Humboldt, Alexander von: Kosmos. Entwurf einer physischen Weltbeschreibung. Bd. 1. Stuttgart u. a., 1845, S. 5

Folien zum Symposium "Lektüre im Zeitalter digitaler Medien", HU Berlin, IdL, 29.–30. September 2017

By Christian Thomas

Folien zum Symposium "Lektüre im Zeitalter digitaler Medien", HU Berlin, IdL, 29.–30. September 2017

  • 1,411