In die Tiefe gehen:
Lektüre und Nutzung
digitaler Repräsentationen historischer Textzeugen.

Christian Thomas (HU & BBAW)

thomas@bbaw.de

"Lektüre im Zeitalter digitaler Medien", HU, IdL, 29./20.9.17

Gliederung

Teil I:
Thesen zur Lektüre (von (digitalen) Editionen)
im Zeitalter digitaler Medien;
Folgen für Produktion und Rezeption

Teil II:
Illustration der Thesen anhand konkreter Nutzungsbeispiele einer digitalen Edition

"Lektüre im Zeitalter digitaler Medien", HU, IdL, 29./20.9.17

Thesen zur 'Lektüre' digitaler Editionen:

Eine Edition stellt 1, 2, 3, ... von n Lektürevorschlägen dar.
Die Exploration der Grunddaten eröffnet weitere, eigene Lektüren (alternativ, konkurrierend, kontextualisierend z. Edition).

"Lektüre im Zeitalter digitaler Medien", HU, IdL, 29./20.9.17

Thesen zur 'Lektüre' digitaler Editionen:

Eine Edition stellt 1, 2, 3, ... von n Lektürevorschlägen dar.
- Edition = Auswahl, Interpretation, i.d.R. Vereinfachung.
- Die Edition wird über ein Interface – (e-)Buch, Website, HTML-/PDF-/etc.-Ausgabe – zugänglich gemacht und die Präsentation der Grunddaten wird für dieses Interface optimiert ==> weitere Auswahl, Interpretation, i.d.R. Vereinfachung.
- Beides sollte ausführlich dokumentiert werden, denn:
- Beide Prozesse sollten bei der Lektüre berücksichtigt werden!

"Lektüre im Zeitalter digitaler Medien", HU, IdL, 29./20.9.17

Thesen zur 'Lektüre' digitaler Editionen:

Eine Edition stellt 1, 2, 3, ... von n Lektürevorschlägen dar.
- Das Interface stellt den edierten Text dar, dabei je nach Medium mehr oder weniger tief strukturiert/annotiert.
- Die zugrunde liegenden Daten (und Metadaten) sind i.d.R. reichhaltiger als im Interface darstellbar; sie enthalten mehr Informationen als dort recherchierbar. (Bsp. Hybrid-Ed. MoE)
- > zur Lektüre: Menschen und Maschinen sollten diese Daten lesen können (und lesen dürfen)! (Negativ-Bsp. Asiatische Banise, s. Rez. AR)

Inspiriert vom Symposium DSEs as Interfaces (Graz 16), #DH2017, esp. @eerstewart1, @GretaFranzini #1, @GretaFranzini #2 u.v.a.

"Lektüre im Zeitalter digitaler Medien", HU, IdL, 29./20.9.17

Thesen zur 'Lektüre' digitaler Editionen:

Eine Edition stellt 1, 2, 3, ... von n Lektürevorschlägen dar.
- Das Interface ((e-)Buch, Website, HTML-/PDF-/etc.-Ausgabe) zeigt 1, 2, 3, ... von n Lektürewegen, kuratiert durch EditorIn.
- Die zugrunde liegenden Daten (und Metadaten) sind i.d.R. reichhaltiger als im Interface darstellbar; d.h. sie enthalten mehr Informationen als dort recherchierbar. (Bsp. Hybrid-Ed. MoE)
- > zur Lektüre: Menschen und Maschinen sollten diese Daten lesen können (und lesen dürfen)! (Negativ-Bsp. Asiatische Banise, s. Rez. AR)

Inspiriert vom Symposium DSEs as Interfaces (Graz 16), #DH2017, esp. @eerstewart1, @GretaFranzini #1, @GretaFranzini #2 u.v.a.

NB zum erwähnten u. vielen anderen Negativbeispielen:

Der fehlende Zugang zu den Grunddaten bzw. deren ständiger Verlust hat keine technischen Ursachen.

Es handelt sich v.a. um ein sozialisatorisches
(und auch förderpolitisches) Problem.

"Lektüre im Zeitalter digitaler Medien", HU, IdL, 29./20.9.17

Thesen zur 'Lektüre' digitaler Editionen:

Eine Edition stellt 1, 2, 3, ... von n Lektürevorschlägen dar.
Die Exploration der Grunddaten eröffnet weitere, eigene Lektüren (alternativ, konkurrierend, kontextualisierend z. Edition).

==> Diese können u. sollten durch die LeserInnen/NutzerInnen der Edition erschlossen werden ==> Lektüre im Digitalen.

"Lektüre im Zeitalter digitaler Medien", HU, IdL, 29./20.9.17

Thesen zur 'Lektüre' digitaler Editionen:

Eine Edition stellt 1, 2, 3, ... von n Lektürevorschlägen dar.
Exploration der Grunddaten durch NutzerInnen = n Lektüren; Voraussetzungen dafür sind unter anderem:
- Gute Dokumentation (inhaltlich, editorisch und technisch)
- Zugang zu den Grunddaten & 'Data Literacy'
- Zugang zu geeigneten Tools¹ & 'Tool Literacy' (¹ z.B. für TEI-XML)
- i.d.R. erforderlich: Datenvor- bzw. aufbereitung; -visualisierung
- Dokumentation der eigenen Lektüre (inhaltlich, (editorisch,) technisch); ggf. Bereitstellung der erzeugten Daten (z.B. edissPlus)

"Lektüre im Zeitalter digitaler Medien", HU, IdL, 29./20.9.17

Einige Folgerungen für Produktion und Rezeption:

Eine Edition stellt 1, 2, 3, ... von n Lektürevorschlägen dar.
Exploration der Grunddaten durch NutzerInnen = n Lektüren; daher umso wichtiger:
- Lektürewege als vom Editor/in ausgewählt kennzeichnen.
- Nicht (nur) das Interface wichtig, sondern Reichhaltigkeit u. flexible Nutzbarkeit der Daten (für Menschen u. Maschinen).
- Traditionell: Lektüre auf autorisierten Pfaden (via Interface)
- +Digital: Exploration der Daten (via Download/API/...)
  = Lektüre auf eigenen Pfaden, lesend und mit Tools.

http://www.culture.hu-berlin.de/hidden-kosmos

II: Illustration der Thesen

Hintergrund:
Projekt "Hidden Kosmos":
Edition/Textkorpus
Nachschriften der 'Kosmos-Vorträge' A. v. Humboldts

Humboldts 'Kosmos-Vorträge'

Berlin, 1827/28, zwei Kurse:
- 62 Stunden Berliner Universität, 3.11.1827–26.04.1828,
  ca. 400 Studis, Staff, Gasthörer
- 16 Stunden Sing-Akademie,
  6.12.1827–27.03.1828,
  ca. 1000 Pers., 'gemischtes' Publikum

... ein Meilenstein der
Wissenschaftspopularisierung

(Hamel/Tiemann 1993)

Humboldts 'Kosmos-Vorträge'

Berlin, 1827/28; ! ≠ Kosmos, 1845–62
- keine autorisierte Publikation der Vorträge durch Humboldt
- A.v.H.s ursprüngliche Manuskripte
  im Nachl. verstreut, aber (z.T.) erhalten
  – entgegen Humboldts Angaben:

Bei freier Rede habe ich [...]
nichts über meine Vorträge schriftlich aufgezeichnet
(A.v.H in der 'Vorrede' zum Kosmos, Bd. 1, S. X.)

Nachl. A.v.H., Gr. K. 8, Nr. 15, Bl. 33

Humboldts 'Kosmos-Vorträge'

Berlin, 1827/28; ! ≠ Kosmos, 1845–62
- keine autorisierte Publikation der Vorträge durch Humboldt
- Humboldt verbat sich Druck von Nachschriften, "Eingriff in mein Eigenthum" (Spenersche Zeitung, 12.12.1827)

nichts […] widerwärtiger, als publicirt
zu sehen, was ein Gemisch von Gehörtem
und Selbstzugesetztem ist.“
(A.v.H an R. Zeune, Berlin, 16.2.1857)

Anonym (Hrsg.) 1934

Hamel/Tiemann (Hrsg.) 1993 [2. A. 2004]

http://www.culture.hu-berlin.de/hidden-kosmos

Projekt "Hidden Kosmos"

≈ 3600 Seiten,
≈ 4,5M Zeichen,
≈ 660K Tokens,
≈ 103K Types.

http://www.culture.hu-berlin.de/hidden-kosmos

Projekt "Hidden Kosmos"

≈ 3600 Seiten,
≈ 4,5M Zeichen,
≈ 660K Tokens,
≈ 103K Types.

http://www.culture.hu-berlin.de/hidden-kosmos

Nachschriften der 'Kosmos-Vorträge' A. v. Humboldts

Projekt- Förderung	Texterfassung und -anntoation	Publikation und ling. Erschließg.	Nachhaltigkeit & Dissemination

Nachschriften der 'Kosmos-Vorträge' A. v. Humboldts

	Texterfassung und -anntoation	Publikation und ling. Erschließg.

Texterfassung und -Annotation gemäß P5 Text Enoding Initiative

“The TEI-C is… a consortium which collectively develops and maintains
a standard for the representation of texts in digital form.” (http ://www.tei-c.org /)

TEI-C = Herausgeber der TEI Guidelines:

XML-basierter, freier, internationaler (de facto-) Standard
umfassend dokumentiert
plattformunabhängig, flexibel nutzbar
menschen- & maschinenlesbar
generische und TEI-spezifische Tools
(prinzipiell) interoperabel

Texterfassung und -Annotation gemäß P5 Text Enoding Initiative

TEI-C = Herausgeber der TEI Guidelines:

XML-basierter, freier,
internationaler (de facto-) Standard
umfassend dokumentiert
plattformunabhängig, flexibel nutzbar
menschen- & maschinenlesbar
generische und TEI-spezifische Tools
(prinzipiell) interoperabel

Aktuelle Version: 3.2.0., last updated
10th July 2017; as PDF: 1891 pp.
http://www.tei-c.org/release/doc/tei-p5-doc/en/Guidelines.pdf

TEI-XML gemäß DTA-Basisformat

> Haaf/Geyken/Wiegand: The DTA “Base Format”: A TEI Subset for the Compilation of a Large Reference Corpus of Printed Text from Multiple Sources, In: jTEI 8, 2014-2015, http ://jtei.revues.org/1114.

Das DTA-Basisformat DTABf, http://www.deutschestextarchiv.de/doku/basisformat/

= echte Untermenge des TEI-P5 Tagsets
Ziele: Reichhaltigkeit der TEI-Richtlinien reduzieren,
nur je eine, eindeutige Tagging-Lösung vorgeben
> Reduktion der Elementauswahl,
Festlegung erlaubter Attribute und Werte
Komponenten: Dokumentation, ODD, RelaxNG
DTABf = Ausgangsformat für DTA-Tools & (TEI-)XML-Tools

Umwandlung in HTML mit XSLT

<!-- processing-instruction, RNG-Schema, Schematron-Regelsatz usw. -->
<?xml version="1.0" encoding="UTF-8"?>    
<?xml-model href="http://www.deutschestextarchiv.de/basisformat_ms.rng" type="application/xml" schematypens="http://relaxng.org/ns/structure/1.0"?>
<?xml-model href="http://www.deutschestextarchiv.de/basisformat.sch" type="application/xml" schematypens="http://purl.oclc.org/dsdl/schematron"?>

<!-- Wurzelelement mit namespace -->
<TEI xmlns="http://www.tei-c.org/ns/1.0">
  <teiHeader>[Metadaten]</teiHeader>
  <text>
    <front>[Elemente vor Beginn des Buchtextes]</front>
    <body>     <!-- Textkörper -->
      <p>      <!-- Beginn eines Absatzes (öffnender Tag des Elements <p>) -->
          TEXT, <hi rendition="#b">FETTER TEXT</hi><lb/>    <!-- Zeilenwechsel -->
          <del rendition="#erased">GESTRICHENER TEXT (ausrasiert)</del><lb/>    <!-- Zeilenwechsel -->
      </p>    <!-- Ende eines Absatzes (schließender Tag des Elements <p>) -->
    </body>
    <back>[Elemente nach Abschluss des Buchtextes]</back>
  </text>
</TEI>

<!-- processing-instruction, RNG-Schema, Schematron-Regelsatz usw. -->
<?xml version="1.0" encoding="UTF-8"?>    
<?xml-model href="http://www.deutschestextarchiv.de/basisformat_ms.rng" type="application/xml" schematypens="http://relaxng.org/ns/structure/1.0"?>
<?xml-model href="http://www.deutschestextarchiv.de/basisformat.sch" type="application/xml" schematypens="http://purl.oclc.org/dsdl/schematron"?>

<!-- Wurzelelement mit namespace -->
<TEI xmlns="http://www.tei-c.org/ns/1.0">
  <teiHeader>[Metadaten]</teiHeader>
  <text>
    <front>[Elemente vor Beginn des Buchtextes]</front>
    <body>     <!-- Textkörper -->
      <p>      <!-- Beginn eines Absatzes (öffnender Tag des Elements <p>) -->
          TEXT, <hi rendition="#b">FETTER TEXT</hi><lb/>    <!-- Zeilenwechsel -->
          <del rendition="#erased">GESTRICHENER TEXT (ausrasiert)</del><lb/>    <!-- Zeilenwechsel -->
      </p>    <!-- Ende eines Absatzes (schließender Tag des Elements <p>) -->
    </body>
    <back>[Elemente nach Abschluss des Buchtextes]</back>
  </text>
</TEI>

Umwandlung in HTML mit XSLT

Texterfassung und -Annotation

erweitertes DTA-Basisformat (DTABf):
DTABf für Manuskripte (DTABf-M) (jTEI-Artikel im Ersch.)
Metadaten, Dokument-Struktur, 'Typographie'

Texterfassung und -Annotation

DTABf für Manuskripte (DTABf-M) (jTEI-Artikel im Ersch.)
Manuskript-typische Textmerkmale wie Überschreibungen, @hand-Wechsel, <metamark>s u.a.

Texterfassung und -Annotation

Manuskript-typische Textmerkmale wie Überschreibungen, @hand-Wechsel, <metamark>s u.a.
= wichtig (nicht nur)
für Nachschriften: Eingriffe Dritter, Unsicherheiten und Fehler(!) der Schreiber usw.

Texterfassung und -Annotation:
Nutzungsmöglichkeiten

Beispiel: Bleistift-Gebrauch in parthey_msgermqu1711_1828 (XML)

Texterfassung und -Annotation:
Nutzungsmöglichkeiten

Beispiel: Bleistift-Gebrauch in parthey_msgermqu1711_1828 (XML)

Texterfassung und -Annotation:
Nutzungsmöglichkeiten

Beispiel: Bleistift-Gebrauch in parthey_msgermqu1711_1828 (XML)

> Mehrzahl im Abschnitt Geographie des Organischen

54. St.: Kennzeichen des Organischen
55.–57. St.: Geographie der Pflanzen
58. St.: Geographie der Thiere

Texterfassung und -Annotation

Auszeichnung von <persName> mit @ref GND/VIAF/Wikidata/...

http://www.deutschestextarchiv.de/kosmos/person

<item>3, die <hi rendition="#u">englischen</hi> Messungen unter dem 
General <persName resp="#CT" ref="http://d-nb.info/gnd/130800600">
    R.<metamark><space dim="horizontal"/></metamark></persName> 
<metamark>(?)</metamark> und 
<persName resp="#CT" ref="http://d-nb.info/gnd/1055317457">M<metamark>....</metamark></persName>
    <add place="right"><metamark>?</metamark></add><lb/>
<!-- [...] -->              <item>4, Drei grosse Messungen in <hi rendition="#u">Ostindien</hi> von dem 
General <persName resp="#CT" ref="http://d-nb.info/gnd/117574406">
    L<metamark><space dim="horizontal"/></metamark></persName>
<metamark>?</metamark><lb/>
und <persName>T<metamark><space dim="horizontal"/></metamark></persName> <metamark>?</metamark></item><lb/>

Texterfassung und -Annotation

Auszeichnung von <persName> mit @ref GND/VIAF/Wikidata/...

http://www.deutschestextarchiv.de/kosmos/person

<choice><abbr>Rſe</abbr><expan resp="#SB">Reiſe</expan></choice> <choice><abbr>ds</abbr><expan resp="#SB">des</expan></choice>
<hi rendition="#aq">
<persName resp="#SB" ref="http://d-nb.info/gnd/100648282">
    Kuki</persName></hi><lb/>

Texterfassung und -Annotation

alle <persName>s aus allen Nachschriften
Ansetzung vs. Vorlage
Anzahl der Vorkommen
Links zu den Texten
Links auf die Normdatensätze
Vernetzung: CSV, BEACON, ...

http://www.deutschestextarchiv.de/kosmos/person

Texterfassung und -Annotation

Ansetzung vs. Vorlage:
- Welche Namen waren dem Publikum bekannt, welche nicht?
Anzahl der Vorkommen pro Nachschrift und insgesamt:
- z.B. Uni vs. Sing-Akad.: Welches Personal für welchen Kurs?
- Ältere vs. aktuelle Forschung: Nachwuchsförderer A.v.H?
- Kosmos-Vorträge auf der Höhe der wiss. Forschung der Zeit?
- Welcher Nachschreiber 'überhört' welche Personen?
Vernetzung: API/BEACON:
- z.B. Porträtindex/Wikimedia Comm.s, edition-humboldt.de ...

http://www.deutschestextarchiv.de/kosmos/person

Personenregister: Nutzungsmöglichkeiten und Anschlussfragen

http://edition-humboldt.de/H0012670

Siehe auch: Instrumente

http://www.deutschestextarchiv.de/kosmos/instrument

Siehe auch: Bibliographie

http://www.deutschestextarchiv.de/kosmos/bibliographie/

Zugriff auf die Texte via DTA

Text-Bild-Ansicht:

Text-Darstellung via XSLT-Transformation aus DTABf-M (=XML)
z.B. HTML: inkl. graphischer Umsetzung einiger Elemente der Annotation

http://www.deutschestextarchiv.de/nn_msgermqu2345_1827/17

dies fand 
<subst>
    <del rendition="#s" hand="#pencil">
        <subst>
                <del rendition="#ow">
                    <supplied reason="covered" cert="high" resp="#CT">ich</supplied>
                </del>
                <add place="across" hand="#ink2">
                    <persName ref="http://d-nb.info/gnd/118554700">Humbold</persName></hi>
                </add>
        </subst>
    </del>
    <add place="superlinear" hand="#pencil">ich</add>
</subst> auf dem Chimboraßo,
<!-- Beispiel vereinfacht: <hi> entfernt, cf. http://www.deutschestextarchiv.de/nn_msgermqu2345_1827/17 -->

http://www.deutschestextarchiv.de/nn_msgermqu2345_1827/17

Zugriff auf die Texte via DTA/DDC

http://www.deutschestextarchiv.de/search/ddc/search?ctx=8&q=Europa%20verdankt%20Clima%20%23cntxt3%20%23less_by_date%20;start=1;limit=13;fmt=kwic

DTA/DDC, GermaNet integriert

DDC-Suche mit GermaNet-Erweiterung, Synset "Grundstoff; Urstoff"

@ref-erenzieren mit Normdaten

<!-- [...] --> <persName ref="http://d-nb.info/gnd/118534912">Franklin</persName><lb/>
hat die wichtige Entdeckung gemacht, wie man nach dem<lb/>

http://www.culture.hu-berlin.de/hidden-kosmos

Projekt "Hidden Kosmos"

Ziel: Publikation sämtlicher bis dato bekannter Nachschriften verschiedener Hörer der 'Kosmos-Vorträge' (1827/28):

Ermittlung bekannter und weiterer Nachschriften,
Bilddigitalisierung, Volltexterfassung, Annotation (TEI-XML),
digitale Publikation im Deutschen Textarchiv,
exemplarische Verknüpfung der Dokumente,

[somit Humboldts] Vorlesungen
als Forschungsfeld erstmals erschließen.

(Erdmann/Hug/Kassung/Thomas: Antrag auf Förderung des Projekts, Exzellenz-Initiative HU)

<!-- [...] --> <persName ref="http://d-nb.info/gnd/118534912">Franklin</persName><lb/>
hat die wichtige Entdeckung gemacht, wie man nach dem<lb/>

@ref-erenzieren mit Normdaten

A picture

Version A

Die Natur ist
Einheit und Vielheit,
sie ist der Inbegriff der Naturdinge und
Naturkräfte...

Version B

Die Natur ſelbſt iſt
Einheit in der Vielheit;
ſie iſt der Inbegriff der Naturdinge und der Naturkräfte...

Humboldt, Alexander von: Kosmos. Entwurf einer physischen Weltbeschreibung. Bd. 1. Stuttgart u. a., 1845, S. 5

Folien zum Symposium "Lektüre im Zeitalter digitaler Medien", HU Berlin, IdL, 29.–30. September 2017

By Christian Thomas

Folien zum Symposium "Lektüre im Zeitalter digitaler Medien", HU Berlin, IdL, 29.–30. September 2017

1,750

In die Tiefe gehen:Lektüre und Nutzungdigitaler Repräsentationen historischer Textzeugen.

Gliederung

Teil I: Thesen zur Lektüre (von (digitalen) Editionen) im Zeitalter digitaler Medien; Folgen für Produktion und Rezeption

Teil II: Illustration der Thesen anhand konkreter Nutzungsbeispiele einer digitalen Edition

Thesen zur 'Lektüre' digitaler Editionen:

Thesen zur 'Lektüre' digitaler Editionen:

Thesen zur 'Lektüre' digitaler Editionen:

Thesen zur 'Lektüre' digitaler Editionen:

Thesen zur 'Lektüre' digitaler Editionen:

Thesen zur 'Lektüre' digitaler Editionen:

Einige Folgerungen für Produktion und Rezeption:

II: Illustration der Thesen

Hintergrund: Projekt "Hidden Kosmos": Edition/Textkorpus Nachschriften der 'Kosmos-Vorträge' A. v. Humboldts

Humboldts 'Kosmos-Vorträge'

Humboldts 'Kosmos-Vorträge'

Humboldts 'Kosmos-Vorträge'

Projekt "Hidden Kosmos"

Projekt "Hidden Kosmos"

Nachschriften der 'Kosmos-Vorträge' A. v. Humboldts

Nachschriften der 'Kosmos-Vorträge' A. v. Humboldts

Texterfassung und -Annotation gemäß P5 Text Enoding Initiative

Texterfassung und -Annotation gemäß P5 Text Enoding Initiative

TEI-XML gemäß DTA-Basisformat

TEI-XML gemäß DTA-Basisformat

Umwandlung in HTML mit XSLT

Umwandlung in HTML mit XSLT

Texterfassung und -Annotation

Texterfassung und -Annotation

Texterfassung und -Annotation

Texterfassung und -Annotation: Nutzungsmöglichkeiten

Texterfassung und -Annotation: Nutzungsmöglichkeiten

Texterfassung und -Annotation: Nutzungsmöglichkeiten

Texterfassung und -Annotation

Texterfassung und -Annotation

Texterfassung und -Annotation

Texterfassung und -Annotation

Siehe auch: Instrumente

Siehe auch: Bibliographie

Zugriff auf die Texte via DTA

Zugriff auf die Texte via DTA/DDC

DTA/DDC, GermaNet integriert

@ref-erenzieren mit Normdaten

Projekt "Hidden Kosmos"

@ref-erenzieren mit Normdaten

A picture

Version A

Version B

Folien zum Symposium "Lektüre im Zeitalter digitaler Medien", HU Berlin, IdL, 29.–30. September 2017

Folien zum Symposium "Lektüre im Zeitalter digitaler Medien", HU Berlin, IdL, 29.–30. September 2017

Christian Thomas

More from Christian Thomas

In die Tiefe gehen:
Lektüre und Nutzung
digitaler Repräsentationen historischer Textzeugen.

Teil I:
Thesen zur Lektüre (von (digitalen) Editionen)
im Zeitalter digitaler Medien;
Folgen für Produktion und Rezeption

Teil II:
Illustration der Thesen anhand konkreter Nutzungsbeispiele einer digitalen Edition

Hintergrund:
Projekt "Hidden Kosmos":
Edition/Textkorpus
Nachschriften der 'Kosmos-Vorträge' A. v. Humboldts

Texterfassung und -Annotation:
Nutzungsmöglichkeiten

Texterfassung und -Annotation:
Nutzungsmöglichkeiten

Texterfassung und -Annotation:
Nutzungsmöglichkeiten