Christian Thomas (HU & BBAW)
Digital-Humanities-Kolloquium an der BBAW, 6.10.2017
Digital-Humanities-Kolloquium an der BBAW, 6.10.2017
Digital-Humanities-Kolloquium an der BBAW, 6.10.2017
Inspiriert vom Symposium DSEs as Interfaces (Graz 16), #DH2017, esp. @eerstewart1, @GretaFranzini #1, @GretaFranzini#2 u.v.a.
Digital-Humanities-Kolloquium an der BBAW, 6.10.2017
Inspiriert vom Symposium DSEs as Interfaces (Graz 16), #DH2017, esp. @eerstewart1, @GretaFranzini #1, @GretaFranzini#2 u.v.a.
NB zum erwähnten u. vielen anderen Negativbeispielen:
Der fehlende Zugang zu den Grunddaten bzw. deren ständiger Verlust hat keine technischen Ursachen.
Es handelt sich v.a. um ein sozialisatorisches
(und auch förderpolitisches) Problem.
Digital-Humanities-Kolloquium an der BBAW, 6.10.2017
Digital-Humanities-Kolloquium an der BBAW, 6.10.2017
Digital-Humanities-Kolloquium an der BBAW, 6.10.2017
Digital-Humanities-Kolloquium an der BBAW, 6.10.2017
nichts […] widerwärtiger, als publicirt
zu sehen, was ein Gemisch von Gehörtem
und Selbstzugesetztem ist.“
(A.v.H an R. Zeune, Berlin, 16.2.1857)
Anonym (Hrsg.) 1934
Hamel/Tiemann (Hrsg.) 1993 [2. A. 2004]
... ein Meilenstein der
Wissenschaftspopularisierung
(Hamel/Tiemann 1993)
(c) Schiller-Nationalmuseum, Marbach
Bei freier Rede habe ich [...]
nichts über meine Vorträge schriftlich aufgezeichnet
(A.v.H in der 'Vorrede' zum Kosmos, Bd. 1, S. X.)
SBB-PK, Nachl. A.v.H., diverse Fragmente des Manuskripts bzw. Materialien zu Humboldts Vorträgen
≈ 3600 Seiten,
≈ 4,5M Zeichen,
≈ 660K Tokens,
≈ 103K Types.
≈ 3600 Seiten,
≈ 4,5M Zeichen,
≈ 660K Tokens,
≈ 103K Types.
Projekt- Förderung |
Texterfassung und -anntoation | Publikation und ling. Erschließg. | Nachhaltigkeit & Dissemination |
---|
Texterfassung und -anntoation | Publikation und ling. Erschließg. |
---|
“The TEI-C is… a consortium which collectively develops and maintains
a standard for the representation of texts in digital form.” (http://www.tei-c.org/)
TEI-C = Herausgeber der TEI Guidelines:
Cf. Haaf/Thomas 2017, https://jtei.revues.org/1650
<!-- […] -->
<pb facs="#f0007" n="2r"/>
<!-- […] -->
<div n="1">
<head>Physikalische Geographie bei <persName resp="#CT" ref="http://d-nb.info/gnd/118554700">A. v. Humboldt</persName>.</head><lb/>
<milestone rendition="#hr" unit="section"/><lb/>
<div type="session" n="1">
<head type="rightMargin">
<!-- […] --><hi rendition="#b">1.</hi><space dim="horizontal"/> 3. <choice><abbr>Nov.</abbr><!-- […] -->
</head><lb/>
<p>Als Einleitung in die <choice><abbr>physik.</abbr><expan resp="#CT">physikalische</expan></choice>
<choice><abbr>Geogr.</abbr><expan resp="#CT">Geographie</expan></choice> gebe ich eine Übersicht<lb/>
der Zustände im allgemeinen, in welchen die Materie uns<lb/>
im Weltraume erscheint, und fange daher mit denjenigen<lb/>
Körpern an<del rendition="#s">,</del> welche in der Lichtbildung begriffen scheinen.<lb/>
<!-- […] -->
</p><lb/>
<!-- […] -->
Beispiel: Bleistift-Gebrauch in parthey_msgermqu1711_1828 (XML)
Beispiel: Bleistift-Gebrauch in parthey_msgermqu1711_1828 (XML)
Beispiel: Bleistift-Gebrauch in parthey_msgermqu1711_1828 (XML)
> Mehrzahl im Abschnitt Geographie des Organischen
<item>3, die <hi rendition="#u">englischen</hi> Messungen unter dem
General <persName resp="#CT" ref="http://d-nb.info/gnd/130800600">
R.<metamark><space dim="horizontal"/></metamark></persName>
<metamark>(?)</metamark> und
<persName resp="#CT" ref="http://d-nb.info/gnd/1055317457">M<metamark>....</metamark></persName>
<add place="right"><metamark>?</metamark></add><lb/>
<!-- [...] --> <item>4, Drei grosse Messungen in <hi rendition="#u">Ostindien</hi> von dem
General <persName resp="#CT" ref="http://d-nb.info/gnd/117574406">
L<metamark><space dim="horizontal"/></metamark></persName>
<metamark>?</metamark><lb/>
und <persName>T<metamark><space dim="horizontal"/></metamark></persName> <metamark>?</metamark></item><lb/>
<choice><abbr>Rſe</abbr><expan resp="#SB">Reiſe</expan></choice> <choice><abbr>ds</abbr><expan resp="#SB">des</expan></choice>
<hi rendition="#aq">
<persName resp="#SB" ref="http://d-nb.info/gnd/100648282">
Kuki</persName></hi><lb/>
Personenregister: Nutzungsmöglichkeiten und Anschlussfragen
Text-Bild-Ansicht:
dies fand
<subst>
<del rendition="#s" hand="#pencil">
<subst>
<del rendition="#ow">
<supplied reason="covered" cert="high" resp="#CT">ich</supplied>
</del>
<add place="across" hand="#ink2">
<persName ref="http://d-nb.info/gnd/118554700">Humbold</persName></hi>
</add>
</subst>
</del>
<add place="superlinear" hand="#pencil">ich</add>
</subst> auf dem Chimboraßo,
<!-- Beispiel vereinfacht: <hi> entfernt, cf. http://www.deutschestextarchiv.de/nn_msgermqu2345_1827/17 -->
Abriſſe liefern
<subst>
<del rendition="#ow">w<unclear reason="covered" cert="low" resp="#BF">ü</unclear></del>
<add place="across">dü</add>
</subst>r
<subst>
<del rendition="#ow"><unclear reason="covered" cert="low" resp="#CT">de</unclear></del>
<add place="across">fte</add>
</subst>, welches<lb/>
HTML
TEXT
Abriſſe liefern
<subst>
<del rendition="#ow">w<unclear reason="covered" cert="low" resp="#BF">ü</unclear></del>
<add place="across">dü</add>
</subst>r
<subst>
<del rendition="#ow"><unclear reason="covered" cert="low" resp="#CT">de</unclear></del>
<add place="across">fte</add>
</subst>, welches<lb/>
<TextCorpus>
<tokens>
<!--[...]-->
<token ID="w14c">Abriſſe</token>
<token ID="w14d">liefern</token>
<token ID="w14e">dürfte</token>
<token ID="w14f">,</token>
<token ID="w150">welches</token>
<!--[...]-->
</tokens>
<sentences>
<sentence ID="sc" tokenIDs="<!--[...]--> w14c w14d w14e w14f w150 <!--[...]-->"/>
</sentences>
<lemmas>
<!--[...]-->
<lemma tokenIDs="w14c">Abriß</lemma>
<lemma tokenIDs="w14d">liefern</lemma>
<lemma tokenIDs="w14e">dürfen</lemma>
<lemma tokenIDs="w14f">,</lemma>
<lemma tokenIDs="w150">welches</lemma>
<!--[...]-->
</lemmas>
<POStags>
<!--[...]-->
<tag tokenIDs="w14c">NN</tag>
<tag tokenIDs="w14d">VVINF</tag>
<tag tokenIDs="w14e">VMFIN</tag>
<tag tokenIDs="w14f">$,</tag>
<tag tokenIDs="w150">PWS</tag>
<!--[...]-->
</POStags>
<orthography>
<!--[...]-->
<correction tokenIDs="w14c" operation="replace">Abrisse</correction>
<!--[...]-->
</orthography>
</TextCorpus>
TCF
<choice>
<orig>Abriſſe</orig>
<reg resp="#cab">Abrisse</reg>
</choice> liefern
<choice>
<orig>
<subst>
<del rendition="#ow">w<unclear reason="covered" cert="low" resp="#BF">ü</unclear></del>
<add place="across">dü</add>
</subst>r
<subst>
<del rendition="#ow"><unclear reason="covered" cert="low" resp="#CT">de</unclear></del>
<add place="across">fte</add>
</subst>
</orig>
<reg resp="#cab">dürfte</reg>
</choice>, welches<lb/>
DTA-'norm.xml'
Abriſſe liefern
<subst>
<del rendition="#ow">w<unclear reason="covered" cert="low" resp="#BF">ü</unclear></del>
<add place="across">dü</add>
</subst>r
<subst>
<del rendition="#ow"><unclear reason="covered" cert="low" resp="#CT">de</unclear></del>
<add place="across">fte</add>
</subst>, welches<lb/>
DDC-Suche mit GermaNet-Erweiterung, Synset "Grundstoff; Urstoff"
Digital-Humanities-Kolloquium an der BBAW, 6.10.2017
Digital-Humanities-Kolloquium an der BBAW, 6.10.2017
John Unsworth: "Scholarly Primitives: what methods do humanities researchers have in common, and how might our tools reflect this?", [J. Unsworth' Blog], 2000 cf. http://www.people.virginia.edu/~jmu2m/Kings.5-00/primitives.html.
Patrick Sahle: Digitale Editionsformen. Zum Umgang mit der Überlieferung unter den Bedingungen des Medienwandels, 3 Bände, Norderstedt: Books on Demand 2013.
Ted Underwood: "It looks like you’re writing an argument against data in literary study …" In: The Stone and the Shell, 21. Sept. 2017.
Ders.: A Genealogy of Distant Reading. In: DHq, 11, 2 (2017).