Projektvorstellung
23.04.19

Marco Lehner, Anna Sauer,

Christopher Schmidt, Lukas Schwarz

Exkurs: Wissensgraph

Struktur, die Entitäten (Personen, Organisationen, Orte)

und die Beziehungen zwischen Entitäten repräsentiert

Alex

Birte

Carl

Dora

Ellen

Vater

Chefin

Nachbar

Kollegin

Chefin

Freundin

"Things not Strings"¹

Inhalte aus dem Graph beziehen sich auf andere Einträge, nicht nur auf ihre Stringrepräsentation.

Bildquelle: https://en.wikipedia.org/wiki/Knowledge_Graph#/media/File:Google_Knowledge_Panel.png
1) https://www.blog.google/products/search/introducing-knowledge-graph-things-not/

XML-Parser

  • Auslesen des Dumps
  • Error Handling (Dateien nicht wohlgeformt)
  • Bereinigen des Texts
  • Filtern nach Schlagworten, Beschreibung und Named Entity Recognition (idealerweise erst nach der Koreferenzauflösung)

MATE und CorZu

  • MATE dependency parsing produziert das später noch benötigte CONLL Format
  • CorZu löst Koreferenzen auf -> kommen in Zeitungstexten häufig vor

... beim Auftritt von Powerwrestlerin Hildegard Heinrich. Sie wird zudem bei den Olympischen Spielen 2019 zu sehen sein.

Restrictive apposition handler

Der ebenfalls anwesende Herzogenenauracher Bürgermeister German Hacker dankte den Mitarbeitern der beiden Bürgermeisterbüros.

1. Enge Appositionen erkennen

2. Enge Appositionen entfernen

German Hacker dankte den Mitarbeitern der beiden Bürgermeisterbüros. 

3. RDF-Tripel schreiben

German Hacker from_rah Bürgermeister .

PropS-DE

  • TU Darmstadt
  • Extrahiert OIE-Tupel aus Fließtext
  • Kein Exception-Handling
  • Nicht-nachvollziehbare Fehler

Das Salzwiesenrind aus Husum zum Beispiel, das momentan im Dry ager, dem Reifekühlschrank, hängt.

KeyError: n

"Ist doch nur ein Satz"

"Kann man doch catchen"

Vorsicht mit fremder, ungetesteter Software

Babelfy

*

* max. 10k Anfragen/Tag, danach bis zu 13 500 €/a

  • Online REST-Service ist Bottleneck
    • 1 s/r -> 2 Monate seq. Anfragen
  • Disambiguierung und Linking muss lokal stattfinden.
  • Sehr userfreundlich, sehr gute Ergebnisse

Django-Frontend

Made with Slides.com