Loading

OpenRefine: zum Bereinigen von messy-Data, big & small

gittaca

This is a live streamed presentation. You will automatically follow the presenter and see the slide they're currently on.

OpenRefine

Bereinigen von messy-Data, big & small

2013: OpenRefine
2010: Google Refine
2009: Freebase Gridworks

(Metaweb)

Funktionen / Agenda

  • viele Datenformate importierbar (CSV, JSON, DBs, etc.)
  • Facetten: Datensatz erkunden & Fehler korrigieren
  • Clustering: subtile Diskrepanzen eliminieren
  • Transformationen: Python & Co.
  • Daten via externe Quellen anreichern
  • Workflow- & Datenexport

 

Facetten: Daten erkunden & Fehler korrigieren

Clustering: subtile Diskrepanzen eliminieren

Transformationen:
Python & Co.

Daten via externe Quellen anreichern

Workflow- & Datenexport

Funktionen / Agenda

  • viele Datenformate importierbar (CSV, JSON, DBs, etc.)
  • Facetten: Datensatz erkunden & Fehler korrigieren
  • Clustering: subtile Diskrepanzen eliminieren
  • Transformationen: Python & Co.
  • Daten via externe Quellen anreichern
  • Workflow- & Datenexport
  • mehr auf OpenRefine.org (Extensions, Clients, Distros)

Weitere Ressourcen