Prosjekter ved UB-Digital utvikling

IT-lunsj – 06. april 2018

Hvorfor "Digital utvikling" på biblioteket?

Bakgrunn ved UB

  • Ikke felles system for Spesialsamlingen ved UB, Access-base for Billedsamlingen som måtte byttes ut (ca. 2011)
  • Behov for å bygge opp UBs rolle som felles infrastruktur for vitenskapelig oppbygde og forskningsrelevante elektroniske fulltekstarkiv ved UiB
    • Clarino, Wittgenstein-arkivet, Holbergsskrifter
  • Mange tunge formidlingsprosjekt uten kobling til data/ressursene de var basert på

Behov

  • Fellesløsninger
  • Kunne håndtere ulike kildedata, (u)strukturert tekst, regneark m.m.
  • Fra samlingsnivå til enkeltblad (nå enkeltord)
  • Samle fysiskt oppsplittede samlinger og arkiv digitalt
  • Datadrevet formidling

Få gode system,

mange, mange standarder

  • Vi ville bruke tiden på å finne én standard disse standardene kunne leve sammen i...
    • Fokusere på data, ikke applikasjon
  • RDF (Resource Description Framework), Linked data og semantisk teknologi muliggjør dette

Linked data

  1. Bruk URIer for å identifisere ting.
  2. Bruk HTTP URIer for ting slik at man kan lage relasjoner og slå opp informasjon.
  3. Tilby maskinlesbar informasjon om tingen når  URI kalles. Informasjonen skal tilbys i et standardisert format som RDF.
  4. Inkluder lenker til relaterte ting i den data som tilbys

<http://data.no/Tarje> <http://schema.no/deltokPå> <http://data.no/it-lunsj-april-18>

Konsept

Ord

Aktør

Konsept

Objekt

Aktør

Konsept

Arkiv

Aktør

Ontolex/MMoOn

CIDOC-CRM

Records in Context

Konsept

Objekt

Aktør

Bibframe

Erfaringer med Marcus

  • RDF er fantastisk til å slå sammen data fra mange kilder
  • Alt henger sammen med alt!
  • {insert hype tech} løser ikke alt, bruk heller alle sammen!
  • Det tar ikke lang tid å pådra seg teknisk gjeld...
  • UB har kompetansen fagmiljøene etterspør
    • utvikling, drift, data-konvertering og -modellering

Grieg Research Guide (GRG)

Nasjonalbibliotek-prosjekt med Senter for Griegforskning og Bergen offentlige bibliotek, 2017

Prosjektleder Kirstine Folmann

Utvikler Simon Mitternacht

  • Forsker-initiert som et resultat av et behov for å samle ressurser om Edvard Grieg på et sted
  • Kommentert vitenskapelig bibliografi over litteratur og forskning av Grieg's liv og kunst
  • Komplett verkfortegnelse og relasjoner mellom verk, referanser, personer m.m.

https://gitlab.com/ubbdev/grg-api

https://gitlab.com/ubbdev/grg-frontend

https://gitlab.com/ubbdev/grg-docker

LoopBack

Node

REST API

MongoDB

ORIA

(bibliotek-katalogen)

Frontend

(Angular)

Dataporten

MerMEId

(Verkskatalog)

ZOTERO

(bibliografien)

Marcus

SDK

Erfaringer fra GRG

  • Angular er knall
  • LoopBack er "opinionated", greit nok,
    men nå har vi dannet våre egne meninger
  • Dataporten fungerer veldig bra
  • Flere fagmiljø vil ha oss med på lignende prosjekter, nå har vi løsningen før de spør!
  • I praksis ble MongoDB mer som en relasjonsdatabase, vi vil heller jobbe med RDF på backend

PhD-portalen

Nasjonalbibliotek-prosjekt fra 2015

Prosjektleder Ingrid Cutler

Utvikler Simon Mitternacht

  • Effektivisere en arbeidskrevende, manuell og ineffektiv arbeidsprosess
  • Ny leverandør av trykkeritjenester (Skipnes)
  • Ny pliktavleveringslov som krever avlevering av filer
  • UiBs Digitaliseringsstrategi

BYOTh

Bring Your Own Thesis

også kjent som "PhD-portalen"

https://gitlab.com/ubbdev/byoth

  • Angular CLI frontend
  • Express API (Node.js) foran et SPARQL Endpoint (Fuseki)
    • Lagrer avhandlinger som egne grafer i SPARQL endpointet
  • Express API håndterer grafene og autentisering (Dataporten)
  • Typescript på klient og server

Express

Node

REST API

Triplestore

Redis

Fillager

Trykkeri

(Skipnes)

Nasjonal-biblioteket

Frontend

(Angular)

Crossref API

Cristin API

UiB Åpne data

Dataporten

ORCID

Besvarelses-repo

BORA

uib.no

(pressemld.)

Erfaringer med BYOTh

  • Lag akronymet først!
  • Kanskje ikke 100% testdrevet, men "full coverage" på "unit test" på server
  • Samme javascript-kode på klient og server fungerer veldig fint
  • RDF som JSON(-ld) bygger en bro mellom "moderne webutvikling" og semantiske datamodeller
    • vi ser for oss en SDK/scaffolder basert på semantiske datamodeller
  • CI/CD på UH-IaaS er målet (ikke bare for BYOTh)
  • UiB trenger tjenester som løser "små" oppgaver for mange aktører, f.eks. Besvarelsesrepo

Semantisk infrastruktur

  • Remodellere Marcus sin datamodell
    • Nå CIDOC-CRM basert!
  • Dockerize hele utviklingsmiljøet
    • "docker-compose up" :-)
  • Redesign av marcus.uib.no
  • Nye datasett fra HF (Målføresamlinga og Fragment)

Veien videre

Express

Triplestore

Frontend

(Angular)

IT-lunsj 6. april 2018

By Tarje Lavik

IT-lunsj 6. april 2018

  • 454