Una introducción al entorno de BIBFRAME:

Un marco de datos enlazados para las bibliotecas

Network of interconnected nodes and lines on a gradient background that transitions from a warm golden hue at the bottom to a clear blue at the top. The nodes vary in size and are connected by thin lines, creating a web-like structure. Some nodes appear as filled circles while others are outlined, and the density of the network varies across the image, with some areas more clustered and others more sparse.

Taller práctico

21 a 25 de octubre de 2024 

 

XXXVI Semana de la Facultad de Ciencias de la Información

Universidad Autónoma de San Luis Potosí

 

Mtro. Timothy A. Thompson 

Mtra. Irmarie Fraticelli-Rodríguez 

Yale University Library 

Equipo de Servicios de Metadatos 

Irma Fraticelli

Analista de Metadatos

irma.fraticelli@yale.edu

www.linkedin.com/in/irmarie-fraticelli

Tim Thompson

Bibliotecario para la Investigación Aplicada de Metadatos

timothy.thompson@yale.edu

www.linkedin.com/in/timathompson

@timathom@indieweb.social

Día 1: Introducción a la Web Semántica y los Datos Abiertos Enlazados

Lección 2: Introducción al Marco de Descripción de Recursos (RDF)

Las 5 Estrellas de los Datos Abiertos Enlazados

Tim Berners-Lee, creador de la Web, propuso un sistema de clasificación para evaluar la calidad y accesibilidad de los datos en la web:

Valor Criterio
Datos disponibles en la web en cualquier formato.
⭐⭐ Datos como estructuras legibles por máquinas.
⭐⭐⭐ Datos en formato abierto y no propietario.
⭐⭐⭐⭐ Datos que siguen los estándares abiertos del W3C.
⭐⭐⭐⭐⭐ Todos los criterios anteriores más enlaces a otros Datos Abiertos Enlazados.

Estándares de los Datos Enlazados

Los datos abiertos enlazados se fundamentan en estándares del World Wide Web Consortium (W3C), incluyendo:

RDF: El Modelo de Datos

El Marco de descripción de recursos (RDF) es un modelo simple cuya estructura básica es una declaración de tres partes, o tripleta.

Consiste en una relación entre sujeto y objeto, definida por un predicado.

  • Un recurso es cualquier cosa sobre la que queremos decir algo.

  • Para hacer declaraciones sobre recursos, necesitamos identificarlos.

  • Un recurso se identifican mediante un identificador uniforme de recursos (URI).

Por ejemplo, en una declaración como "Julio Cortázar es el autor del libro Bestiario", tenemos:

El recurso o entidad que se describe.

1

Sujeto

La propiedad o atributo del sujeto.

2

Predicado

El valor de la propiedad o el recurso relacionado.

3

Objeto

 "Julio Cortázar"

"es el autor del"

"libro Bestiario"

Todos estos componentes tienen un URI (Identificador Uniforme de Recursos)

Identifica, sujeto, predicado y objeto en la siguiente declaración:

"Bestiario se publicó por la editorial Sudamericana"

El recurso o entidad que se describe.

1

Sujeto

La propiedad o atributo del sujeto.

2

Predicado

El valor de la propiedad o el recurso relacionado.

3

Objeto

Ahora te toca a ti,

Todos estos componentes tienen un URI (Identificador Uniforme de Recursos)

RDF también es un grafo

  • En un grafo RDF, cada nodo (sujeto u objeto) es un recurso sobre el que podemos decir cosas (hacer declaraciones).

 

  • Los bordes o aristas en el grafo también son recursos, pero en la práctica no podemos realmente decir cosas sobre ellos.

RDF es un grafo de conocimiento

Al interconectar declaraciones, RDF conforma un grafo de conocimiento, proporcionando una estructura rica para representar relaciones complejas entre datos.

  • Este grafo representa dos series televisivas donde Guillermo del Toro participó.

 

  • Los predicados (bordes o aristas) provienen del vocabulario Schema.org.

Los datos para crear el grafo fueron extraídos de Wikipedia.

En un grafo RDF, cada nodo (sujeto u objeto) es un recurso sobre el que podemos decir cosas.

Las aristas en el grafo también son recursos, pero en la práctica no podemos realmente decir cosas sobre ellas directamente.

Avances en RDF

  • Actualmente se está trabajando en la actualización de las especificaciones de RDF de la versión 1.1 a 1.2.
  • La nueva versión incluirá soporte para lo que se conoce como RDF-Star, que definirá un modelo y una sintaxis para hacer declaraciones sobre una tripleta completo en lugar de solo un sujeto.

RDF y Datos Enlazados

  • En los datos enlazados, identificamos recursos en la web utilizando la tecnología que hace funcionar la web en sí misma: el Protocolo de Transferencia de Hipertexto (HTTP/S).
  • Al identificar recursos con URIs HTTP (que también pueden ser URLs), podemos publicar, interconectar y compartir datos en la web.

La dirección https://dle.rae.es/dato identifica un recurso, que también podríamos llamar una entidad.

RDF y Datos Enlazados

Explorando Entidades con RDF

Al usar RDF, podemos describir entidades, sus propiedades o atributos y sus relaciones con otras entidades, promoviendo una web de datos interconectados.

Serializaciones de RDF

  • ¿Cómo se expresa realmente RDF?

  • Tenemos muchas opciones de formato, que se llaman serializaciones.

  • Uno de los más comunes es JSON-LD.

  • Existen otras maneras de serializar RDF, como el formato que se llama "Turtle".

Ejemplo de JSON-LD

[
  {"@context": "http://schema.org/"},
  {
    "@type": [
      "DefinedTermSet",
      "Book"
    ],
    "@id": "https://dle.rae.es/",
    "name": "Diccionario de la lengua española RAE - ASALE",
    "image": "https://dle.rae.es/app/doc/es/img/dle.jpg",
    "description": "Versión electrónica 23.6 del «Diccionario de la lengua española», obra lexicográfica académica pozr excelencia."
  },
  {
    "@type": "DefinedTerm",
    "@id": "https://dle.rae.es/dato",
    "name": "dato",
    "description": "1. m. Información sobre algo concreto que permite su conocimiento exacto o sirve para deducir las consecuencias derivadas de un hecho. A este problema le faltan datos numéricos.",
    "inDefinedTermSet": "https://dle.rae.es/"
  }
]

El JSON-LD incrustado en la página del Diccionario de la lengua española ilustra cómo se pueden representar y relacionar los datos en la web.

Vocabularios y Espacios de Nombres

  • Cuando hablamos de la publicación de datos en RDF, otro concepto relevante es el de espacio de nombres (namespace).
  • Cada vocabulario de datos enlazados debe estar alojado en un dominio web y utilizar esta ubicación para identificar sus términos.
  • Para no escribir siempre la dirección completa, definimos prefijos que representan la parte repetida de una dirección.

¡Muchas Gracias!

¿Preguntas?