Una introducción al entorno de BIBFRAME:

Un marco de datos enlazados para las bibliotecas

Network of interconnected nodes and lines on a gradient background that transitions from a warm golden hue at the bottom to a clear blue at the top. The nodes vary in size and are connected by thin lines, creating a web-like structure. Some nodes appear as filled circles while others are outlined, and the density of the network varies across the image, with some areas more clustered and others more sparse.

Taller práctico

21 a 25 de octubre de 2024 

 

XXXVI Semana de la Facultad de Ciencias de la Información

Universidad Autónoma de San Luis Potosí

 

Mtro. Timothy A. Thompson 

Mtra. Irmarie Fraticelli-Rodríguez 

Yale University Library 

Equipo de Servicios de Metadatos 

Irma Fraticelli

Analista de Metadatos

irma.fraticelli@yale.edu

www.linkedin.com/in/irmarie-fraticelli

Tim Thompson

Bibliotecario para la Investigación Aplicada de Metadatos

timothy.thompson@yale.edu

www.linkedin.com/in/timathompson

@timathom@indieweb.social

Día 1: Introducción a la Web Semántica y los Datos Abiertos Enlazados

Lección 3: Ontologías

En el ámbito de la informática, una ontología se define como:

Una definición formal de tipos, propiedades y relaciones entre entidades que existen realmente o fundamentalmente dentro de un dominio particular de discurso. (Wikipedia)

  • Una ontología es un modelo de la realidad expresado como una especificación formal de clases, propiedades e individuos.
  • Es un esquema semántico que documenta el significado de nuestros datos.

¿Qué es una ontología?

Ontologías y Vocabularios Controlados

Una ontología permite definir un modelo de datos, el cual:

Permite describir los elementos de la realidad que intervienen en un problema dado y la forma en que se relacionan esos elementos entre sí. (Wikipedia)

  • Puede ser compleja
  • Representa una visión de mundo
  • Se enfoca en relaciones semánticas

Ontología

Vocabulario Controlado

  • Más sencillo
  • Define una lista de conceptos
  • Se enfoca en relaciones jerárquicas (más general, más específico)

Sin embargo, se puede crear vocabularios controlados usando los estándares de RDF.

El estándar Sistema Simple de Organización del Conocimiento (SKOS, por sus siglas en inglés) se creó para proyectar tesauros y vocabularios controlados en RDF. 

Esquema RDF

  • RDF incluye una extensión de esquema centrada en sentar las bases para el desarrollo de ontologías y modelado de datos semánticos, RDF Schema (RDFS).

  • Define conceptos de modelado como:

    • Clase (y Subclase) 

    • Literal

    • Propiedad (y Subpropiedad)

    • Dominio

    • Rango

Esquema RDF

  • RDF incluye una extensión de esquema centrada en sentar las bases para el desarrollo de ontologías y modelado de datos semánticos, RDF Schema (RDFS).

  • Define conceptos de modelado como:

    • Clase (y Subclase) 

    • Literal

    • Propiedad (y Subpropiedad)

    • Dominio

    • Rango

Con RDFS, podemos comenzar a definir jerarquías de clases y propiedades.

El Lenguaje de Ontología Web (OWL) se basa en estas características básicas y agrega muchas otras funcionalidades avanzadas.

Clases

Según las normas del W3C:

Una clase se define como un grupo de individuos que [. . .] comparten ciertas propiedades. Por ejemplo, Deborah y Frank son miembros de la clase Persona. Las clases pueden organizarse en jerarquías de especialización. (W3C)

Los nombres de las clases suelen escribirse con una letra en mayúscula (por ejemplo, Persona).

Ejemplos de Clases

  • Obra
  • Agente
  • Contribución
  • Ítem (Ejemplar)
  • Rol
  • Sello

¿Subclases?

Propiedades

Según el W3C:

Las propiedades se pueden usar para establecer relaciones entre individuos o entre individuos y valores de datos literales. (W3C)

Las propiedades generalmente se escriben con una letra minúscula, o utilizando "camel case" (por ejemplo, fechaDeNacimiento).

imagen vía Wikimedia Commons

Ejemplos de Propiedades

  • agente
  • nombre
  • tieneItem
  • fecha
  • rol
  • marcadoPor

¿Subpropiedades?

Individuos

Los individuos son los miembros de una clase.

Por ejemplo, un individuo llamado Deborah puede ser descrito como miembro de la clase Persona, y la propiedad tieneEmpleador puede ser utilizada para relacionarla con el individuo StanfordUniversity. (W3C)

Clase

Individuo

Dominio y Rango

El dominio y el rango de una propiedad también pueden ser definidos.

Un dominio de propiedad limita a los individuos a los que se puede aplicar la propiedad. El rango de una propiedad limita a los individuos que puede tomar como su objeto. (W3C)

Dominio

Rango

Propiedad

Ejemplos de Dominio y Rango

Dominio Propiedad Rango
Contribución rol Agente
- Reunión
- Familia
- Jurisdicción
- Organización
- Persona
[Ninguno] fecha Literal

Ontologías y Hojas de Cálculo

  • Los datos tabulares, como los que encontramos en hojas de cálculo, no se documentan por sí solos.
  • Podemos hacer suposiciones sobre el significado de columnas y campos, pero sin un esquema semántico, no podemos estar seguros de que nuestra interpretación sea correcta.

Identificador

Nombre

Usuario

Institución

Ubicación

Ejemplo inspirado en Linked Data: Structured Data on the Web (Wood et al., 2013).

Objeto

Predicado

Sujeto

Clase : Persona

Clase : Grupo

Clase : Grupo

Valor Literal

trabaja para

nombre

Definiciones

  • Una buena ontología depende de definiciones coherentes y bien estructuradas. 
  • Por ello, podemos utilizar el patrón género, especie, diferencia.
  • El ser humano es un animal que es racional.
  • El corazón es un órgano con partes organísticas cavitadas, que es continuo con los árboles arteriales y venosos sistémicos y pulmonares.

Género

Especie

Diferencia

Diseño de Ontologías

Uno de los primeros pasos para crear una ontología es desarrollar un conjunto de preguntas de competencia.

  • Estas son preguntas que sirven para definir el alcance de una ontología y probar su utilidad más adelante.
  • Basándonos en estas preguntas, podemos comenzar a construir un modelo de datos, definiendo clases, propiedades e individuos.

Diseño de Ontologías

Por ejemplo, en una ontología sobre comida y vino, podríamos hacer preguntas de competencia como estas:

  • ¿Qué características del vino debo considerar al elegir un vino?

  • ¿El vino de Burdeos es tinto o blanco?

  • ¿El Cabernet Sauvignon va bien con mariscos?

  • ¿Cuál es la mejor elección de vino para la carne a la parrilla?

  • ¿Qué características de un vino afectan a su idoneidad para un plato?

  • ¿Cambia el cuerpo de un vino específico según el año de cosecha?

  • ¿Cuáles fueron las buenas añadas para el Zinfandel de Napa? (Ontología 101)

Actividad: Preguntas de Competencia

  1. Imagina que eres un usuario de la biblioteca haciendo una investigación para un curso de literatura.

  2. Piensa en las diferentes tareas de recuperación de información que te gustaría realizar utilizando el catálogo de la biblioteca.

  3. ¿Qué tipos de preguntas te gustaría hacer?

  4. Desarrolla un conjunto de preguntas de competencia para una ontología sobre recursos de información bibliotecaria.

  5. Escribe cada pregunta en una nota Post-it.

Reglas para un Catálogo Diccionario

por Charles A. Cutter, 1876

  1. Permitir que una persona encuentre un libro del cual se conozca:
    • el autor,
    • el título,
    • el tema.
  2. Mostrar lo que tiene la biblioteca:
    • ​​por un autor determinado,
    • sobre un tema determinado,
    • en un tipo específico de literatura.
  3. Ayudar en la elección de un libro:
    • respecto a su edición (bibliográficamente),
    • respecto a su carácter (literario o temático).

Discusión

  • Desde la década de 1960, los formatos MARC 21 han servido como la lingua franca de las bibliotecas.
  • ¿Existe un modelo de datos subyacente en los formatos MARC 21 (datos bibliográficos, de autoridad, y de fondos)?
  • ¿Cuáles son las entidades y relaciones presentes en un registro bibliográfico?
  • ¿Cumplen nuestros catálogos actuales con las necesidades de sus usuarios?
  • ¿En qué aspectos son exitosos y en cuáles se quedan cortos?

Actividad: Desmontando un Registro MARC 21

Utilicemos las preguntas de competencia de la actividad anterior como fuente terminológica para comenzar a especificar términos en nuestra ontología.

  1. Verás una serie de tarjetas numeradas con información extraída de un registro bibliográfico MARC 21 para la novela corta El principito.

  2. Las tarjetas están en el orden en el que aparecen en el registro. Cuando una tarjeta tiene números decimales, significa que los elementos de datos provienen del mismo campo.

  3. Usando los números, agrupa las cartas en categorías.

  4. Intenta identificar los tipos de entidades que están representadas.

  5. Una vez que identifiques un grupo, dale un nombre y anota los criterios utilizados para crearlo.

  6. Por ejemplo, "Nueva York" es un tipo de Lugar (o Ciudad, o Lugar Poblado, que son tipos específicos de Lugar).

Actividad: Desmontando un Registro MARC 21

  1. Ahora revisan la versión etiquetada de las mismas tarjetas.

  2. ¿Hay algo más que te llame la atención?

Actividad: Desmontando un Registro MARC 21

¡Muchas Gracias!

¿Preguntas?

Una introducción al entorno de BIBFRAME: Un marco de datos enlazados para las bibliotecas: Día 1, Lección 3

By Tim Thompson

Una introducción al entorno de BIBFRAME: Un marco de datos enlazados para las bibliotecas: Día 1, Lección 3

  • 50