Haciendo los datos abiertos enlazados más utilizables para iluminar

las colecciones de Yale University

Espécimen pequeño y delicado de Lepidozia chordulifera, sobre un fondo blanco uniforme. Al lado del espécimen hay una regla que proporciona una escala en centímetros, lo que indica que el objeto tiene aproximadamente dos centímetros de longitud, lo que ayuda a contextualizar el tamaño del espécimen para el espectador.
Meme de un chihuahua bostezando.

Tim Thompson

Bibliotecario para la Investigación de Metadatos Aplicados

Biblioteca de la Universidad de Yale

timothy.thompson@yale.edu

www.linkedin.com/in/timathompson

@timathom@indieweb.social

 

1er Seminario Internacional de Bibframe:

Redefiniendo el ADN de las bibliotecas

10 de enero 2024

Atribución

Licencia
Esta presentación se encuentra bajo una licencia Creative Commons Atribución 4.0 Internacional (CC-BY).
Reconocimiento
  • Incluye contenido creado orginalmente por Robert Sanderson, Director Senior de Patrimonio Cultural Digital en Yale.
  • El contenido se utilizó bajo los términos de la misma licencia (CC-BY).
Fuentes
Insignia que representa la licencia Creative Commons Atribución 4.0 Internacional (CC-BY).

Esquema de la presentación

Trasfondo
Un poco de historia para explicar el contexto institucional de Yale.
Marcos de metadatos
El enfoque que adoptamos para implementar los datos abiertos enlazados.
La plataforma LUX
  • ¿Cómo funciona?
  • Demostración del sistema.

Trasfondo

¿Qué son los Datos Enlazados?

Metodología que se basa en el modelo RDF y utiliza la estructura de la web para conectar recursos informativos, los cuales se definen semánticamente según su tipo y las relaciones existentes entre ellos.

Ejemplo inspirado en Linked Data: Structured Data on the Web (Wood et al., 2013).

Hoja de cálculo de Excel mostrando una lista de veinte participantes ficticios de un taller (los datos fueron generados por ChatGPT 4.0). La hoja de cálculo tiene cinco columnas: ID, Nombre, Usuario, Inst y Loc. Superpuesta sobre la hoja de cálculo hay una tabla con dos filas y tres columnas que ilustra un posible mapeo de la hoja de cálculo a tripletas semánticas. Cuatro flechas azules y gruesas apuntan desde diferentes partes de la hoja de cálculo a las celdas de la tabla. La primera flecha apunta desde una celda en la columna ID a una celda en la tabla que representa un IRI para una persona. La segunda apunta desde el encabezado Inst a una celda que contiene el IRI para la propiedad works for de Schema.org. La tercera apunta desde una celda en la columna Inst a una celda que representa un IRI para un grupo. La cuarta apunta desde la misma celda en la hoja de cálculo a una celda en la tabla que contiene el valor de cadena Universidad de Chile.

Objeto

Predicado

Sujeto

Clase : Persona

Clase : Grupo

Clase : Grupo

Valor Literal

trabaja para

nombre

¿Por qué Datos Enlazados?

Existen dos razones fundamentales para la implementación de ese paradigma:

  1. Gestión de información. Permite organizar y compartir la información bibliográfica de una manera más precisa y eficaz.
  2. Descubrimiento de recursos. Facilita la búsqueda y el acceso a la información en el entorno digital, aprovechando un enfoque semántico para resaltar las relaciones entre los recursos.

Descubrimiento de recursos

  • En Yale, optamos por el segundo motivo, el descubrimiento.
  • En lugar de cambiar nuestros flujos de trabajo, elegimos comprobar primero el valor del enfoque para nuestros usuarios.

Colecciones en Yale

Interior del Yale Center for British Art, con una decoración minimalista y moderna. A la izquierda, se observan ventanas que dejan entrar luz natural y exhiben algunas obras de arte enmarcadas. En el centro y a la derecha, se destaca una pintura de un paisaje marino colgada en la pared, con colores oscuros que resaltan la dramática escena de nubes y cielo en una playa. El espacio es amplio y acogedor, con sofás marrones que invitan a los visitantes a detenerse y contemplar las obras. La arquitectura combina elementos de madera clara y detalles en concreto, creando una atmósfera de tranquilidad y reflexión.
Sala de la Yale University Art Gallery, bañada por la luz natural que se filtra a través de las ventanas altas. Se observan varias estatuas clásicas y bustos en pedestales, creando un ambiente tranquilo y contemplativo. Cada obra está acompañada por su propia etiqueta descriptiva, permitiendo a los visitantes aprender sobre su historia y significado. A la derecha, se ve una vitrina que alberga vasijas antiguas, destacadas por la luz que entra por la ventana y refleja sus detalles intrincados. La exposición combina elementos de la arquitectura clásica con una disposición moderna y accesible, invitando a la reflexión y al estudio de las piezas.
Cráneo fósil de un Tyrannosaurus rex en exhibición en el Yale Peabody Museum of Natural History. El fósil está bien preservado, destacando la formidable mandíbula y los afilados dientes del dinosaurio, aspectos que hacen alusión a su reputación como uno de los depredadores más poderosos de la era mesozoica. La iluminación y el ángulo de la foto enfatizan la textura y la forma del cráneo, proporcionando una vista detallada que invita a la contemplación y al estudio paleontológico.
Interior de la Beinecke Rare Book & Manuscript Library en la Universidad de Yale, en New Haven, Connecticut. Se aprecia una extensa colección de libros raros y manuscritos almacenados en estanterías de vidrio que alcanzan desde el suelo hasta el techo. La iluminación cálida destaca los lomos de los libros y crea un ambiente sereno. La estructura arquitectónica de la biblioteca, con paredes de mármol translúcido, permite que la luz natural se filtre suavemente en el espacio, protegiendo los valiosos materiales de la exposición directa a la luz. La biblioteca, conocida por su diseño único y sus impresionantes colecciones, es un punto de interés tanto para investigadores como para visitantes interesados en la historia del libro y la erudición.

Yale Center for British Art, Karl Thomas Moore, CC BY-SA 4.0, vía Wikimedia Commons

Beinecke Rare Book & Manuscript Library, Adam Jones, CC BY-SA 2.0, vía Wikimedia Commons

Yale Peabody Museum of Natural History, Gunnar Klack, CC BY-SA 4.0, vía Wikimedia Commons

Yale University Art Gallery, Ad Meskens, CC BY-SA 3.0, vía Wikimedia Commons

Línea de tiempo

2008
Se crea el Departamento para Recursos Digitales e Infraestructura.
2011
  • Se implementa una política de acceso abierto en Yale.
  • Se contrata una nueva Directora de Bibliotecas.
2012
Se elige un nuevo Presidente para la universidad.
Línea de tiempo que abarca desde el año 2008 hasta el 2012, con marcas que indican puntos específicos o eventos a lo largo de esos años. La línea tiene flechas en ambos extremos, lo que sugiere la continuidad más allá de los años indicados.
2015
La Directora de la Biblioteca es nombrada Vicerrectora Adjunta para Colecciones y Comunicación Académica.
Línea de tiempo que incluye el año 2015. La línea de tiempo tiene flechas en ambos extremos, lo que indica la continuidad antes y después de este período específico.
2017
  • Se contrata un nuevo Director de Informática para la universidad.
  • Se establece el pilar de Tecnología de la Información para el Patrimonio Cultural (CHIT) en los Servicios de Informática de Yale.
Línea de tiempo que incluye el año 2017. La línea de tiempo tiene flechas en ambos extremos, lo que indica la continuidad antes y después de este período específico.
2018
  • Formación de la Colaboración CHIT.
  • Convocatoria del Grupo de Trabajo de Descubrimiento Transversal de Colecciones (CCD) y del Grupo de Arquitectura de TI para el Patrimonio Cultural (CHITA).
Línea de tiempo que incluye el año 2018. La línea de tiempo tiene flechas en ambos extremos, lo que indica la continuidad antes y después de este período específico.
2018-2021
Se implementa el Marco Internacional de Interoperabilidad de Imágenes (IIIF) para los recursos digitales en Yale.
Línea de tiempo que abarca desde el año 2018 hasta el 2021, con marcas que indican puntos específicos o eventos a lo largo de esos años. La línea tiene flechas en ambos extremos, lo que sugiere la continuidad más allá de los años indicados.
2019
  • El proyecto de Descubrimiento Transversal de Colecciones empieza a definirse.
  • Se contrata a una Gerente de Proyectos.
  • Se realiza un taller con un grupo amplio de partes interesadas para definir los requisitos para una nueva plataforma de descubrimiento transversal.
  • Se elige el nombre LUX, o luz, para la plataforma.
Línea de tiempo que incluye el año 2019. La línea de tiempo tiene flechas en ambos extremos, lo que indica la continuidad antes y después de este período específico.
2020
  • Se crea un esquema unificado de metadatos.
  • Se instala un prototipo usando Blacklight y Apache Solr para hacer pruebas.
  • La Fundación Mellon concede una beca a Yale para apoyar la conciliación de metadatos y la colaboración entre bibliotecas y museos.
  • Rob Sanderson es contratado como Director de Metadatos para el Patrimonio Cultural.
Línea de tiempo que incluye el año 2020. La línea de tiempo tiene flechas en ambos extremos, lo que indica la continuidad antes y después de este período específico.
2021
  • Se lleva a cabo el proceso de selección del sistema de software que se usará para construir LUX.
  • Se elige el sistema MarkLogic para construir la plataforma.
Línea de tiempo que incluye el año 2021. La línea de tiempo tiene flechas en ambos extremos, lo que indica la continuidad antes y después de este período específico.
2021-2023
¡Construcción y lanzamiento de LUX!
Línea de tiempo que abarca desde el año 2021 hasta el 2023, con marcas que indican puntos específicos o eventos a lo largo de esos años. La línea tiene flechas en ambos extremos, lo que sugiere la continuidad más allá de los años indicados. Un ícono de cohete con llamas saliendo de su motor está situado al comienzo de la línea de tiempo, simbolizando un lanzamiento o inicio en el año 2023.

Objetivos de LUX: Descubrimiento Transverval de Colecciones en Yale

  • Revelar las colecciones de patrimonio cultural de la Universidad de Yale al mundo.
  • Proveer una puerta de acceso unificada a los fondos de los museos, archivos y bibliotecas de Yale.
  • Ampliar el acceso a los usuarios, brindándoles una nueva forma de interactuar con las colecciones físicas y digitales de Yale.
  • Descubrir conexiones entre recursos, invitando a los usuarios a iniciar una búsqueda más profunda en las colecciones.

Marcos de colaboración

Gráfico que representa la estructura organizativa de la actividades de TI para el Patrimonio Cultural, mostrando el Comité Directivo de TI para el Patrimonio Cultural en el centro. Alrededor de este núcleo, se organizan varios subgrupos y comités, incluyendo Proyectos, Comité de Conciencia y Responsabilidad, Grupo del Programa LUX (Descubrimiento Transversal de Colecciones), Grupo de Trabajo de Metadatos, Grupo de Trabajo de Derechos, Grupo Asesor de Búsqueda y Descubrimiento, y Grupo Asesor de Interfaz/Experiencia de Usuario. Cada uno de estos grupos está vinculado al comité central, reflejando la estructura colaborativa y multidisciplinaria de la organización.

¡Colaboración!

  • A lo largo del proyecto se colaboraron unas 100 personas en las unidades de informática y de patrimonio cultural de Yale.

Marcos de metadatos

Alineación transversal de colecciones

Tabla de configuración de metadatos con varias columnas tituladas Solr Grouping, Solr Nesting, Solr Multi, Vend Lowercase, Fieldname y Field Control. Los datos presentados se relacionan con categorías como notes y agents, y contienen especificaciones como DoubleNest y yes en distintas combinaciones, así como nombres de campos como note_alt_display : character_set, agent_display, language_code, entre otros. Algunos registros están destacados en amarillo y azul, indicando categorías o notas especiales, tales como local harmonization, URI y local vocab. La tabla representa una guía para la indexación y presentación de metadatos.

Categorías que atraviesan colecciones

  • Tipos de contenido
    • Obras de Audio
    • Obras Cartográficas
    • Colecciones
    • Conjuntos de Datos
    • Imágenes en Movimiento
    • Objetos
    • Partituras y Notaciones
    • Software y Medios Electrónicos
    • Obras Textuales
    • Obras Visuales
  • Tipos de formato

Los desafíos de conectar el patrimonio cultural de Yale

  • Enfrentamos diferencias entre culturas organizativas, sistemas y estándares.
  • Nadie deseaba crear otro motor de búsqueda de tipo tradicional.
  • Las unidades deberían ser propietarias de sus datos; es decir, no queríamos mantener un nuevo sistema principal de registros.
  • Objetivo: un sistema coherente, atractivo y, sobretodo, útil.
  • ¿La respuesta? Un grafo de conocimiento (knowledge graph).

Crédito por el contenido: Robert Sanderson, "A Launch Celebration | LUX: Yale Collections Discovery".

Cuatro elementos diferentes que forman parte de un collage. En la esquina superior izquierda, hay un fósil de pez, encontrado por Benjamin Silliman. En la esquina superior derecha, se muestra una carta manuscrita de Silliman dirigida a George Peabody Esq. con una escritura elegante y detallada. En la esquina inferior izquierda, se ve un dibujo delicado del retrato de Harriet Trumbull, sobrina del artista John Trumbull. Finalmente, en la esquina inferior derecha, se presenta una pintura vibrante de una batalla, hecha por John Trumbull y su profesor, Benjamin West. Flechas rojas conectan cada una de estas obras, ilustrando las conexiones entre distintas piezas en las colecciones de Yale.

Crédito por el contenido: Robert Sanderson, "A Launch Celebration | LUX: Yale Collections Discovery".

Arte Enlazado (Linked Art)

Logotipo de Linked Art que presenta una gráfica estilizada en forma de un polígono con tres picos, representando posiblemente un rango de datos o conexiones de red, sobre un fondo de cuadrícula. Debajo del polígono, la palabra LINKED ART aparece en mayúsculas con una fuente audaz y color coral.

Una visión en busca de un marco

  • El equipo que trabajaba en LUX necesitaba llegar a un marco común.
  • Cuando Rob Sanderson vino a Yale, presentó dos propuestas fundamentales:
    1. Una nueva interpretación de los Datos Enlazados que enfatizaba la usabilidad.
    2. Un modelo de metadatos llamado Arte Enlazado (Linked Art) para representar el patrimonio cultural.

LOUD: datos enlazados, abiertos y utilizables

  • A partir de 2016, Rob Sanderson y sus colaboradores de entonces en la Fundación Getty, en Los Ángeles:
    • Propusieron una nueva aproximación a los datos enlazados, conocida como LOUD (Linked Open Usable Data).
    • Buscaron facilitar la implementación de LOD (Linked Open Data) para programadores, utilizando formatos comunes como JSON en lugar de tripletas de RDF.
Características clave
  • LOUD adopta rotundamente el formato JSON-LD.
  • Propone patrones de diseño orientados hacia interfaces de programación de servicios web, en lugar de consultas SPARQL.

El programador como usuario

Imagen generada por DALL·E en ChatGPT 4.

Comparación visual entre RDF y JSON generada por DALL·E en ChatGPT 4. En el lado izquierdo, se muestra una gran maraña de cables sobre un fondo azul con la etiqueta RDF arriba, sugiriendo complejidad o confusión. En el lado derecho, contra un fondo azul similar, hay una pila ordenada de libros con la etiqueta "JSON" en la parte superior, indicando estructura y organización. Entre los libros y los cables, hay una línea divisoria. La parte de JSON también incluye íconos de verificación, diálogos, estructuras moleculares y casillas de selección, lo que implica funcionalidad y claridad.
{
  "id": "https://lux.collections.yale.edu/data/text/469c6229-0f5d-465b-8ef8-af90b1e94ad5",
  "type": "LinguisticObject",
  "about": [
    {
      "id": "https://lux.collections.yale.edu/data/concept/9a50d719-a171-4744-9d09-d554898278d6",
      "type": "Type",
      "_label": "Neruda, Pablo, 1904-1973 -- Fiction"
    },
    {
      "id": "https://lux.collections.yale.edu/data/concept/55b71204-b187-46f8-8840-4a96a3afe90f",
      "type": "Type",
      "_label": "Allende Gossens, Salvador, 1908-1973 -- Fiction"
    },
    {
      "id": "https://lux.collections.yale.edu/data/concept/c91ad346-ba28-4a54-ad03-f3c85866b55e",
      "type": "Type",
      "_label": "Chile -- Politics and government -- 1970-1973 -- Fiction"
    }
  ],
  "_label": "The Neruda case",
  "@context": "https://linked.art/ns/v1/linked-art.json",
  "language": [
    {
      "id": "https://lux.collections.yale.edu/data/concept/dfa53b96-4eda-4c9a-b091-10008a726c38",
      "type": "Language",
      "_label": "English"
    },
    {
      "id": "https://lux.collections.yale.edu/data/concept/9dc99a8c-fc3d-4f27-8ffb-a6e88883f64c",
      "type": "Language",
      "_label": "Spanish"
    }
  ],
  "used_for": [
    {
      "@type": "Activity",

Linked Art: implementando el enfoque LOUD para el patrimonio cultural

  • Estándar emergente para describir el arte y su contexto cultural.
  • Sigue los principios de LOUD, aplicándolos al Modelo de Referencia Conceptual del Comité Internacional de Documentación (CIDOC-CRM, por sus siglas en inglés).
  • Esfuerzo comunitario con participación de instituciones en Norteamérica y Europa.
  • Va más allá del arte y la historia del arte, abarcando también la descripción de recursos bibliográficos y archivísticos.

El perfil de Linked Art (https://linked.art

Dominio
Patrimonio cultural, especialmente obras de arte
Modelo
CIDOC-CRM
Ontología
Codificación RDF de CRM 7.1, con algunas extensiones
Vocabulario
Tesauro de arte y arquitectura del Instituto Getty Research Institute, con algunas extensiones
Formato
JSON-LD con 10 fronteras documentales principales
Objetivo
Satisfacer 90% de los casos de uso con un 10% de esfuerzo

Arquitectura informacional de Linked Art

Diagrama del enfoque de alto nivel adoptado por el estándar Linked Art, que muestra las relaciones entre Modelo, Ontología, Vocabulario, Perfil y API.

Linked Art y LUX

  • En Yale, se creó la plataforma LUX utilizando Linked Art como lengua franca.
  • LUX proporciona acceso integrado a las colecciones de Yale, incluyendo museos, bibliotecas y archivos.

Linked Art versus BIBFRAME

¿Por qué no elegimos a BIBFRAME como modelo de datos para LUX?

  1. Por cuestiones prácticos. Linked Art nos ayudó a crear más equilibrio entre la biblioteca y los museos.
  2. Por cuestiones ideológicos. Rob Sanderson llegó a Yale con ideas muy claras sobre cómo diseñar un sistema de Datos Enlazados.

Modelos conceptuales

  • ¿Qué tan diferentes son los modelos conceptuales de las bibliotecas, los museos y los archivos?
  • Para los desarrolladores de la ontología Registros en Contexto (RiC-O, por sus siglas en inglés), que representa el ámbito archivístico:
    Son muy diferentes. Los conceptos semánticos para cosas muy básicas como "persona", "título", "autor" o "procedencia" difieren enormemente entre estas comunidades, incluso si los términos son compartidos entre ellas.

¿Qué opinan ustedes?

Diferencias entre Linked Art y BIBFRAME

  • Linked Art se enfoca en publicar datos enlazados en la web.
  • Permite la clasificación de entidades usando vocabularios controlados.

Clasificaciones en Linked Art

  • En Linked Art, se utiliza la propiedad classified_as, o clasificado como, para asignar tipos más específicos de clases genéricas.
  • Se puede también crear meta-clasificaciones de otras clasificaciones.
  • En BIBFRAME, por otro lado, todas las subclases de Obra, por ejemplo, ya están enumeradas en la ontología.
 
Gráfico de nodos y conexiones que representan la estructura de clasificación de objetos dentro de una base de datos de Linked Art. En el centro, hay un HumanMadeObject en forma de elipse y color ámbar. Desde este nodo, se extienden relaciones a otros nodos: un VisualItem en forma de caja y color rojo pálido, con la etiqueta Portrait of Lynette Yiadom-Boakye, Jacob Morland of Capplethwaite, que indica lo que el objeto muestra; y varios nodos de Type, cada uno en forma de elipse y color azul claro, que clasifican el objeto como Paintings, Type of Work, Visual Works, y Super Type. Cada conexión está etiquetada para mostrar la relación entre los nodos, como shows y classified_as. Los colores y formas de los nodos ayudan a diferenciar las categorías de entidades en la visualización.

Linked Art: modelo conceptual a grandes rasgos

Diagrama de conceptos clave utilizados en la modelización de datos para el arte y la cultura. Los conceptos están representados por óvalos de colores con las palabras Place, Activity, Timespan, Actor, Type, Phys Obj para objeto físico e Info Obj para objeto de información. Estos términos están distribuidos en un fondo negro, posiblemente representando cómo interactúan en un modelo de datos o en un grafo de conocimiento. El diagrama es un ejemplo simplificado de cómo se pueden conectar los datos en el campo del patrimonio cultural para mejorar la búsqueda y el descubrimiento de información.

LUX: ¿cómo funciona?

Datos sobre LUX

  • Aproximadamente 41 millones de entidades (como JSON-LD).
  • Aproximadamente 2.5 mil millones de tripletas.
  • Catálogo completo de la biblioteca (incluye libros electrónicos, pero no artículos).
  • Conciliación y enriquecimiento de datos a partir de
    • Getty: AAT, ULAN, TGN
    • Biblioteca del Congreso: LCSH, LCNAF, Vocabularios
    • OCLC: FAST, VIAF
    • Wikidata.
  • Registros mapeados por las unidades contribuyentes y luego enriquecido a través del pipeline de LUX.

Transformaciones de metadatos

Desde estos...

Muestra logotipos y gráficos de diferentes estándares de metadatos utilizados en la catalogación y descripción de colecciones y patrimonio cultural. En la parte superior, se ve el logo de EAD (Encoded Archival Description), seguido por el logo de MARC 21 (Machine-Readable Cataloging). En el centro, aparece una imagen de Charles Darwin que representa el Darwin Core, un estándar para la información de biodiversidad. A la derecha, se encuentra el logo de LIDO (Lightweight Information Describing Objects), enfocado en la descripción de objetos de museos. En la parte inferior, hay un banner que dice Categories for the Description of Works of Art indicando un estándar para describir, catalogar y vincular obras de arte, arquitectura y patrimonio cultural, acompañado de imágenes en miniatura de diferentes tipos de arte y arquitectura. La imagen comunica visualmente la variedad de estándares empleados para organizar y presentar datos en diferentes dominios del conocimiento.

Transformaciones de metadatos

Diagrama conceptual que ilustra las relaciones entre varios conceptos en el contexto de metadatos de obras de arte y cultura. En el centro, el concepto Creation (Creación) actúa como el nodo principal y está conectado a Textual Work (Obra Textual), Visual Work (Obra Visual), Actor (Actor), TimeSpan (Periodo de Tiempo) y Place (Lugar). Creation está vinculada a Actor a través de created by (creado por) y a TimeSpan a través de timespan (periodo de tiempo). Actor se divide en subcategorías como Gender/Ethnicity (Género/Etnicidad). Visual Work está conectado a Digital Content (Contenido Digital) y Physical Object (Objeto Físico), indicando las diferentes formas en que puede presentarse una obra visual. Textual Work está vinculado a Concept (Concepto) y Place. El diagrama usa colores para diferenciar los tipos de conceptos y flechas para denotar las relaciones semánticas, ofreciendo una estructura lógica para entender cómo se relacionan los datos en un entorno de conocimiento vinculado.

¡A esto!

Pipeline de datos

Diagrama de flujo complejo que representa la infraestructura de datos de la plataforma LUX. En la parte superior del diagrama, hay un Unit System of Record que se relaciona con varios sistemas como YCBA: TMS, YUAG: TMS, YPM: EMu, entre otros. El proceso comienza con la escritura en el Activity Stream Entry y fluye a través de diferentes caches y acciones como Harvest Recs, Fixes, y Reconcile. Se integran datos de autoridades externas como Getty: AAT, ULAN y TGN, y LC: LCSH, entre otros. El diagrama también muestra procesos de reconciliación de identificadores, fusión de datos, y exportación hacia formatos como JSON y bases de datos como MarkLogic. Las diferentes fases están conectadas por líneas que indican el flujo de datos a través de la red y de diferentes procesos como Load Data, Map to Model, y Export. El diagrama refleja un proceso técnico de integración y gestión de datos en una arquitectura de sistemas interconectados.

Crédito por el contenido: Robert Sanderson.

Propiedad de datos centrada en los dominios (domain ownership of data)

Crédito por el contenido: Robert Sanderson.

Diagrama de flujo que detalla un proceso de gestión de datos. En la parte central, hay un cilindro etiquetado como Unit System of Record que representa la base de datos principal de la unidad. Hay varios rectángulos que representan diferentes componentes del proceso: Activity Stream Entry, Activity Stream Page y Unit Entity Rec. Un rombo etiquetado Write AS,Rec indica una acción de escritura hacia el Activity Stream Entry. A la derecha, se encuentra una leyenda que asocia acrónimos de distintas unidades de Yale con sus respectivos sistemas de registro: YCBA con TMS, YUAG con TMS, YPM con EMu, YUL con Voyager y ASpace, y menciona Overlay Data & future. El diagrama refleja una estructura de flujo de trabajo para la actualización y mantenimiento de registros en un sistema de información,  en un contexto de biblioteca o de gestión de colecciones.

Enfoque en estándares

  • Énfasis en la interoperabilidad y código abierto donde fuera posible.
  • Linked Art, Activity Streams, JSON-LD, IIIF.
  • Tecnologías comunes (ReactJS, Python, Drupal).
  • Calidad empresarial y fiabilidad.
  • MarkLogic como base de datos.

5 tipos de entidades principales

Objeto Fabricado por el Ser Humano (HumanMadeObject)
Objeto físico que se puede tocar.
Objeto Lingüístico (LinguisticObject)
Contenido en lenguaje humano que se puede leer o escuchar.
Elemento Visual (VisualItem)
Contenido con una apariencia identificada que se puede ver.
Objeto Digital (DigitalObject)
Cosa digital que existe en una computadora.
Conjunto (Set)
Agrupamiento identificable de cero o más entidades.

5 tipos de entidades conectadas

Persona (Person)
Ser humano, vivo o fallecido.
Grupo (Group)
Una o más personas, u otros grupos, que actúan colectivamente.
Lugar (Place)
Extensión geoespacial, descriptible con coordenadas.
Concepto (Type)
Cosa conceptual, a menudo utilizada para caracterizar o clasificar.
Evento/Actividad (Event/Activity)
Evento o actividad que ocurrió en algún momento en el tiempo.

Modelo

Modelo de datos conceptual con varios nodos y relaciones. Los nodos son Place, Visual Content, Physical Object, Concept, TimeSpan, Product'n, Birth, y Actor. Cada nodo está conectado por flechas que representan relaciones como represents, shows, classified_as, produced_by, timespan, carried_out_by, took_place_at y born. Place está vinculado a Visual Content y a Birth, mientras que Physical Object está conectado a Visual Content y Concept. TimeSpan se relaciona con Product'n, que a su vez está conectado a Actor. Actor también está conectado a Birth. El diagrama visualiza cómo se interrelacionan diferentes entidades en un sistema de gestión de información.

Persona/Grupo

Lugar

Lugar

Período de Tiempo

Obra

Objeto

Concepto

Actividad

Evento

Valores a partir de datos

Diagrama de relaciones entre varios conceptos relacionados con una obra de arte. Yosemite está conectado a image a través de la relación represents. Image está vinculado a yuag: 1931.389 con la relación shows, y este último está clasificado como painting. En otra parte del diagrama, ca. 1873 está conectado a Product'n con la relación timespan y Product'n está relacionado con Bierstadt a través de carried_out_by, quien a su vez nació en Germany como indica la relación took_place_at desde Birth. El diagrama visualiza la conexión entre el lugar, la imagen visual, el objeto físico (con su identificador en la galería de arte), la categoría de la obra, el tiempo de producción, el creador y su lugar de nacimiento.

Conciliación de datos entre entidades

Esquema de relaciones entre diversos conceptos en un sistema de gestión de información cultural. Se incluye tgn:7017628 que representa a image, la cual muestra yuag:1931.389 clasificado como http://lux/painting. En otra secuencia, ca. 1873 está conectado a Product'n, que a su vez fue llevado a cabo por ulan:1248. Además, Birth que tuvo lugar en tgn:7000084 está conectado a ulan:1248. Cada uno de estos identificadores prefijados (tgn, yuag, ulan) apunta a sistemas de identificación únicos utilizados para catalogar y referenciar entidades en bases de datos especializadas. El esquema muestra cómo las entidades digitales se vinculan a través de metadatos normalizados en un entorno de datos conectados.

Datos enriquecidos

Diagrama que ilustra las relaciones entre varios conceptos y entidades en un sistema de gestión de información cultural. tgn:7017628, que es parte de California, representa a image, que a su vez muestra yuag:1931.389, clasificado como http://lux/painting. A la derecha, el diagrama indica que ulan:1248 fue clasificado como male y nació en 1830, con su nacimiento teniendo lugar en Europe, que es parte de tgn:7000084. Ca. 1873 es el periodo de tiempo durante el cual Product'n fue producido por ulan:1248. Este esquema muestra cómo se conectan las entidades como lugar, imagen, objeto físico, y persona dentro de una infraestructura de datos para representar información detallada sobre una obra de arte y su creador.

Al final, ¿por qué?

¿Cómo pintaron los artistas europeos el Oeste Norteamericano durante el siglo XIX?

Yosemite Valley, Glacier Point Trail, Albert Bierstadt, 1873, Yale University Art Gallery

Pintura del artista Albert Bierstadt que captura la majestuosidad del paisaje del Oeste americano, probablemente una representación del Parque Nacional de Yosemite. La luz del sol filtra a través de un cielo brumoso, iluminando las montañas y valles con una calidad etérea. La obra de arte está imbuida con un sentido de la sublime grandeza de la naturaleza, una característica distintiva del estilo de Bierstadt y de la escuela del paisajismo americano conocida como Hudson River School. La composición incluye detalles minuciosos de la flora y la fauna, así como figuras humanas que proporcionan escala y una sensación de la presencia humana en el vasto entorno natural.

LUX: demostración del sistema

Búsqueda simple

Búsqueda avanzada

Gráfico de flujo que presenta la relación entre diferentes entidades y valores literales. El nodo central es un Objeto de color rosa, que tiene una conexión a un valor literal verdadero, indicando que el objeto tiene una imagen digital. Además, el Objeto está vinculado a una Obra de color azul claro, lo que sugiere que el objeto contiene dicha obra. La Obra, a su vez, está relacionada con un Lugar de color amarillo a través de la etiqueta sobreLugar, y este Lugar está específicamente asociado con el valor literal chile, lo que indica su nombre. El gráfico utiliza formas elípticas para las entidades y cuadros para los valores literales, con flechas que indican la dirección de la relación y etiquetas que describen la naturaleza de cada conexión.
{
  "AND": [
    {"hasDigitalImage": 1}, Objeto
    {
      "carries": {  Obra
        "aboutPlace": {"name": "chile"}  Lugar
      }
    }
  ]
}

¿Qué hay de Chile en LUX?

¿Qué hay de Chile en LUX?

Though the Galápagos are often cited as the most important source of his ideas, Darwin's time in Chile was as influentialif not more.

Patience Schell

¡Muchas gracias!

¿Preguntas? ¿Comentarios?

Tim Thompson

Bibliotecario para la Investigación de Metadatos Aplicados

Biblioteca de la Universidad de Yale

timothy.thompson@yale.edu

www.linkedin.com/in/timathompson

@timathom@indieweb.social