Una introducción al entorno de BIBFRAME:

Un marco de datos enlazados para las bibliotecas

Network of interconnected nodes and lines on a gradient background that transitions from a warm golden hue at the bottom to a clear blue at the top. The nodes vary in size and are connected by thin lines, creating a web-like structure. Some nodes appear as filled circles while others are outlined, and the density of the network varies across the image, with some areas more clustered and others more sparse.

Licencia

Reconocimiento

  • El Asistente Técnico de Metadatos de la Universidad de Yale, Daniel Mugaburu, estuvo a cargo de la traducción de los materiales de estudio.

 

Atribución

Taller práctico

21 a 25 de octubre de 2024 

 

XXXVI Semana de la Facultad de Ciencias de la Información

Universidad Autónoma de San Luis Potosí

 

Mtro. Timothy A. Thompson 

Mtra. Irmarie Fraticelli-Rodríguez 

Yale University Library 

Equipo de Servicios de Metadatos 

Irma Fraticelli

Analista de Metadatos

irma.fraticelli@yale.edu

www.linkedin.com/in/irmarie-fraticelli

Tim Thompson

Bibliotecario para la Investigación Aplicada de Metadatos

timothy.thompson@yale.edu

www.linkedin.com/in/timathompson

@timathom@indieweb.social

¿Quién Soy? ¿Quiénes Somos?

  • Nombre
  • Puesto
  • ¿Si tuviera que cantar en un karaoke, cuál canción elegiría para cantar?

Pautas de Participación

  • Los docentes estarán atentos a comentarios y reacciones por parte de los asistentes.
  • Se puede entrar en contacto con los docentes para compartir comentarios.

Pautas de Conducta

  • Nosotros nos comprometemos a crear un ambiente acogedor, seguro y productivo para todos los participantes.
  • Eso requiere un espacio inclusivo y libre de acoso, donde se reconozca el valor inherente de cada persona.

Pautas de Conducta

  • Pedimos a los participantes que se comprometan a respetar las siguientes pautas de conducta:
  • Demostrar respeto. Evite interrumpir, criticar o menospreciar a los demás, sobre todo cuando describen sus propias experiencias vividas.
  • Dar espacio, ocupar espacio. Reconozca y comprenda la dinámica de poder que puede existir entre usted y los otros asistentes, y cómo eso puede influir en que los otros se sientan seguros para hablar.
  • Entender que la discusión es una conversación. Mantenga una actitud abierta para aprender y contemplar nuevas ideas.
  • Aceptar la divergencia. No es necesario llegar siempre a un consenso.

Estructura del Taller

  • Será un taller de 20 horas, o sea, 4 horas por día cada día de la semana.
  • Nos reuniremos de las 9:00 a las 13:00 cada día.
  • Tendremos un receso de 15 minutos por las mañanas para estirar las piernas.
  • Durante la semana, tendremos actividades para poner en práctica los conceptos presentados durante el taller.
  • Dependiendo del número de asistentes, podemos realizar las actividades de manera individual o en grupos.

Estructura del Taller

  • Día 1: Conceptos básicos de los datos abiertos vinculados.
  • Día 2: Conceptos básicos; introducción al vocabulario y modelo de BIBFRAME; su traducción en español.
  • Día 3: Reflexiones acerca de BIBFRAME y una presentación invitada por el Mtro. Álvaro López Bustamante (EBSCO).
  • Día 4: Trabajo práctico en el editor Sinopia, una plataforma de catalogación basada en tecnologías de datos vinculados.
  • Día 5: Más trabajo práctico en el editor Sinopia.

Plan para el Primer Día

Hora

Tema

9:00–9:15

Presentaciones

9:15–9:30

Visión general del taller

9:30–10:30

Introducción a la web semántica y los datos abiertos enlazados

10:30–10:45

RDF básico

10:45–11:00

Receso

11:00–11:15

RDF básico

11:15–12:00

Ontologías y modelado semántico de datos

12:00–12:45

Actividad: desmontando un registro MARC 21

12:45–1:00

Discusión

Enlaces Importantes

Día 1: Introducción a la Web Semántica y los Datos Abiertos Enlazados

Lección 1: ¿Qué Son los Datos Abiertos Enlazados (Linked Open Data)?

Desglosemos el término Datos Abiertos Enlazados para comprender mejor su significado.

Comencemos con la palabra datos.

¿Cómo lo definirías? ¿Es una palabra singular o plural?

En español...

  • El documento data del siglo XVI.

  • El dato en el formulario esta erróneo.

  • Los datos estan disponibles en la página web.

El diccionario de la Real Academia Española define el término datos como:

 

Información dispuesta de manera adecuada para su tratamiento por una computadora.

Entonces, una ficha de catálogo...

 

  • ¿Puede considerarse como "datos"?

 

  • ¿Podemos considerar esto datos enlazados?

Ficha de catalográfica descargda de la cuenta Flickr del Instituto Inglés Mexicano

"La representación de estos atributos mediante una descripción efectiva a través del uso de vocabularios, ontologías y esquemas de metadatos fomentará su vinculación en concordancia con los atributos que manifiesten." 

"... los datos tienen atributos que conforman su significado en un contexto determinado... la vinculación de los datos es un proceso que involucra el análisis de sus atributos, los cuales permitirán establecer vínculos entre datos con atributos similares..." 

Ávila Barrientos, Eder. (2020). Los Datos enlazados y su uso en bibliotecas. Instituto de Investigaciones Bibliotecológicas y de la Información. (p. 2)

"La web semántica busca procesar y dar significado a los datos para el usuario final, permitiendo búsquedas más complejas mediante la vinculación de datos de diversas fuentes."

¿Qué Son los Datos Enlazados (Linked Data)?

Un conjunto de prácticas que permiten dar sentido a pedazos de información.

Ávila Barrientos, Eder. (2020). Los Datos enlazados y su uso en bibliotecas. Instituto de Investigaciones Bibliotecológicas y de la Información. (p. 2)

  • Un modelo semántico es un tipo de enfoque conceptual en el desarrollo de sistemas de información.
  • En este enfoque se identifican entidades, significados y relaciones entre los objetos en la base de datos.

¿Qué Son los Datos Enlazados (Linked Data)?

  • Son estructuras para la vinculación y publicación de datos de manera gratuita.
  • Los datos enlazados organizan y conectan pedazos de información en la web, de manera que, diferentes sistemas computarizados y buscadores encuentren programáticamente el contenido estructurado en este formato.

¿Qué Son los Datos Abiertos Enlazados (Linked Open Data)?

Biblioteca del Congreso, Servicio de Datos Enlazados

Rivera Garza, Cristina, 1964- URI: http://id.loc.gov/authorities/names/nr94011853      

Como profesionales de la información nos enfrentamos a un diluvio de datos y serializaciones.

 

Debemos plantearnos las siguientes preguntas:

  • ¿Cómo mantenemos el ritmo con el desarollo de estas tecnologías?
  • ¿Son los modelos de aprendizaje automático la solución? (Machine Learning Models)

Minería o Exploración de Datos

Las imagenes en esta sección y la próxima, representan capturas de pantalla utilizando la aplicación Google Lens App desde un sistema iOS en agosto del 2022.

  • El reconocimiento inteligente de carácteres facilita la búsqueda y comprensión de contenidos digitales.
  • Mientras, la traducción automática ayuda a superar las barreras del idioma, promoviendo una mejor comunicación y comprensión.
  • Ambos procesos no cuentan con un modelo semántico para que buscadores y diferentes sistemas de computadora puedan entender entidades, significados y relaciones.
  • Las herramientas y modelos de inteligencia artificial facilitan la extracción de datos.
  • Pero no tienen acceso a un modelo semántico que pueda usarse para comprender su significado.
  • Un modelo semántico es un tipo de enfoque conceptual en el desarrollo de sistemas de información.
  • En este enfoque se identifican entidades, significados y relaciones entre los objetos en la base de datos.

Datos Semánticos

  • La minería de datos y el aprendizaje automático proporcionan información valiosa, pero su capacidad para distinguir entre datos y metadatos es limitada.
  • La estructura semántica de los datos a menudo permanece oculta.

Algunas de las imágenes en esta lección son capturas de pantalla del vídeo What Is Linked Data?

La web y los datos semánticos

  • La web se describe tradicionalmente como una red de documentos HTML interconectados.
  • Sin embargo, esta perspectiva no explica cómo o en qué aspectos se relacionan las entidades reales descritas en los documentos.

Comprensión y Desconstrucción de la Web

  • La web se convierte en una red de datos cuando podemos identificar, conectar y dar sentido a elementos individuales en una página web.
  • Establecer una semántica de datos es necesaria para que las tecnologias puedan identificar relaciones entre documentos y especificar el tipo de relación.

ChatGPT

Te Contesta

¿Cuál fue la primera pelicula de animación?

La información discutida en esta sección forma parte del artículo "ChatGPT’s ‘Snow White’ Problem: The Danger of Common Knowledge", publicado en la página de RDFox, una base de datos semánticos.

A partir de junio de 2023, GPT-3.5 proveía como respuesta a la pregunta, "¿Cuál fue el primer largometraje de animación?" lo siguiente:

El primer largometraje de animación es "Blancanieves y los siete enanitos", estrenado en 1937. Fue producido por Walt Disney Productions y se basó en el cuento de hadas alemán de los hermanos Grimm. "Blancanieves y los siete enanitos" fue un logro innovador en la animación, ya que fue el primer largometraje de animación y la primera película animada producida en color. Fue un éxito comercial, de crítica y inició el camino para el desarrollo de la industria del cine de animación.

Sin embargo, GPT-4.0 ofrece una respuesta mucho más matizada:

El primer largometraje de animación generalmente reconocido es "Blancanieves y los siete enanitos" de Walt Disney, estrenado en 1937.

Sin embargo, vale la pena señalar que hubo algunos intentos anteriores de crear largometrajes animados. La primera en crearse fue "El Apóstol", una película argentina de Quirino Cristiani estrenada en 1917. Lamentablemente, hoy no existen copias de esta película porque fue destruida en un incendio. Otro largometraje animado de Cristiani, "Sin dejar rastros", se estrenó en 1918 pero también se perdió. Como resultado, "Blancanieves y los siete enanitos" es el primer largometraje de animación que todavía se puede ver en la actualidad.

Y añade lo siguiente:

¿Crees que ChatGPT socava la tesis de los datos enlazados?

¿Se podrá lograr la comprensión de las máquinas sin semántica, aprendiendo distribuciones de probabilidad complejas a partir de datos no estructurados?

ChatGPT: Límites y Posibilidades

Los grandes modelos de lenguaje, como ChatGPT, han cuestionado las explicaciones tradicionales de la web semántica, ofreciendo nuevas perspectivas sobre el aprendizaje y la comprensión de la máquina sin semántica explícita.

Modelos similares a ChatGPT, necesitan de esquemas semánticos para aprender. ¿Cómo se observa esto a nivel técnico?

¡Necesito Entrenamiento!

  • Los datos estructurados en forma de tripletas RDF ya están integrados en el 50% de las páginas de la web.
  • Como resultado, ChatGPT ya ha podido aprender e incorporar la semántica de datos estructurados.

ChatGPT: Discusión

  • Sin duda, ChatGPT ya se ha beneficiado de los datos estructurados en la web.

  • Sin embargo, ¿qué es lo que realmente entiende?

  • ¿Cómo podemos verificar su resultado?

  • Al final, todavía necesitamos conocimiento, no sólo probabilidad.

  • ChatGPT refleja el conocimiento común, pero necesita ser complementado con grafos de conocimiento para una comprensión más profunda y verificada.

  • Los datos estructurados ya integrados en la web son una fuente rica para el aprendizaje y la generación de conocimiento.

¿Preguntas?

A Continuación:

Introducción Básica a RDF

Una introducción al entorno de BIBFRAME: Un marco de datos enlazados para las bibliotecas: Día 1, Lección 1

By Tim Thompson

Una introducción al entorno de BIBFRAME: Un marco de datos enlazados para las bibliotecas: Día 1, Lección 1

  • 84