Tim Thompson
Librarian for Applied Metadata Research at Yale University Library
21 a 25 de octubre de 2024
Universidad Autónoma de San Luis Potosí
Mtra. Irmarie Fraticelli-Rodríguez
Yale University Library
Equipo de Servicios de Metadatos
Analista de Metadatos
irma.fraticelli@yale.edu
Bibliotecario para la Investigación Aplicada de Metadatos
timothy.thompson@yale.edu
Hora |
Tema |
9:00–9:15 |
Presentaciones |
9:15–9:30 |
Visión general del taller |
9:30–10:30 |
Introducción a la web semántica y los datos abiertos enlazados |
10:30–10:45 |
RDF básico |
10:45–11:00 |
Receso |
11:00–11:15 |
RDF básico |
11:15–12:00 |
Ontologías y modelado semántico de datos |
12:00–12:45 |
Actividad: desmontando un registro MARC 21 |
12:45–1:00 |
Discusión |
Registración Sinopia
Enlace a actividad: desmontando un registro MARC 21
Desglosemos el término Datos Abiertos Enlazados para comprender mejor su significado.
Comencemos con la palabra datos.
¿Cómo lo definirías? ¿Es una palabra singular o plural?
El documento data del siglo XVI.
El dato en el formulario esta erróneo.
Los datos estan disponibles en la página web.
El diccionario de la Real Academia Española define el término datos como:
Información dispuesta de manera adecuada para su tratamiento por una computadora.
Entonces, una ficha de catálogo...
Ficha de catalográfica descargda de la cuenta Flickr del Instituto Inglés Mexicano
"La representación de estos atributos mediante una descripción efectiva a través del uso de vocabularios, ontologías y esquemas de metadatos fomentará su vinculación en concordancia con los atributos que manifiesten."
"... los datos tienen atributos que conforman su significado en un contexto determinado... la vinculación de los datos es un proceso que involucra el análisis de sus atributos, los cuales permitirán establecer vínculos entre datos con atributos similares..."
Ávila Barrientos, Eder. (2020). Los Datos enlazados y su uso en bibliotecas. Instituto de Investigaciones Bibliotecológicas y de la Información. (p. 2)
"La web semántica busca procesar y dar significado a los datos para el usuario final, permitiendo búsquedas más complejas mediante la vinculación de datos de diversas fuentes."
¿Qué Son los Datos Enlazados (Linked Data)?
Un conjunto de prácticas que permiten dar sentido a pedazos de información.
Ávila Barrientos, Eder. (2020). Los Datos enlazados y su uso en bibliotecas. Instituto de Investigaciones Bibliotecológicas y de la Información. (p. 2)
¿Qué Son los Datos Enlazados (Linked Data)?
¿Qué Son los Datos Abiertos Enlazados (Linked Open Data)?
Rivera Garza, Cristina, 1964- URI: http://id.loc.gov/authorities/names/nr94011853
Como profesionales de la información nos enfrentamos a un diluvio de datos y serializaciones.
Debemos plantearnos las siguientes preguntas:
Las imagenes en esta sección y la próxima, representan capturas de pantalla utilizando la aplicación Google Lens App desde un sistema iOS en agosto del 2022.
Algunas de las imágenes en esta lección son capturas de pantalla del vídeo What Is Linked Data?
La información discutida en esta sección forma parte del artículo "ChatGPT’s ‘Snow White’ Problem: The Danger of Common Knowledge", publicado en la página de RDFox, una base de datos semánticos.
A partir de junio de 2023, GPT-3.5 proveía como respuesta a la pregunta, "¿Cuál fue el primer largometraje de animación?" lo siguiente:
El primer largometraje de animación es "Blancanieves y los siete enanitos", estrenado en 1937. Fue producido por Walt Disney Productions y se basó en el cuento de hadas alemán de los hermanos Grimm. "Blancanieves y los siete enanitos" fue un logro innovador en la animación, ya que fue el primer largometraje de animación y la primera película animada producida en color. Fue un éxito comercial, de crítica y inició el camino para el desarrollo de la industria del cine de animación.
Sin embargo, GPT-4.0 ofrece una respuesta mucho más matizada:
El primer largometraje de animación generalmente reconocido es "Blancanieves y los siete enanitos" de Walt Disney, estrenado en 1937.
Sin embargo, vale la pena señalar que hubo algunos intentos anteriores de crear largometrajes animados. La primera en crearse fue "El Apóstol", una película argentina de Quirino Cristiani estrenada en 1917. Lamentablemente, hoy no existen copias de esta película porque fue destruida en un incendio. Otro largometraje animado de Cristiani, "Sin dejar rastros", se estrenó en 1918 pero también se perdió. Como resultado, "Blancanieves y los siete enanitos" es el primer largometraje de animación que todavía se puede ver en la actualidad.
Y añade lo siguiente:
¿Crees que ChatGPT socava la tesis de los datos enlazados?
¿Se podrá lograr la comprensión de las máquinas sin semántica, aprendiendo distribuciones de probabilidad complejas a partir de datos no estructurados?
Los grandes modelos de lenguaje, como ChatGPT, han cuestionado las explicaciones tradicionales de la web semántica, ofreciendo nuevas perspectivas sobre el aprendizaje y la comprensión de la máquina sin semántica explícita.
Modelos similares a ChatGPT, necesitan de esquemas semánticos para aprender. ¿Cómo se observa esto a nivel técnico?
Sin duda, ChatGPT ya se ha beneficiado de los datos estructurados en la web.
Sin embargo, ¿qué es lo que realmente entiende?
¿Cómo podemos verificar su resultado?
Al final, todavía necesitamos conocimiento, no sólo probabilidad.
ChatGPT refleja el conocimiento común, pero necesita ser complementado con grafos de conocimiento para una comprensión más profunda y verificada.
Los datos estructurados ya integrados en la web son una fuente rica para el aprendizaje y la generación de conocimiento.
By Tim Thompson
Librarian for Applied Metadata Research at Yale University Library