Tim Thompson
Librarian for Applied Metadata Research at Yale University Library
21 a 25 de octubre de 2024
Universidad Autónoma de San Luis Potosí
Mtra. Irmarie Fraticelli-Rodríguez
Yale University Library
Equipo de Servicios de Metadatos
Analista de Metadatos
irma.fraticelli@yale.edu
Bibliotecario para la Investigación Aplicada de Metadatos
timothy.thompson@yale.edu
Tim Berners-Lee, creador de la Web, propuso un sistema de clasificación para evaluar la calidad y accesibilidad de los datos en la web:
Valor | Criterio |
---|---|
⭐ | Datos disponibles en la web en cualquier formato. |
⭐⭐ | Datos como estructuras legibles por máquinas. |
⭐⭐⭐ | Datos en formato abierto y no propietario. |
⭐⭐⭐⭐ | Datos que siguen los estándares abiertos del W3C. |
⭐⭐⭐⭐⭐ | Todos los criterios anteriores más enlaces a otros Datos Abiertos Enlazados. |
Los datos abiertos enlazados se fundamentan en estándares del World Wide Web Consortium (W3C), incluyendo:
El Marco de descripción de recursos (RDF) es un modelo simple cuya estructura básica es una declaración de tres partes, o tripleta.
Consiste en una relación entre sujeto y objeto, definida por un predicado.
Un recurso es cualquier cosa sobre la que queremos decir algo.
Para hacer declaraciones sobre recursos, necesitamos identificarlos.
Un recurso se identifican mediante un identificador uniforme de recursos (URI).
Por ejemplo, en una declaración como "Julio Cortázar es el autor del libro Bestiario", tenemos:
El recurso o entidad que se describe.
La propiedad o atributo del sujeto.
El valor de la propiedad o el recurso relacionado.
"Julio Cortázar"
"es el autor del"
"libro Bestiario"
Todos estos componentes tienen un URI (Identificador Uniforme de Recursos)
Identifica, sujeto, predicado y objeto en la siguiente declaración:
"Bestiario se publicó por la editorial Sudamericana"
El recurso o entidad que se describe.
La propiedad o atributo del sujeto.
El valor de la propiedad o el recurso relacionado.
Todos estos componentes tienen un URI (Identificador Uniforme de Recursos)
Al interconectar declaraciones, RDF conforma un grafo de conocimiento, proporcionando una estructura rica para representar relaciones complejas entre datos.
Los datos para crear el grafo fueron extraídos de Wikipedia.
En un grafo RDF, cada nodo (sujeto u objeto) es un recurso sobre el que podemos decir cosas.
Las aristas en el grafo también son recursos, pero en la práctica no podemos realmente decir cosas sobre ellas directamente.
La dirección https://dle.rae.es/dato identifica un recurso, que también podríamos llamar una entidad.
Al usar RDF, podemos describir entidades, sus propiedades o atributos y sus relaciones con otras entidades, promoviendo una web de datos interconectados.
¿Cómo se expresa realmente RDF?
Tenemos muchas opciones de formato, que se llaman serializaciones.
Uno de los más comunes es JSON-LD.
Existen otras maneras de serializar RDF, como el formato que se llama "Turtle".
[
{"@context": "http://schema.org/"},
{
"@type": [
"DefinedTermSet",
"Book"
],
"@id": "https://dle.rae.es/",
"name": "Diccionario de la lengua española RAE - ASALE",
"image": "https://dle.rae.es/app/doc/es/img/dle.jpg",
"description": "Versión electrónica 23.6 del «Diccionario de la lengua española», obra lexicográfica académica pozr excelencia."
},
{
"@type": "DefinedTerm",
"@id": "https://dle.rae.es/dato",
"name": "dato",
"description": "1. m. Información sobre algo concreto que permite su conocimiento exacto o sirve para deducir las consecuencias derivadas de un hecho. A este problema le faltan datos numéricos.",
"inDefinedTermSet": "https://dle.rae.es/"
}
]
El JSON-LD incrustado en la página del Diccionario de la lengua española ilustra cómo se pueden representar y relacionar los datos en la web.
By Tim Thompson
Librarian for Applied Metadata Research at Yale University Library