Identificadores

Veremos

  • URI: URL, URN, otros
  • Identificadores persistentes
    • Purl
    • Handle
    • DOI
    • ARK
    • magnet

URI

Ubicando objetos digitales

Uniform Resource Identifier

  • Uniform Resource Identifier
    • Uniform Resource Locator (URL)
    • Uniform Resource Name (URN)
    • Otros

Las URIs no cambian:
las personas las cambian

Tim Berners-Lee​

Sintaxis (RFC 3986)

         foo://example.com:8042/over/there?name=ferret#nose
         \_/   \______________/\_________/ \_________/ \__/
          |           |            |            |        |
       scheme     authority       path        query   fragment
foo://ejemplo.com:8042/en/este/lugar?nombre=ferret#nose
\_/   \______________/\____________/ \___________/ \__/
 |           |            |            |             |
esquema    autoridad     ruta        consulta    fragmento

TLD

Esquema: nombre que se refiere a una especificación para asignar los identificadores. Suelen indicar el protocolo de acceso al recurso.

Por ejemplo http:, mailto:, ftp:, etc.

El fin de este componente se indica mediante el carácter ':'.

<esquema>:<p. jerárquica>[?<consulta>][#<fragmento>]

Según RFC 3986: El esquema y el anfitrión (host) no distingue mayúsculas de minúsculas, y por tanto debe ser normalizado todo a minúsculas. Por ejemplo as siguientes URIs son equivalentes:

HTTP://www.EXAMPLE.com/
http://www.example.com/

El resto de los componentes se asume distinguen mayúsculas de minúsculas salvo que se especifique puntualmente por el esquema.

foo://ejemplo.com:8042/en/este/lugar?nombre=ferret#nose
\_/   \______________/\____________/ \___________/ \__/
 |           |            |            |             |
esquema    autoridad     ruta        consulta    fragmento

La parte jerárquica está formada por:

  • autoridad y de estar presente la
  • ruta (path)

Autoridad: elemento jerárquico que identifica la autoridad de nombres

Por ejemplo //www.filo.uba.ar

El comienzo de este componente se indica mediante el carácter '//'.

<esquema>:<p. jerárquica>[?<consulta>][#<fragmento>]

Ruta: Información usualmente organizada en forma jerárquica, que identifica al recurso en el ámbito del esquema URI y la autoridad de nombres

Por ejemplo: /tesis/123

El comienzo de este componente se indica mediante el carácter '/'.

<esquema>:<p. jerárquica>[?<consulta>][#<fragmento>]

Consulta: Información con estructura no jerárquica (usualmente pares "clave=valor") que identifica al recurso en el ámbito del esquema URI y la autoridad de nombres.

El comienzo de este componente se indica mediante el carácter '?'.

<esquema>:<p. jerárquica>[?<consulta>][#<fragmento>]
<esquema>:<p. jerárquica>[?<consulta>][#<fragmento>]

Fragmento: Permite identificar una parte del recurso principal, o vista de una representación del mismo.

El comienzo de este componente se indica mediante el carácter '#'.

  • Qué dejar afuera: "Poner más información además de la fecha de creación del recurso es para problemas"
    • Nombre del disco
    • Software utilizado para crear
    • Mecanismo de creación
    • Extensión del archivo
    • Acceso
    • Status
    • Asunto
    • Nombre de autor
    • No olvidemos el nombre de dominio
      • catalogo.misitio.comvufind.misitio.com

Ejemplos

  • Carpetas compartidas:
    smb://pbianchi:mipass@PCdeJuan:2134/Users/juan/Mis_Documentos

  • Archivo local:
    file:///home/gabbo/books/RomeoAndJuliet.epub

  • Servicio de mensajería SMS
    sms:+5491167891234?body=Hola%20a%20todos

  • Teléfono:
    call:+5491167891234

  • Data URI (RFC2397) data:[<mediatype>][;base64],<data><img src="data:image/gif;base64,R0lGODlhyAAiALM...DfD0QAADs=" />

  • Ejemplos obteniendo un XML (OAI-PMH)
    
    http://catalogo.fi.uba.ar/cgi-bin/koha/oai.pl?
    verb=ListRecords&
    metadataPrefix=oai_dc
    
    http://catalogo.fi.uba.ar/cgi-bin/koha/oai.pl?
    verb=GetRecord&
    metadataPrefix=oai_dc&
    identifier=FIUBA-OAI-DC:170

Ejemplos

  • Magnet: magnet links scheme
    magnet:?xt=urn:sha1:YNCKHTQCWBTRNJIV4WNAE52SJUQCZO5
    info:lccn/2002022641
    tag:hawke.org,2001-06-05:Taiko
    @Jones.and.Company/(+phone.number)
    xri://northgate.library.example.com/(urn:isbn:0-395-36341-1)

URL

Identifica por ubicación:
esquema://máquina/directorio/archivo
esquema://usuario:contraseña@máquina:puerto/directorio/archivo

URN

  • Se pretendía dar acceso a un recuerso independientemente de su ubicación, usando un esquema de name:spaces
    • Desde RFC 3986 (2005) el término a quedado deprecado obsoleto en favor de URI.
  • Ejemplos:
    • urn:isan:0000-0000-9E59-0000-O-0000-0000-2
      • The 2002 film Spider-Man, identificado por su audiovisual number.
    • urn:issn:0167-6423
      • The scientific journal Science of Computer Programming, identificado por su serial number.

IRI

IRI: Internationalized Resource Identifiers
URI actualizado (RFC 3986, RFC 3987)

Ventaja: URI con UTF-8 (no sólo subconjunto de ASCII)

Desventaja: IDN homograph attack
URI/Percent encoding
¿Y XRI…?

http://müsic.example/motörhead (no es URI, es IRI)

percent-encoding + punycode

http://xn--msic-0ra.example/mot%C3%B6rhead 

Identificadores persistentes

Ubicar por siempre

Identificadores persistentes

No se proponen registrar dónde se encuentra un objeto.

  • PURL (Persistent Uniform Resource Locators)

  • Handle

  • DOI

  • ARK

  • magnet

  • permalink

Persistent Identifier (PID o PI)

Referencia de larga duración a un objeto digital.

No necesariamente
es una URI

¿Por qué usar PIDs?

El volumen y la cantidad de objetos digitales crece.

Cada vez es más sencillo y barato.

Para ubicar, citar y enlazar objetos digiales en ambientes en red de forma perdurable es conveniente un identificador global reutilizable.

Diferentes sistemas/arquitecturas

  • DOI: Digital Object Identifier
  • Handle
  • ARK: Archival Resource Key
  • PURL: Persistent URL

Otras

  • URI-URN Standard
  • Handle:  National Research Initiatives Virginia
  • DOI: International DOI Federation (basado sistema Handle)
  • ARK: University of California
  • URI-URN Standard:  IETF/W3C
    • Ej: urn:isbn:0451450523
  • PURL: Internet Archive
    • Ej: https://miresolvedor.ejemplo.com/name22

Sintaxis de un handle

 

        URN:hdl:ABCDEFGHIJKLMNOP/abcdefghijklm
                ---------------- -------------
                        |              |
                naming authority      name  
   http://ejemplo.org/ark:/12025/654xz321/s3/f8.05v.tiff
   \________________/ \__/ \___/ \______/ \____________/
     (reemplazable)    |     |      |       Calificador
          |     Etiqueta ARK |      |    (NMA-soportado)
          |                  |      |
Name Mapping Authority       |  Nombre (NAA-asignado)
   Hostport (NMAH)           |
                    Name Assigning Authority Number (NAAN)
[http://NMAH/]ark:/NAAN/Name[Calificador]

Archival Resource Key

  • Además
    • OpenURL (z39.88) link resolver
      • OpenURL knowledge base
      • embedding citation metadata in html web pages using OpenURL
    • RESTful
    • Deep Linking
    • UUID
    • rotten link, link rot, dead link
    • Dereferenceable Uniform Resource Identifier
      • In computing, linked data, SPARQL
    • gobiernos en internet: ICANN, IANA, W3C, IETF (RFCs), ISoc
    • Webservices
    • Navegador por dentro

Bibliografía

  • https://guidelines.openaire.eu/en/latest/literature/field_alternativeidentifier.html
  • https://wiki.surfnet.nl/display/standards/info-eu-repo/#info-eu-repo-SupportedSchemes.1

Identificadores3

By Pablo Bianchi

Identificadores3

  • 962