Introducció a XML

Dades

  • Els humans fan servir les dades per viure
  • Les dades són representació d'aspectes del món real
  • Generalment les dades necessiten algun tipus de procés per poder ser usades:
    • Es poden fer servir per fer càlculs o per prendre decisions
    • El procés les converteix en 'informació'

Representació de les dades

  • Els ordinadors emmagatzemen aquestes dades en binari a través d'algun tipus de codificació:
    • Text:
      • ASCII, UTF-8, ISO-8859-15, Windows- 1251, etc...
    • Binària:
      • Imatges (JPG, PNG, GIF, ...)
      •  So (WAV, MP3, ...)
      • Vídeo (MPEG, ... )
      • Etc...
             

Estructuració de dades

  • Les dades en els ordinadors es guarden en fitxers
  • Tradicionalment els fitxers s'emmagatzemen en en dos tipus de formats:
    • Fitxers binaris
    • Fitxers de text

Fitxers binaris

  • Els fitxers binaris són simplement una tira de bits
  • La informació que contenen només la entenen els programes que l'han generat
    • Per això els fitxers binaris només es poden llegir amb els programes que els han creat
  • Els fitxers binaris estan molt bé perquè són llegits fàcilment pels ordinadors
    • Les dades es llegeixen i guarden d'una forma molt eficient

Fitxers binaris

  • A vegades els fitxers binaris contenen informació sobre el seu contingut per diferents motius

 

 

 

  • Algú ho entendria sense informació?
    • Si el creador no ho explica és complicat

En l'exemple els números són “metadades” “Les metadades són dades sobre les dades”

Fitxers de text

  • Els fitxers de text també són tires de bits però estan agrupats de forma estandarditzada
    • ASCII, UTF-8, UTF-16, EBCDIC, Windows-1250
  • Gràcies a l'estàndard aquests fitxers es poden obrir en diferents programes
  • La informació es comparteix més fàcilment amb fitxers de text que amb fitxers binaris

Fitxers de text

  • També tenen desavantatges:
    • Els sistemes operatius tracten de forma diferent alguns dels seus aspectes (com els salts de línia)
    • És complicat afegir-hi informació sobre les dades, metadades, ja que no seran interpretades
      • Poden arruïnar-ne totalment la facilitat de lectura
      • No existeix una forma estàndard d'afegir-les

Fitxers de text

  • Antigament per representar dades es feia separant els valors amb comes o algun altre símbol
“Nom”,”Cognom”,”Ofici”,”Naixement”,”Poblacio”,”Punts”
“Filomenu”,”Garcia”,”Professor”, “10/04/1902”,”Cabanes”,12
“Mariano”,”Puigdevall”,”Informàtic”,”19/05/1972”,”Cabanes”,23
“Federicu”, “Pi”, “Mestre”,”20/03/1968”,”Girona”,40
  • S'ha de saber que la primera línia són metadades
  • Afegir-hi noves dades pot ser molt problemàtic pel programa que les llegeixi
  • Probablement haurem de canviar el programa

Introducció a XML

By Carles Gonzalez