Introducció a XML
Dades
- Els humans fan servir les dades per viure
- Les dades són representació d'aspectes del món real
- Generalment les dades necessiten algun tipus de procés per poder ser usades:
- Es poden fer servir per fer càlculs o per prendre decisions
- El procés les converteix en 'informació'
Representació de les dades
- Els ordinadors emmagatzemen aquestes dades en binari a través d'algun tipus de codificació:
-
Text:
- ASCII, UTF-8, ISO-8859-15, Windows- 1251, etc...
-
Binària:
- Imatges (JPG, PNG, GIF, ...)
- So (WAV, MP3, ...)
- Vídeo (MPEG, ... )
- Etc...
-
Text:
Estructuració de dades
- Les dades en els ordinadors es guarden en fitxers
- Tradicionalment els fitxers s'emmagatzemen en en dos tipus de formats:
- Fitxers binaris
- Fitxers de text
Fitxers binaris
- Els fitxers binaris són simplement una tira de bits
- La informació que contenen només la entenen els programes que l'han generat
- Per això els fitxers binaris només es poden llegir amb els programes que els han creat
- Els fitxers binaris estan molt bé perquè són llegits fàcilment pels ordinadors
- Les dades es llegeixen i guarden d'una forma molt eficient
Fitxers binaris
- A vegades els fitxers binaris contenen informació sobre el seu contingut per diferents motius
- Algú ho entendria sense informació?
- Si el creador no ho explica és complicat
En l'exemple els números són “metadades” “Les metadades són dades sobre les dades”

Fitxers de text
- Els fitxers de text també són tires de bits però estan agrupats de forma estandarditzada
- ASCII, UTF-8, UTF-16, EBCDIC, Windows-1250
- Gràcies a l'estàndard aquests fitxers es poden obrir en diferents programes
- La informació es comparteix més fàcilment amb fitxers de text que amb fitxers binaris
Fitxers de text
- També tenen desavantatges:
- Els sistemes operatius tracten de forma diferent alguns dels seus aspectes (com els salts de línia)
- És complicat afegir-hi informació sobre les dades, metadades, ja que no seran interpretades
- Poden arruïnar-ne totalment la facilitat de lectura
- No existeix una forma estàndard d'afegir-les
Fitxers de text
- Antigament per representar dades es feia separant els valors amb comes o algun altre símbol
“Nom”,”Cognom”,”Ofici”,”Naixement”,”Poblacio”,”Punts”
“Filomenu”,”Garcia”,”Professor”, “10/04/1902”,”Cabanes”,12
“Mariano”,”Puigdevall”,”Informàtic”,”19/05/1972”,”Cabanes”,23
“Federicu”, “Pi”, “Mestre”,”20/03/1968”,”Girona”,40- S'ha de saber que la primera línia són metadades
- Afegir-hi noves dades pot ser molt problemàtic pel programa que les llegeixi
- Probablement haurem de canviar el programa
Introducció a XML
By Carles Gonzalez
Introducció a XML
- 117