
data/01
Data
Introductie tot data

Wat data?
IS
Wat begrijp je onder
data
NIET:
Dappere Avonturen en Triviale Anekdotes
OOK NIET:
meervoud van data
data
Data zijn feitelijke informatie of ruwe feiten die worden verzameld, opgeslagen en geïnterpreteerd. Het kan bestaan uit cijfers, woorden, geluiden, afbeeldingen of andere vormen. Data op zichzelf heeft geen betekenis; de betekenis ontstaat pas wanneer de data worden geanalyseerd en geïnterpreteerd. Data vormen de basis voor informatie en kennis, en spelen een cruciale rol in besluitvormingsprocessen en het begrijpen van de wereld om ons heen. Het proces van het omzetten van ruwe data in bruikbare informatie wordt data-analyse genoemd.
voorbeelden
Numerieke Data:
- 10 (getal)
- 3.14 (decimaal getal)
- 2023 (jaartal)

voorbeelden
Tekstuele Data:
- "Hallo, wereld!" (zin)
- "GPT-3.5" (alfanumerieke tekenreeks)
voorbeelden
Geluidsdata:
- Audiobestand van een lied
- Opname van spraak

voorbeelden
Visuele Data:
- Afbeelding van een landschap
- Grafiek met verkoopcijfers

voorbeelden
Tijdgebonden Data:
- Tijdstip van een gebeurtenis (bijv. 14:30 uur)
- Datum van een afspraak
voorbeelden
Geografische Data:
- GPS-coördinaten van een locatie
- Kaart met markeringspunten
voorbeelden
Binaire Data:
- 01001001 (binair getal)
- Machinecode in binaire vorm
voorbeelden
Categorische Data:
- Kleuren (bijv. rood, blauw, groen)
- Productcategorieën (bijv. elektronica, kleding)
voorbeelden
Sensordata:
- Temperatuurmetingen
- Bewegingssensorgegevens
voorbeelden
Sociale Media Data:
- Tweets op
TwitterX - Foto's op Instagram


of complexer...
Genomische Data:
- DNA-sequenties
- Genexpressieprofielen
Financiële Data:
- Hoogfrequente handelsgegevens
- Derivatenprijzen en -transacties
of complexer...
Medische Beeldvorming:
- MRI-scans
- CT-beelden
Klimaatmodellering:
- Klimaatmodellen met diverse parameters
- Atmosferische gegevens over een lange periode
of complexer...
Linguïstische Data:
- Corpus van teksten voor natuurlijke taalverwerking
- Semantische analyse van grote tekstcorpora
Machine Learning Training Data:
- Enorme datasets voor beeldherkenning
- Uitgebreide datasets voor natuurlijke taalverwerking
of complexer...
Simulatiegegevens:
- Data van simulaties in de luchtvaartindustrie
- Moleculaire dynamica-simulaties in de chemie
Ruimtelijke Data:
- GIS-data (Geografisch Informatiesysteem) met verschillende lagen zoals bodemsoorten, landgebruik, enz.
- 3D-kaarten van steden met details over gebouwen en infrastructuur
of complexer...
Social Media Analytics:
- Big data van sociale platforms met miljoenen gebruikersinteracties
- Sentimentanalyse van enorme hoeveelheden tekstuele gegevens
Fysica-experimentgegevens:
- LHC (Large Hadron Collider) gegevens van deeltjesfysica-experimenten
- Astrofysica-waarnemingsgegevens van telescopen
Waar wordt data bewaard?
Data bewaren
Data kunnen op verschillende manieren worden bewaard, afhankelijk van de aard van de informatie en het doel van opslag
Meest voorkomende:
- databases
- bestandssystemen
- harde schijven & servers, geheugenkaarten
- cloud opslag (online server)
- blockchain
Veel keuze
De keuze van de opslagmethode hangt af van factoren zoals de aard van de gegevens, de toegankelijkheidsvereisten, de beveiliging, en de schaalbaarheid.
In de praktijk worden vaak meerdere methoden gecombineerd om aan verschillende behoeften te voldoen.

Database

- Een georganiseerde verzameling
van informatie. - Gestructureerd en opgeslagen op een computer of server.
- Databases maken gebruik van tabellen om gerelateerde gegevens weer te geven.
- Gegevens efficiënt organiseren, beheren en doorzoeken.
- Opslag en ophalen van gegevens in softwaretoepassingen.
- Relationele databases zijn een veelvoorkomend type, waarin gegevens in tabellen met onderlinge relaties worden georganiseerd.
- SQL (Structured Query Language) wordt vaak gebruikt voor het beheren en bevragen van gegevens in databases.
Databaseschema

Bestandssystemen
Een bestandssysteem is een door het besturingssysteem verzorgde, softwarematige indeling van een opslagmedium (zoals een harde schijf). Het besturingssysteem (bijvoorbeeld van de computer of smartphone) gebruikt deze indeling om toegang tot een opslagmedium te verzorgen voor applicaties en voor zijn eigen gebruik, zodat data in de vorm van bestanden op het opslagmedium weggeschreven kan worden en ook weer teruggelezen.
Bestandssystemen

Opslag op schijven / kaartjes

Harde schijf
- Magneettechnologie: Harde schijven slaan gegevens op door magnetische deeltjes op een draaiende schijf te oriënteren.
- Lees- en schrijfkoppen: Kleine componenten bewegen over de schijf om gegevens te lezen of te schrijven.
- Binair systeem: Gegevens worden omgezet in binaire code (0 en 1) en opgeslagen als magnetische patronen.
- Bestandsysteem: Harde schijven zijn georganiseerd in sectoren en clusters met een bestandsysteem voor logische toegang tot gegevens.
- Opdeling in partities: Schijven kunnen worden verdeeld in afzonderlijke secties voor georganiseerd beheer van gegevens.
Schema met harde schijf

Cloudopslag
- Online Opslag: "opslaan van gegevens op externe servers via internet."
- Toegankelijk en schaalbaar: overal toegankelijk en uitbreidbaar"
- Gedeelde Bronnen: Servers worden gedeeld met anderen
- Veiligheid: Gegevens zijn vaak versleuteld
- Services: Backups, samenwerken ....
- Populaire Providers: Voorbeelden zijn AWS, Google Cloud, Microsoft Azure, Dropbox, en iCloud.
- Diverse Toepassingen: Gebruikt voor het opslaan van bestanden, het hosten van websites, het uitvoeren van applicaties, en meer.
Cloud Storage services

Cloud Storage services

- Dropbox: 2GB
- Google Drive: 15GB
- OneDrive: 5GB
- Amazon Loud Drive: 5GB
- Mega: 50GB
- Mediafire: 10GB
- Baidu: 2TB
- Box: 10GB
- Yandex: 10GB
- 4shared: 15GB
- Mail.com: 2GB
- Hidrive: 5GB
- Pcloud: 10GB
Blockchain
Blockchain
- Gedecentraliseerd: Gegevens worden opgeslagen op meerdere computers in een netwerk in plaats van op één centrale locatie.
- Blokketens: Informatie wordt vastgelegd in "blokken" die aan elkaar worden geketend, waardoor een onveranderlijke reeks ontstaat.
- Consensusmechanisme: Een overeenstemming tussen deelnemers in het netwerk wordt gebruikt om de geldigheid van transacties te waarborgen.

auteur

Frederick Roegiers
DigExp - DATA/01 - Data Introductie
By Lecturer GDM
DigExp - DATA/01 - Data Introductie
Introductie over data Auteur: Frederick Roegiers
- 235