Complessità ed Algoritmi e Strutture Dati

Indice

Complessità di un algoritmo
Puntatori
Liste
Code
Pile
Dizionari
HashMap
Alberi
Grafi

Complessità

Un problema spesso può essere risolto utilizzando algoritmi diversi. Come si misura la loro "bontà", così da scegliere il più efficiente?

Le misure utilizzate si basano su due risorse principali:

il tempo richiesto per la sua esecuzione
lo spazio utilizzato per la memorizzazione e manipolazione dei dati coinvolti

Complessità

Una buona misura dell’efficienza di un algoritmo deve prescindere dal calcolatore utilizzato.

Occorre una misura astratta che tenga conto del metodo di risoluzione con cui l’algoritmo effettua la computazione, così che questa sia un metodo di giudizio valido per qualsiasi calcolatore ed in qualsiasi contesto.

Complessità

La metrica utilizzata consiste nel misurare il numero complessivo di operazioni elementari in funzione della dimensione n dei dati in ingresso.

Le seguenti operazioni sono considerate elementari:

aritmetiche
logiche
confronto
assegnazione

Complessità

Esempio:

n = 10; //costo 1

i = 0; //costo 1

while(i < n) { //costo n+1

i = i+1; //costo 2 * n

}

Costo totale: 1 + 1 + n+1 + 2*n = 3n+3

Complessità

Esempio:

n = 10; //costo 1

m = 20; //costo 1

sum = 0; //costo 1

for (i=0; i<n; i++) { //costo 1+ n+1(test)+ n(incr)

for (j=0; j<m; j++) { //costo n*(1+m+1+m)

sum = sum+i+j; //costo 3*n*m

}

Costo totale: 3+(1+n+1+n)+n(m+1+m)+3*n*m =

= 5nm+3n+5

Complessità

Consideriamo il seguente problema:

"si vuole ricercare il valore v all'interno di un array"

È possibile identificare le seguenti casistiche:

caso migliore: è la presenza dell’elemento nell'array ed è nella prima posizione controllata.
caso peggiore: è l’assenza o una sua presenza nell'ultima cella controllata. Implica il costo di scansione dell’intera struttura

Salvo rare eccezioni, si fa sempre riferimento al caso peggiore.

Complessità

Spesso non si è interessati a conoscere il polinomio associato al costo, ma si vuole conoscere la "scalabilità" dell'algoritmo in questione.

Gli <<O grandi>> sono un criterio matematico per partizionare gli algoritmi in classi di complessità.

O(1)
O(log n)
O(n)
O(n*log(n))
O(n )
...

Puntatori

Le informazioni sono memorizzate all'interno di variabili, alle quali è "associato" un tipo, che ne indica l'insieme di valori ed azioni ammissibili (dominio).

Il puntatore è un particolare "tipo" di dato, contenente l'indirizzo di memoria associato ad un altra variabile. Poiché referenzia un'altra variabile, la dichiarazione di un puntatore include il tipo dell'area a cui punta.

NB: Essendo un puntatore un tipo di dato, è possibile ottenere un puntatore ad un puntatore.

int* puntatore;

Puntatori

int i = 5;

Puntatori

int i = 5;

int* p_i = &i;

p_i

Puntatori

int i = 5;

int* p_i = &i;

i = 7;

p_i

Puntatori

I puntatori sono fondamentali per la realizzazione degli strumenti informatici, in quanto sono alla base di:

qualsiasi struttura dati (array, liste, alberi, ecc...).
algoritmi ricorsivi
programmazione orientata agli oggetti
polimorfismo e riflessione

Array

Un array è un insieme ordinato di elementi omogenei (stesso tipo).

Caratteristiche:

allocazione statica: si alloca in memoria un area atta a contenere un numero di elementi fissato.
accesso mediante indice: è possibile accedere all'elemento i-esimo secondo la notazione array[i]

p_list

Array

Costi:

accesso: O(1) (basato su indice)
inserimento/cancellazione: O(n)

L'inserimento di un valore alla cella i ha un costo oneroso in quanto si divide in due problemi:

spazio disponibile: traslo tutto il contenuto dalle celle di una posizione per j > i [O(n)] ed inserisco l'elemento [O(1)]
spazio non disponibile: alloco una nuova struttura più grande e ricopio l'array inserendo il nuovo elemento [O(n)]

LinkedList

Le liste concatenate (linked list), sono strutture dati dinamiche*, tali che ogni elemento detiene il puntatore all'elemento successivo.

p_list

*una struttura dati statica (array) prevede la dichiarazione del numero di elementi in essa contenuti

DoubleLinkedList

Le liste doppiamente concatenate (double linked list), sono una estensione delle liste semplicemente concatenate, tali che ogni elemento detiene sia il puntatore all'elemento successivo, che al precedente.

p_list

SkipList

Le skip list, sono una estensione delle liste semplicemente concatenate, tali che ogni elemento detiene sia il puntatore all'elemento successivo, che ad un elemento "più lontano" della collezione.

Questa struttura è utilizzata per gestire agilmente una grande mole di dati.

p_list

Liste

Costi:

inserimento/cancellazione: O(n)
accesso: O(n)

Code

La coda (queue) è una struttura dati che prevede l'accesso alle informazioni in essa contenute mediante la strategia FIFO (First In First Out).

Questa può essere realizzata mediante un array (coda a dimensione fissa) o una lista (coda a dimensione illimitata).

Le operazioni di accesso alle risorse sono le seguenti:

enqueue(e): inserisce l'elemento e in coda
dequeue(): preleva l'elemento affiorante

Code

enqueue(1)

enqueue(2)

enqueue(3)

dequeue()

Pile

La coda (stack) è una struttura dati che prevede l'accesso alle informazioni in essa contenute mediante la strategia LIFO (Last In First Out).

Questa è tendenzialmente realizzata mediante una lista, così da fornire una dimensione illimitata.

Le operazioni di accesso alle risorse sono le seguenti:

push(e): inserisce l'elemento e in testa
pop(): preleva l'elemento affiorante

Pile

push(1)

push(2)

push(3)

pop()

Dizionari

Un dizionario, o mappa, è una struttura dati in grado di contenere una collezione di coppie (chiave, valore).

L'accesso alle risorse è quindi effettuato tramite chiave e non più basato sull'indice di memorizzazione.

Hash

Una funzione di hash è una particolare funzione tale che, dato in ingresso una stringa detta chiave, genera in maniera univoca una seconda stringa detta valore di dimensione ridotta.

Dal punto di vista matematico/insiemistico il valore, appartenente al codominio, è l'immagine della chiave fornita in ingresso, appartenente al dominio.

Un esempio è la funzione matematica resto.

HashTable

Una HashTable è una struttura dati che gestisce l'ordinamento delle strutture mediante una funzione di hash. Di conseguenza l'accesso ai dati è effettuato in maniera trasparente

f(k)

Alberi

Un albero è una particolare struttura dati in grado di gestire una parentela tra gli elementi in essa contenuti.

root

Alberi

Il nodo iniziale è detta radice (root).
I nodi hanno un rapporto di padre-figlio (parent-child).
Un nodo privo di figli è detto foglia (leaf).
Profondità: lunghezza del cammino dal nodo alla radice.
Livello: insieme dei nodi alla stessa profondità.
L'altezza di un albero è il massimo livello delle foglie.

I principali tipi di albero sono i seguenti:

alberi binari: ogni nodo possiede sempre due figli
alberi m-ari: ogni albero possiede un numero di figli non noto a priori.

Alberi

La ricerca di un elemento prevede una delle seguenti metodologie:

visita in profondita (depth first search DFS): visito prima tutti i nodi dei figli, uno per volta, prima di valutare un fratello.
visita in ampiezza (breadth first search BFS): visito l'albero di livello in livello.

Alberi

Pseudocodice DFS

dfs (root, val):
   //Se è il nodo corrente lo riporto
   if root.info == val:
   return true;
   //Approccio iterativo
   bool found = false;
   for child in childs.node && !found:
   found |= dfs(child, val);
   return found;

Alberi

Pseudocodice BFS

bfs(root, val):
queue = [root]
return bfs_aux(queue, val)

bfs_aux(queue, val):
   //Caso base della ricorsione: lista vuota
   if isEmpty(queue):
   return false;
   //Prelevo il prossimo elemento da vedere (LIFO)
   node = queue.dequeue()
   //Se è lui arresto la ricorsione (verifica esistenziale)
   if node.info == val:
   return true;
   //Inserisco i successivi elementi da visualizzare
for child in node.childs:

queue.enqueue(childs)
//Avvio la ricorsione
return binary_bfs_aux(queue, val)

Grafi

Un grafo è una struttura dati costituita da elementi contententi l'informazione, detti nodi, collegati tra loro attraverso archi.

Grafi

Un grafo si dice orientato se si stabilisce un verso di percorrenza degli archi, non orientato altrimenti.
Un insieme di nodi collegati è definito percorso (path).
Un grafo può ammettere cicli. Nel caso in cui non li ammetta è definito aciclico.
Un grado di un nodo è il numero degli archi entranti.
Un arco può ammettere un peso diverso dall'unitario.

Un grafo ammette diverse rappresentazioni, le principali sono le seguenti:

G(V,A): il grafo è modellato dall'insieme dei vertici V e dall'insieme degli archi A (rappresentati come coppie di nodi).
Matrice di adiacenza: esiste un nodo tra v1 e v2 se la cella m[v1][v2] assume un valore intero positivo

Grafi

Intuizione: per la visita di un grafo è possibile adoperare tecniche simili alla bsf vista per gli alberi, accompagnando lo pseudocodice con una lista dei nodi visitati (utile ad evitare di incappare all'interno di un ciclo).

In tal modo sarà possibile variare il tipo di visita semplicemente gestendo la struttura dati ospitante i nodi da visitare (FIFO, LIFO, ?).

Complessità ed Algoritmi e Strutture Dati

Indice

Complessità

Complessità

Complessità

Complessità

Complessità

Complessità

Complessità

Puntatori

Puntatori

Puntatori

Puntatori

Puntatori

Array

Array

LinkedList

DoubleLinkedList

SkipList

Liste

Code

Code

Pile

Pile

Dizionari

Hash

HashTable

Alberi

Alberi

Alberi

Alberi

Alberi

Grafi

Grafi

Grafi

Grazie per l'attenzione!

Complessità ed Algoritmi e Strutture Dati

Complessità ed Algoritmi e Strutture Dati

Andrea Iuliano

Complessità ed Algoritmi e Strutture Dati

Indice

Complessità

Complessità

Complessità

Complessità

Complessità

Complessità

Complessità

Puntatori

Puntatori

Puntatori

Puntatori

Puntatori

Array

Array

LinkedList

DoubleLinkedList

SkipList

Liste

Code

Code

Pile

Pile

Dizionari

Hash

HashTable

Alberi

Alberi

Alberi

Alberi

Alberi

Grafi

Grafi

Grafi

Grazie per l'attenzione!

Complessità ed Algoritmi e Strutture Dati

More from Andrea Iuliano