A Matera la Summer School sulla trattazione dei “Big Data”

Dal 15 al 20 giugno l’evento formativo internazionale

lunedì 15 giugno 2015 13.02
A cura di Marco Delli Noci
L'Università degli Studi della Basilicata ospita un evento formativo di caratura internazionale, a Matera dal 15 al 20 giugno, nella sede di via A. M. di Francia. Si tratta della Summer School dal titolo "Spatio-Temporal analysis and BigData processing using free and open source software" che il Dicem (il dipartimento delle Culture Europee e del Mediterraneo dell'Università della Basilicata) ha organizzato in collaborazione con Spatial Ecology, e la Yale University. Al momento di formazione parteciperanno iscritti da ogni parte del mondo sulla gestione e sul trattamento dei "BigData".

Attualmente si registra una vasta gamma di disponibilità di dati, in particolare di tipo geografici, raccolti da satelliti, sonde marine, sensori distribuiti sul territorio, stazioni meteorologiche, telefonini e altro. E questo anche grazie ai nuovi paradigmi tecnologici quali l'Internet of Things dove miriadi di sensori comunicano attraverso internet e descrivono una mappatura del mondo elettronico, rappresentativo di quello reale, dando un'identità elettronica alle cose e ai luoghi dell'ambiente fisico. Come risultato, ogni giorno si creano 2.5 trilioni (1018) di bytes di dati ed il 90% dei dati disponibili oggi, sono stati creati nei soli ultimi due anni (fonte Ibm 2015).

L'evento è il risultato di una collaborazione tra Spatial Ecology, Yale University e l'Università degli studi della Basilicata a Matera. Spatial Ecology è un'organizzazione non profit fondata da due ricercatori Italiani (Giuseppe Amatulli – Yale University e Stefano Casalegno University of Exeter) che sponsorizza lo sviluppo, la distribuzione e l'educazione all'uso di tecnologie open source per il processamento dei dati ambientali e in senso largo ai campi emergenti di Data Science e BigData.

Questa enorme fonte di dati, i "Big Data" appunto, deve essere gestita per l'archiviazione, e successivamente per il suo processamento al fine di ricavarne conoscenza. Anche per lo studio ambientale, i BigData sono fondamentali per capire ad analizzare i processi di interazione uomo-terra.

La Summer school ha come obiettivo, quindi, quello di insegnare il trattamento di grandi moli di dati. I corsi si basano su macchine Linux e sull'insegnamento di diversi linguaggi di programmazione e scripting necessari al filtraggio, estrazione e analisi del dato geografico e non. Nel corso del training verranno affrontati anche i temi di modellazione di processi e modellizazione predittiva, riduzione degli errori, visualizzazione ed analisi dei risultati ed utilizzo di piattaforme di calcolo distribuito (Grid e Calcolo parallelo).

Nello specifico, il processamento dai dati verrà eseguito su ambienti virtuali Linux installati sui pc portatili dei partecipanti. Verranno anche dimostrati l'uso di cloud computing (grazie ai grants messi a disposizione da Amazon E2C a spatial-ecology) ed inoltre verrà per la prima volta utilizzato "Grappolo" un micro cluster computer portatile e low cost, funzionante esattamente come un supercomputer da mezzo milione di euro e concepito per l'insegnamento del "Grid computing".