Condividi

SMART Cloud #2 • Data Analytics

con Gaetano Fabiano

  • mar 12 ottobre 2021
  • 18:45
  • Online

L'evento è terminato ma puoi sempre rivedere la registrazione video 😉

❰❰❰ Data Analytics con Apache Spark ❱❱❱

con Gaetano Fabiano

Apache Spark è un framework open-source per l’analisi di grandi quantità di dati su cluster e per il calcolo distribuito in memory rilasciato e mantenuto dall’Apache Software Foundation.

Apache Spark è in grado di affrontare molte delle questioni che riguardano la gestione dei Big Data perché offre processi di elaborazione parallela in memory che permettono di restituire i risultati in tempi molto più brevi di qualsiasi altra tipologia di approccio che necessita di continue letture e scritture sul disco.

Apache Spark trova sempre più spazio all’interno di aziende di piccole e grandi dimensioni in svariati settori: delle analisi predittive, all’internet delle cose, passando per i sistemi di recommendation ed analisi di logs per la definizione di sistemi predittivi e descrittivi.

Big tech powerhouses companies come, Yahoo, eBay e Netflix utilizzano Spark su vasta scala, elaborando diversi petabyte di dati su cluster di oltre 8.000 nodi.

Il webinar ha lo scopo di mostrare come funziona Spark: i meccanismi, le logiche, l’utilizzo su cluster e lo sviluppo mediante APIs.

Il webinar non si basa sul solo trasferimento nozionistico-teorico, ma vuole illustrare i concetti principali mediante esempi di codice e demo simulando un reale ambiente cluster, multi-node container based.

  • Introduzione ad Apache Spark – Storia di Spark, funzionamento e differenze con altri tipi di approcci.
  • Funzionamento generale di Apache Spark – RDD e DAG.
  • Spark nell’ecosistema Big Data – Come si colloca Spark nell’ecosistema Hadoop e nello scenario big data.
  • Caratteristiche di Spark – In memory, fault tolerant, cost efficient, Lazy evaluation, riusabilità, supporto multi linguaggio, real time processing.
  • Componenti di Spark – Breve illustrazione dei componenti di Spark.
  • Demo session – Data Pipeline con stream di dati collegato ad un social network, prelievo di contenuti ed analisi del testo con strumenti di Natural Language Processing.

Attestato di partecipazione

Tutti coloro che parteciperanno alla diretta – e "firmeranno" il registro di presenza :-) – riceveranno il giorno successivo l'attestato di partecipazione!

Agenda

SMART Cloud #2 • Data Analytics

  • 18.45 Benvenuto Innocenzo Sansone & OVHcloud
  • 18.55 Data Analytics con Apache Spark Gaetano Fabiano
  • 19.55 Quiz e Lottery 🏆🏅

Quiz e Lottery finale

Alla fine dell'incontro potrai metterti alla prova insieme agli altri partecipanti con alcune domande sui talk che avrai appena seguito e partecipare alla Lottery con un tuo selfie! Ci saranno tante sorprese ;-)

Entra a far parte della Community

Partecipa ai tech meetup ed entra nella Community SMART Cloud per ricevere formazione gratuita e restare in contatto con gli speaker, le aziende e tutti gli altri partecipanti interessati ai temi del Cloud!

Ti sei perso i meetup precedenti?

Corri a guardarli qui ➙ I meetup precedenti di SMART Cloud su YouTube

Cosa intendiamo per SMART Cloud?!

  • Semplice: sicurezza, manutenzione e aggiornamenti gestiti.
  • Multilocale: datacenter dislocati nel mondo e mantenuti da team locali per garantire la sicurezza dei dati e il rispetto delle normative vigenti.
  • Accessibile: una vasta gamma di soluzioni a tariffe competitive e trasparenti, per una tecnologia alla portata di tutti.
  • Reversibile: interoperabilità ed ecosistema aperto in cui gli utenti mantengono il controllo su tecnologie e piattaforme.
  • Trasparente: informazioni chiare relativamente a tariffe, servizi e opzioni.

OVHcloud

OVHcloud è un attore globale e il principale provider europeo di servizi cloud che gestisce 400.000 server all’interno dei propri 30 data center in 4 contenti. Da 20 anni il Gruppo fa leva su un modello integrato che fornisce il pieno controllo della catena di valore, dalla progettazione dei server alla gestione dei data center fino all’orchestrazione della rete in fibra ottica. Questo approccio unico consente a OVHcloud di coprire, in modo indipendente, l’intero spettro di casi d’uso per i suoi 1.6 milioni di clienti in 140 paesi. OVHcloud ora offre ai clienti soluzioni di ultima generazione che combinano prestazioni elevate, prezzi prevedibili e piena sovranità dei dati per supportare la loro crescita illimitata.

Innocenzo Sansone – Tech & Dev Community Engagement

Sono un libero professionista che supporta le aziende nella creazione e crescita della propria Community. Il mio ambito è principalmente quello tecnologico, essendo uno sviluppatore e appassionato di tecnologia e avendo collaborato con le principali aziende italiane e multinazionali del settore.

Gaetano Fabiano

Gaetano Fabiano, appassionato di innovazione, tecnologie e scienze in ambito Big Data, Data Science, Artificial Intelligence e Machine Learning.

Attualmente docente di Informatica, speaker e formatore per diverse realtà aziendali, writer di articoli tecnici e freelancer consultant in ambito di trasformazione digitale.

Consulenze importanti nello sviluppo software con aziende multinazionali nel settore della digital transformation presso clienti di importanti dimensioni.

Esperienza significativa presso una Start-Up innovativa, Spin-off del CNR, dal 2012 al 2017 in attività di progettazione e sviluppo in ambito di Applicazioni Enterprise nel settore dei Big Data e Data Science per diversi progetti, e PoC, per clienti nazionali ed internazionali. Coinvolto in processi decisionali di rilevata importanza operativa e strategica.

Nel 2017 assegnista di ricerca su tematiche di Cognitive Computing e Deep Learning presso l'Università di Firenze (Laboratorio LENS).

Docente universitario per la parte laboratoriale del corso di Business intelligence and analytics – Data Waterhouse, corso di Laurea Specialistica in Informatica dell'Università della Calabria per gli A/A 2015/16 e 2016/17.

Laurea Specialistica in Informatica, anno 2012.

Master post universitario (1950 ore) presso il CC ICT-SUD in collaborazione con l'ICAR/CNR ed il DEIS dell’Università della Calabria per la figura di “Ricercatore Industriale" A/A 2009/10.

Nel 2009 periodo di sei mesi di studio all'estero presso il Technische Universiteit Eindhoven nei Paesi Bassi seguendo i corsi di Data Mining, Web Technologies, Advanced Database, Advanced Computer Graphics e Interactive Virtual Environment.

Quasi dieci anni di consulenza nel settore della Business Inteligence, nel trattamento, trasformazioni e migrazione di grandi quantità di dati e attività nello sviluppo e progettazione software.

In possesso di diverse certificazioni in ambito IT, tra cui DataStax Certified Cassandra Developer (DSCCD), presso Cassandra Europe Summit di Londra, anno 2013 e JAVA-OCA nel 2018. Oltre ad abilitazione all’Albo professionale degli Ingegneri Settore Informazione della provincia di Cosenza, anno 2014 e abilitazione all'insegnamento in discipline Informatiche e Scienze e tecnologie informatiche, anno 2015.

Evento organizzato da

Ospitato su

Powered by

In collaborazione con