CLDR-2 - CLOUDERA II - SPARK AND HADOOP DEVELOPER

INFORMAZIONI SUL CORSO

durata

Durata:

5 GIORNI
categoria

Categoria:

Cloudera
qualifica

Qualifica istruttore:

Docente Senior (min. 5 anni)
dedicato a

Dedicato a:

Sviluppatore
produttore

Produttore:

PCSNET

SCEGLI LA SEDE PER QUESTO CORSO

CORSO A CALENDARIO

Per vedere le informazioni relative al calendario del corso scegli prima una sede
sede
Sede: PCSNET Roma
prezzo
Prezzo: 1.950 € + IVA
Questo corso attualmente non ha date a Calendario e può essere erogato in forma dedicata.
Usa il box qui accanto per richiederne uno apposta per te!
sede
Sede: PCSNET Milano
prezzo
Prezzo: 1.950 € + IVA
Questo corso attualmente non ha date a Calendario e può essere erogato in forma dedicata.
Usa il box qui accanto per richiederne uno apposta per te!
sede
Sede: PCSNET NordEst
prezzo
Prezzo: 1.950 € + IVA
Questo corso attualmente non ha date a Calendario e può essere erogato in forma dedicata.
Usa il box qui accanto per richiederne uno apposta per te!
sede
Sede: PCSNET Torino
prezzo
Prezzo: 1.950 € + IVA
Questo corso attualmente non ha date a Calendario e può essere erogato in forma dedicata.
Usa il box qui accanto per richiederne uno apposta per te!
sede
Sede: PCSNET Emilia Romagna
prezzo
Prezzo: 1.950 € + IVA
Questo corso attualmente non ha date a Calendario e può essere erogato in forma dedicata.
Usa il box qui accanto per richiederne uno apposta per te!
sede
Sede: PCSNET Toscana
prezzo
Prezzo: 1.950 € + IVA
Questo corso attualmente non ha date a Calendario e può essere erogato in forma dedicata.
Usa il box qui accanto per richiederne uno apposta per te!
sede
Sede: PCSNET Marche
prezzo
Prezzo: 1.950 € + IVA
Questo corso attualmente non ha date a Calendario e può essere erogato in forma dedicata.
Usa il box qui accanto per richiederne uno apposta per te!
sede
Sede: PCSNet Umbria
prezzo
Prezzo: 1.950 € + IVA
Questo corso attualmente non ha date a Calendario e può essere erogato in forma dedicata.
Usa il box qui accanto per richiederne uno apposta per te!
sede
Sede: PCSNET Napoli
prezzo
Prezzo: 1.950 € + IVA
Questo corso attualmente non ha date a Calendario e può essere erogato in forma dedicata.
Usa il box qui accanto per richiederne uno apposta per te!
sede
Sede: PCSNET Sicilia
prezzo
Prezzo: 1.950 € + IVA
Questo corso attualmente non ha date a Calendario e può essere erogato in forma dedicata.
Usa il box qui accanto per richiederne uno apposta per te!

CORSO DEDICATO

Per avere informazioni sul corso dedicato compila il form e ti contatteremo

CORSO DEDICATO

Grazie per la tua richiesta, ti contatteremo al più presto.

OBIETTIVI

Al termine del corso gli allievi avranno acquisito tutti gli elementi necessari all'implementazione di piattaforme Big Data per l’analisi ed il processamento dei dati.

PREREQUISITI

  • Buona conoscenza della programmazione strutturata derivata dall’uso di un qualsiasi linguaggio di programmazione
  • Buona conoscenza dei database e del SQL
  • Buona conoscenza del sistema operativo Linux

CONTENUTI:

Data Ingestion

  • Essere in grado di trasferire i dati tra sistemi esterni ed il tuo cluster
  • Importare dati da Mysql dentro HDFS usando Sqoop
  • Esporta i dati su database Mysql usando Sqoop
  • Cambiare le strutture dei file durante gli import usando Sqoop
  • Fare ingestion dei dati dentro HDFS con streaming real-time e near real time
  • Processare streaming di dati come questi vengono caricati sul cluster
  • Caricare i dati dentro e fuori hdfs usando i comandi shell

 

Trasformare, memorizzare e strutturare i dati

  • Convertire un set di dati in un dato formato memorizzato in hdfs dentro un nuovo formato e scriverlo sempre in hdfs
  • Caricare i dati RDD da hdfs usando Spark
  • Scrivere i dati RDD in hdfs usando Spark

 

Leggere e scrivere file in vari modi

  • Performare flussi di estrazioni, trasformazioni e caricamento sui dati per fare Data Analysis
  • Usare SparkSQL per interagire con il metastore programmativamente nelle tue applicazioni
  • Capire i fondamenti di interrogare i dataset con Spark
  • Filtrare i dati usando Spark
  • Scrivere interrogazioni che creano statistiche di dati aggregati
  • Incrociare tipologie di database differenti usando Spark
  • Produrre dati ordinati e classificati

 

Configurazione

  • Usare opzioni su linea di comando per cambiare la tua configurazione
  • Come incrementare la memoria disponibile

 

Differenze tra Spark1 e Spark2

INFO

  • Manuale: Materiale didattico e relativo prezzo da concordare
  • Prezzo manuale: NON incluso nel prezzo del corso
  • Natura del corso: Operativo (previsti lab su PC)

PARTNERSHIP