Durée : 2 jours
Aucune session disponible.
« * » indique les champs nécessaires
« * » indique les champs nécessaires
Objectifs
Public et prérequis
Programme
Présentation générale de la formation, objectifs et approche pédagogiques
Les différentes approches pour l’accès aux données avec Spark : Hive, bases de données…
Les fonctionnalités et l’architecture de Spark
Installer Spark et effectuer les configurations de base
Le module Spark SQL : fonctionnalités, intérêt et avantages par rapport à Hive
Principes de fonctionnement et architecture (Data Source API, DataFrameAPI, SQL Service…)
Comprendre les DataFrames dans Spark
Le point de départ : SparkSession
Créer des DataFrames
Requêtes SQL de base
Vues temporaires
Créer des DataSets
Exécuter des agrégations, jointures et requêtes imbriquées
Accéder aux données
Préparer les données
Schémas RDD
Requêter des fichiers JSON, Parquet, CSV…
Troubleshooting
Mise en cache In-Memory
Intra
Sur mesure
Disponible à distance
Durée : 2 jours
soit 14 heures de formation
4000,00 € HT
Disponible à distance
Durée : 2 jours
A partir de : 1400 € HT
Disponible à distance
Durée : 2 jours
soit 14 heures de formation
4000,00 € HT
Disponible à distance
Durée : 2 jours
soit 14 heures de formation
Disponible à distance
Durée : 2 jours
A partir de : 1400 € HT

Référence : SF33429
À partir de 1400 € HT
2 jours

Référence : SF33063
À partir de 1950 € HT
3 jours

Référence : SF33355
À partir de 1800 € HT
3 jours