Formation Spark SQL

4.5/5
Note moyenne sur 4 567 formations

Formation Spark SQL

2 journées de formation pour maîtriser le module Spark pour le traitement des données structurées !

A l’issue de cette formation, les participants sont en mesure de réaliser des analyses de données avec Spark SQL. Ils maîtrisent l’installation et la configuration de l’outil, et sont en mesure de requêter et visualiser des jeux de données dans différents formats.

Prérequis

Une expérience dans l’utilisation des requêtes SQL, ainsi qu’en programmation.

Introduction à la formation Spark SQL

Présentation générale de la formation, objectifs et approche pédagogiques
Les différentes approches pour l’accès aux données avec Spark : Hive, bases de données…
Les fonctionnalités et l’architecture de Spark
Installer Spark et effectuer les configurations de base
Le module Spark SQL : fonctionnalités, intérêt et avantages par rapport à Hive
Principes de fonctionnement et architecture (Data Source API, DataFrameAPI, SQL Service…)

Requêtes, DataFrames et DataSets

Comprendre les DataFrames dans Spark
Le point de départ : SparkSession
Créer des DataFrames
Requêtes SQL de base
Vues temporaires
Créer des DataSets
Exécuter des agrégations, jointures et requêtes imbriquées

Requêtes sur différents types de données

Accéder aux données
Préparer les données
Schémas RDD
Requêter des fichiers JSON, Parquet, CSV…
Troubleshooting
Mise en cache In-Memory

Intra

Sur mesure

Image Formation

Disponible à distance

Réf.
SF33594

Durée : 2 jours

soit 14 heures de formation

4000,00 € HT

Image Formation

Disponible à distance

Réf.
SF33594

Durée : 2 jours

A partir de : 1400 € HT

Image Formation

Disponible à distance

Réf.
SF33594

Durée : 2 jours

soit 14 heures de formation

4000,00 € HT

Image Formation

Disponible à distance

Réf.
SF33594

Durée : 2 jours

soit 14 heures de formation

Image Formation

Disponible à distance

Réf.
SF33594

Durée : 2 jours

A partir de : 1400 € HT