Apache spark

Dev back

Tester son script Apache Spark avec pytest

Cet article présente comment tester un script Apache Spark en utilisant pytest. Il explique l'installation de pytest, la réorganisation du code pour faciliter les tests, et la mise en place de tests unitaires pour valider le fonctionnement d'un traitement de données. L'auteur décrit le processus d'écriture de tests, la gestion des dépendances et la correction des erreurs dans le code. À la fin, il souligne l'importance des tests pour assurer la qualité du code avant sa mise en production.

Fullstack

Démarrer avec Apache Spark étape par étape

Cet article présente un guide étape par étape pour démarrer avec Apache Spark, en se concentrant sur la création d'un pipeline ETL. Il décrit les étapes de récupération de données, d'installation d'Apache Spark, de création d'une session Spark, de lecture et de transformation des données, et enfin de stockage des résultats au format parquet. L'article vise à aider les utilisateurs, notamment ceux qui travaillent avec des données de comptage de vélo, à comprendre comment utiliser Spark pour extraire, transformer et charger des données.