Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Si vous voyez une étape de longue durée avec une seule tâche, c’est probablement un signe d’un problème. Pendant que cette unique tâche s'exécute, un seul processeur est utilisé et le reste du cluster peut être inactif. Cela se produit le plus fréquemment dans les situations suivantes :
- UDF coûteuse sur de petites données
-
Fonction de fenêtre sans instruction
PARTITION BY - Lecture à partir d’un type de fichier non fractionnable. Cela signifie que le fichier ne peut pas être lu en plusieurs parties, ce qui entraîne l'exécution d'une seule grande tâche. Gzip est un exemple de type de fichier non fractionnable.
- Définition de l’option
multiLinelors de la lecture d’un fichier JSON ou CSV - Inférence de schéma d’un fichier volumineux
- Utilisation de repartition(1) ou coalesce(1)