menu
arrow_back

Résolution des problèmes et évitement des pièges liés à la jointure des données

Résolution des problèmes et évitement des pièges liés à la jointure des données

1 heure 5 crédits

GSP412

Google Cloud – Ateliers adaptés au rythme de chacun

Aperçu

BigQuery est la base de données d'analyse à faible coût de Google, entièrement gérée et qui ne nécessite aucune opération (NoOps). Avec BigQuery, vous pouvez interroger plusieurs téraoctets de données sans avoir à gérer d'infrastructure ni faire appel à un administrateur de base de données. Basé sur le langage SQL et le modèle de facturation à l'utilisation, BigQuery vous permet de vous concentrer sur l'analyse des données pour en dégager des informations pertinentes.

La jointure des tables de données peut vous fournir des renseignements très utiles sur votre ensemble de données. Toutefois, lorsque vous joignez des données, il se peut que vous vous heurtiez à des pièges courants qui peuvent altérer vos résultats. Cet atelier a pour objectif de vous apprendre à éviter ces pièges. Voici tout d'abord les types de jointures :

  • Jointure croisée : elle combine chaque ligne du premier ensemble de données avec chaque ligne du deuxième ensemble de données, où toutes les combinaisons sont représentées dans les résultats.
  • Jointure interne : elle nécessite la présence de valeurs de clé dans les deux tables pour que les enregistrements apparaissent dans la table de résultats. Les enregistrements n'apparaissent dans la fusion que s'il existe des correspondances dans les deux tables pour les valeurs de clé.
  • Jointure gauche : chaque ligne de la table de gauche apparaît dans les résultats, que la table de droite contienne ou non des correspondances.
  • Jointure droite : l'inverse d'une jointure gauche. Chaque ligne de la table de droite apparaît dans les résultats, que la table de gauche contienne ou non des correspondances.

Pour en savoir plus sur les jointures, reportez-vous à la page Jointure.

Vous utiliserez un ensemble de données d'e-commerce comprenant des millions d'enregistrements Google Analytics relatifs au Google Merchandise Store, chargé dans BigQuery. Pour cet atelier, vous disposez d'une copie de cet ensemble de données. Vous allez explorer les champs et les lignes qu'il contient afin d'obtenir des renseignements.

Pour en savoir plus sur la syntaxe permettant de suivre et de mettre à jour vos requêtes, consultez la section Syntaxe de requête SQL standard.

Objectifs de l'atelier

Dans cet atelier, vous allez :

  • utiliser BigQuery pour explorer un ensemble jeu de données ;

  • résoudre les problèmes de lignes en double dans un ensemble de données ;

  • créer des jointures entre les tables de données ;

  • comprendre chaque type de jointure.

Inscrivez-vous sur Qwiklabs pour consulter le reste de cet atelier, et bien plus encore.

  • Obtenez un accès temporaire à Google Cloud Console.
  • Plus de 200 ateliers, du niveau débutant jusqu'au niveau expert.
  • Fractionné pour vous permettre d'apprendre à votre rythme.
Inscrivez-vous pour démarrer cet atelier
Note

—/100

Create a new dataset

Réaliser l'étape

/ 25

Identify a key field in your ecommerce dataset

Réaliser l'étape

/ 25

Pitfall: non-unique key

Réaliser l'étape

/ 25

Join pitfall solution

Réaliser l'étape

/ 25