menu
arrow_back

Probleme beim Zusammenführen von Daten beheben

Probleme beim Zusammenführen von Daten beheben

Hours 5 Credits

GSP412

Google Cloud-Labs zum selbstbestimmten Lernen

Übersicht

BigQuery ist eine vollständig verwaltete, kostengünstige NoOps-Analysedatenbank von Google. Mit diesem Tool können Sie mehrere Terabyte an Daten abfragen und müssen dabei weder eine Infrastruktur verwalten, noch benötigen Sie einen Datenbankadministrator. BigQuery basiert auf SQL und die Abrechnung erfolgt nach dem "Pay as you go"-Modell. Mithilfe von BigQuery können Sie sich auf die Datenanalyse konzentrieren und wichtige Informationen erhalten.

Durch das Zusammenführen von Datentabellen können Sie wichtige Einblicke in Ihr Dataset gewinnen. Es gibt jedoch einige häufige Fehler, die beim Erstellen eines Joins auftreten können und die Ihre Ergebnisse möglicherweise unbrauchbar machen. Im Rahmen dieses Labs erfahren Sie, wie Sie dies umgehen. Es gibt folgende Join-Typen:

  • Cross Join: Hierbei wird jede Zeile des ersten Datasets mit jeder Zeile des zweiten Datasets kombiniert und jede Kombination wird in der Ausgabe dargestellt.
  • Inner Join: Bei diesem Typ sind Schlüsselwerte in beiden Tabellen erforderlich, damit die Einträge in der Ergebnistabelle angezeigt werden. Einträge werden in der Zusammenführung nur angezeigt, wenn für die Schlüsselwerte Übereinstimmungen in beiden Tabellen vorhanden sind.
  • Left Join: Jede Zeile in der linken Tabelle wird in den Ergebnissen angezeigt, unabhängig davon, ob Übereinstimmungen in der rechten Tabelle vorliegen.
  • Right Join: Dies ist die Umkehrung eines Left Joins. Jede Zeile in der rechten Tabelle wird in den Ergebnissen angezeigt, unabhängig davon, ob in der linken Tabelle Übereinstimmungen vorliegen.

Weitere Informationen zu Joins finden Sie im Artikel zur Seite "Join".

Das von Ihnen verwendete Dataset ist ein E-Commerce-Dataset, das Millionen von Google Analytics-Einträgen für den Google Merchandise Store in BigQuery enthält. Für dieses Lab steht Ihnen eine Kopie dieses Datasets zur Verfügung. Anhand der verfügbaren Felder und Zeilen werden Sie neue Informationen gewinnen.

Informationen zur Syntax, die Ihnen dabei helfen, die Abfragen nachzuvollziehen und zu aktualisieren, finden Sie unter Standard-SQL-Abfragesyntax.

Aufgaben

Aufgaben in diesem Lab:

  • Ein Dataset mithilfe von BigQuery untersuchen

  • Doppelte Zeilen aus einem Dataset entfernen

  • Joins von Datentabellen erstellen

  • Alle Join-Typen verstehen

Join Qwiklabs to read the rest of this lab...and more!

  • Get temporary access to the Google Cloud Console.
  • Over 200 labs from beginner to advanced levels.
  • Bite-sized so you can learn at your own pace.
Join to Start This Lab