menu
arrow_back

データ結合における問題のトラブルシューティングと解決

データ結合における問題のトラブルシューティングと解決

時間 5クレジット

GSP412

Google Cloud セルフペース ラボ

概要

BigQuery は、Google が低料金で提供する NoOps のフルマネージド分析データベースです。Google による一貫管理が行われ、インフラストラクチャの管理やデータベース管理者の設置など、お客様による管理運用の必要がないため、有用な情報取得のためのデータ分析に専念できます。BigQuery は SQL を使用しており、従量課金制モデルでも利用できます。

データテーブルを結合すると、データセットに関する有用な情報を取得できます。ただし、データを結合する際のよくある問題によって、不適切な結果が取得される場合があります。このラボでは、このような問題を回避する方法について詳しく学習します。 結合のタイプ:

  • クロス結合: 1 つ目のデータセットの各行と 2 つ目のデータセットの各行が結合され、すべての組み合わせが出力されます。
  • 内部結合: 結果テーブルにレコードを表示するには、両方のテーブルにキー値が存在する必要があります。両方のテーブルでキー値が一致している場合のみ、結合されてレコードが表示されます。
  • 左結合: 左側のテーブルの各行が結果に表示されます。一致するレコードが右側のテーブルにあるかどうかは問いません。
  • 右結合: 左結合の逆です。右側のテーブルの各行が結果に表示されます。一致するレコードが左側のテーブルにあるかどうかは問いません。

結合について詳しくは、結合ページをご覧ください。

ここでは、e コマースのデータセットを使用します。このデータセットには、Google Merchandise Store に関する数百万件の Google アナリティクスのレコードが含まれており、BigQuery に読み込まれています。このラボではこのデータセットのコピーを使用して、使用可能なフィールドや行からどのような分析情報が得られるのかを確認します。

クエリを理解、更新するために役立つ構文の情報については、標準 SQL クエリ構文をご覧ください。

演習内容

このラボでは、以下のタスクを実行します。

  • BigQuery を使用してデータセットを確認する

  • データセット内の重複する行のトラブルシューティングを行う

  • データテーブルを結合する

  • 結合の各タイプについて理解する

Join Qwiklabs to read the rest of this lab...and more!

  • Get temporary access to the Google Cloud Console.
  • Over 200 labs from beginner to advanced levels.
  • Bite-sized so you can learn at your own pace.
Join to Start This Lab
home
ホーム
school
カタログ
menu
もっと見る
もっと見る