Big Data on AWS

5 Steps 6時間 51クレジット

Scientists, developers, and other technologists from many different industries are taking advantage of AWS to perform big data analytics and meet the challenges of the increasing volume, variety, and velocity of digital information. AWS offers a portfolio of cloud computing services to help you manage big data by reducing costs, scaling to meet demand, and increasing the speed of innovation. In this quest, you’ll learn to work with advanced services for Big Data.


This quest is designed to teach you how to work with AWS services to perform big data analytics on the cloud.

Quest Outline


Working with Amazon Redshift(日本語版)

このラボでは、クラスターの作成、データのロード、クエリの実行、パフォーマンスのモニタリングなど、Amazon RedShift の使い方をデモンストレーションします。注: このラボの一環で、無料の SQL クライアントをダウンロードします。

English 日本語 简体中文

Exploring Google Ngrams with Amazon EMR(日本語版)

このラボでは、ビッグデータを処理するための Amazon Elastic MapReduce (EMR) クラスターを起動し、Hive と SQL スタイルのクエリを併用してデータを分析する方法について説明します。Amazon EMR を使用して小さな Hadoop クラスターを作成し、Amazon S3 に保存されているデータに対してインタラクティブな Hive クエリを実行できるようにします。また、Hive を使用して有用性の高い方法でデータを標準化します。さらに、有益な結果でテーブルを生成し、それを Amazon S3 に保存して、クラスター上で実行される他のジョブに再利用することにも取り組みます。

English 日本語

Analyze Big Data with Hadoop

In this lab, you will deploy a fully functional Hadoop cluster, ready to analyze log data in just a few minutes. You will start by launching an Amazon EMR cluster and then use a HiveQL script to process sample log data stored in an Amazon S3 bucket. HiveQL is a SQL-like scripting language for data warehousing and analysis. You can then use a similar setup to analyze your own log files.


warning Advanced Amazon Redshift: Table Layout and Schema Design

In this lab, you will take a close look at different types of table layout and schema design. You will create tables using various methods for data compression and distribution, and analyze which methods work best, including incorporating Amazon Redshift recommendations. You will conclude the lab by building five different versions of the same table, and analyzing how the differences impact storage requirements and query performance. Pre-requisites: To successfully complete this lab, you should be familiar with Redshift concepts. Knowledge of SQL programming is required, although full solution code is provided.


warning Advanced Amazon Redshift: Data Loading (日本語版)

このラボでは、Amazon Redshift を使用して、さまざまな方法でデータのロードを実験し、これらの方法を比較します。ここでは、テーブルの作成、S3 および Amazon Data Pipeline を使用したデータのロード、リモートホストからのロード、およびデータロードエラーのトラブルシューティングの実習を行います。ラボの最後には、クリーンアップ手順を実習します。前提条件: Redshift およびデータベースの基本的な概念を理解している必要があります。 で入門ラボ、「Introduction to Amazon Redshift」を修了している必要があります。SQL 文および JSON フォーマットの知識が必要です。ただし、ソリューションコードはすべて提供されます。記載されているとおりにラボを利用するために、自動で割り当てられているリージョンを変更しないでください。

English 日本語

Enroll Now

Enroll in this quest to track your progress toward earning a badge.