Advanced 10 étapes 1 jour 60 crédits
Cette quête est la première d'une série de deux comprenant des ateliers pratiques tirés d'exercices disponibles dans l'ouvrage Data Science on Google Cloud Platform de Valliappa Lakshmanan, publié par O'Reilly Media, Inc. Dans cette première quête, qui couvre les chapitres 1 à 8, vous découvrez tous les aspects de l'ingestion, de la préparation, du traitement, de l'interrogation, de l'exploration et de la visualisation des ensembles de données à l'aide des outils et des services de Google Cloud Platform.
Prérequis :
This Quest assumes you have access to the O’Reilly book Data Science on the Google Cloud Platform as the labs only include the exercises from the end of each chapter and do not contain the concepts or teaching from the text itself. The labs use Google Cloud Services and Tools for data storage, transformation, and warehousing, so it is recommended that the student also has earned Badges for the Baseline: Data, ML, and AI and the GCP Essentials Quests before beginning.Quest Outline
Présentation de SQL pour BigQuery et Cloud SQL
Dans cet atelier, vous allez apprendre à utiliser les principales clauses SQL et vous entraîner à exécuter des requêtes structurées dans BigQuery et Cloud SQL.
Ingérer des données dans le cloud
Dans cet atelier, vous allez apprendre à utiliser un script bash pour télécharger des données à partir d'un vaste ensemble de données publiques disponible sur Internet.
Ingesting Data Into The Cloud Using Google Cloud Functions
This lab demonstrates how to use local Python scripts to retrieve data from the US Bureau of Transport Statistics website, then modify the data so they can be run using Google Cloud Functions.
Charger des données dans Google Cloud SQL
Dans cet atelier, vous allez importer des données dans Cloud SQL à partir de fichiers texte CSV et effectuer certaines analyses de données de base à l'aide de requêtes simples.
Visualiser des données avec Google Data Studio
Cet atelier explique comment visualiser des données stockées dans Google Cloud SQL à l'aide de Google Data Studio
Traiter des données avec Google Cloud Dataflow
Au cours de cet atelier, vous allez simuler un ensemble de données non fictives en temps réel à partir d'un ensemble de données d'historique. Cet ensemble de données simulé sera traité à partir d'un ensemble de fichiers texte à l'aide de Python et de Google Cloud Dataflow, et les données en temps réel simulées résultantes seront stockées dans Google BigQuery.
Visualiser des données géospatiales en temps réel avec Google Data Studio
Traitez un flux de données en temps réel à partir d'un véritable ensemble de données historiques en temps réel avec Google Dataflow, stockez les résultats dans Google BigQuery, puis visualisez des données géospatiales en temps réel avec Google Data Studio.
Charger des données dans BigQuery pour effectuer une analyse exploratoire
Vous allez apprendre à charger des données texte dans BigQuery et à les utiliser pour effectuer rapidement une analyse de données exploratoire à l'aide de notebooks Google Cloud Datalab.
Analyse exploratoire de données à l'aide d'AI Platform
Découvrez comment analyser un ensemble de données stocké dans BigQuery en exécutant des requêtes via AI Platform et apprenez à générer différents types de représentation statistique.
Évaluer un modèle de données
Découvrez le processus de partitionnement d'un ensemble de données en un ensemble d'entraînement servant à développer un modèle et en un ensemble de test servant à évaluer la précision du modèle, puis à évaluer indépendamment des modèles prédictifs, de manière reproductible.