Advanced 10 pasos 1 día 60 créditos
Esta es la primera de las dos Quests de labs prácticos derivada de los ejercicios del libro Data Science on Google Cloud Platform de Valliappa Lakshmanan, editado por O'Reilly Media, Inc. En esta primera Quest, en el capítulo 8, tiene la oportunidad de practicar todos los aspectos de la transferencia, la preparación, el procesamiento, las consultas, la exploración y la visualización de los conjuntos de datos con las herramientas y los servicios de Google Cloud Platform.
Requisitos previos:
This Quest assumes you have access to the O’Reilly book Data Science on the Google Cloud Platform as the labs only include the exercises from the end of each chapter and do not contain the concepts or teaching from the text itself. The labs use Google Cloud Services and Tools for data storage, transformation, and warehousing, so it is recommended that the student also has earned Badges for the Baseline: Data, ML, and AI and the GCP Essentials Quests before beginning.Quest Outline
Introducción a SQL para BigQuery y Cloud SQL
En este lab, aprenderá cláusulas importantes de SQL y practicará la ejecución de consultas estructuradas en BigQuery y Cloud SQL
Cómo transferir datos a Cloud
En este lab, aprenderá a usar una secuencia de comandos en Bash para descargar datos seleccionados de un conjunto de datos públicos grande que se encuentra disponible en Internet.
Ingesting Data Into The Cloud Using Google Cloud Functions
This lab demonstrates how to use local Python scripts to retrieve data from the US Bureau of Transport Statistics website, then modify the data so they can be run using Google Cloud Functions.
Cómo cargar datos en Google Cloud SQL
En este lab, importará datos desde archivos de texto CSV a Cloud SQL y, luego, llevará a cabo algunos análisis de datos básicos mediante consultas simples.
Cómo visualizar datos con Google Data Studio
En este lab, se demuestra cómo usar Google Data Studio para visualizar datos almacenados en Google Cloud SQL.
Cómo procesar datos con Google Cloud Dataflow
En este lab, simulará un conjunto de datos del mundo real en tiempo real a partir de un conjunto de datos históricos. Este conjunto de datos simulado se procesará a partir de un conjunto de archivos de texto con Python y Google Cloud DataFlow y los datos simulados en tiempo real resultantes se almacenarán en Google BigQuery.
Cómo visualizar datos geoespaciales en tiempo real con Google Data Studio
Use Google Dataflow para procesar datos de transmisión en tiempo real de un conjunto de datos históricos del mundo en tiempo real. Luego, almacene los resultados en Google BigQuery y use Google Data Studio para visualizar datos geoespaciales en tiempo real.
Cómo cargar datos en BigQuery para realizar análisis exploratorios de datos
Aprenderá a cargar datos de texto en BigQuery y, luego, los usará para realizar análisis exploratorios rápidos de datos con notebooks de Google Cloud Datalab.
Análisis exploratorios de datos con AI Platform
Aprenda el proceso para analizar un conjunto de datos almacenado en BigQuery mediante AI Platform a fin de realizar consultas y presentar datos utilizando varias técnicas estadísticas de trazado de datos.
Cómo evaluar un modelo de datos
Aprenda el proceso de partición de un conjunto de datos en un conjunto de entrenamiento que se usará para desarrollar un modelo y en un conjunto de prueba que puede usarse para evaluar la exactitud del modelo. Luego, evalúe los modelos predictivos de manera independiente y repetible.