menu
arrow_back

Data Catalog: Qwik Start

—/100

Checkpoints

arrow_forward

Create a dataset

Copy a public New York taxi table to your dataset

Create a tag template and attach the tag to your table

Data Catalog: Qwik Start

30 minutos 1 crédito

GSP729

Labs de autoaprendizaje de Google Cloud

Descripción general

Data Catalog es un servicio de administración de metadatos completamente administrado y escalable que permite a las organizaciones descubrir, comprender y gestionar todos sus datos con rapidez.

Ofrece una interfaz de búsqueda simple y fácil de usar para el descubrimiento de datos y un sistema de categorización flexible y potente que se usa para capturar metadatos técnicos y empresariales. Además, brinda una base sólida de seguridad y cumplimiento gracias a las integraciones en Cloud Data Loss Prevention (DLP) y Cloud Identity and Access Management (IAM).

Google BigQuery es un almacén de datos para empresas que permite realizar consultas de SQL de alta velocidad mediante la potencia de procesamiento de la infraestructura de Google.

Simplemente mueva sus datos a BigQuery y déjenos el trabajo duro a nosotros. Puede controlar el acceso al proyecto y a sus datos (por ejemplo, puede otorgar permisos de visualización o consulta de datos) según sus necesidades empresariales.

Use Data Catalog

Existen dos formas principales de interactuar con Data Catalog:

  • Buscar recursos de datos a los que tiene acceso

  • Etiquetar recursos con metadatos

Caso de uso de Data Catalog

Imagine que es el ingeniero de datos de su empresa. Su trabajo es garantizar que sus colegas, como los científicos de datos o los analistas de negocios, puedan descubrir y usar fácilmente todos los conjuntos de datos. Cuando ingresa un conjunto de datos nuevo, usted realiza anotaciones con información importante; por ejemplo, si contiene datos de PII o no, quién es el propietario del conjunto de datos, cuántas filas tiene, etcétera.

Puede anotar esta información si agrega etiquetas a sus conjuntos de datos y tablas. Data Catalog le permite crear plantillas de etiqueta para que defina qué tipo de atributos desea etiquetar. Esto le permite acceder, mapear y descubrir fácilmente la información pertinente de sus conjuntos de datos y tablas.

Qué aprenderá

En este lab, aprenderá a hacer lo siguiente:

  • Habilitar la API de Data Catalog para usar este servicio en su proyecto de Google Cloud

  • Crear un conjunto de datos con BigQuery

  • Copiar una tabla pública de taxis de Nueva York en su conjunto de datos

  • Crear una plantilla de etiquetas de Data Catalog

  • Etiquetar su tabla recién creada con las etiquetas nuevas que creó

Únase a Qwiklabs para leer este lab completo… y mucho más.

  • Obtenga acceso temporal a Google Cloud Console.
  • Más de 200 labs para principiantes y niveles avanzados.
  • El contenido se presenta de a poco para que pueda aprender a su propio ritmo.
Únase para comenzar este lab