menu
arrow_back

Data Catalog: Qwik Start

—/100

Checkpoints

arrow_forward

Create a dataset

Copy a public New York taxi table to your dataset

Create a tag template and attach the tag to your table

Data Catalog: Qwik Start

30 minutos 1 crédito

GSP729

Laboratórios autoguiados do Google Cloud

Visão geral

O Data Catalog é um serviço de gerenciamento de metadados completo e escalonável para as organizações descobrirem, compreenderem e gerenciarem rapidamente os dados.

Ele tem uma interface de pesquisa simples e fácil de usar para descoberta de dados, um sistema de catalogação flexível e avançado para capturar metadados técnicos e comerciais, além de uma base sólida de segurança e conformidade integrada à Prevenção contra perda de dados (DLP) e ao Cloud Identity and Access Management (IAM).

O Google BigQuery é um armazenamento de dados empresarial que usa a capacidade de processamento da infraestrutura do Google para permitir consultas SQL super-rápidas.

Basta você mover os dados para o BigQuery, e ele fará todo o trabalho. Controle o acesso ao projeto e aos dados conforme a necessidade da empresa, por exemplo, definindo quem tem permissão para visualizar ou consultar os dados.

Como usar o Data Catalog

Existem duas maneiras principais de interagir com o Data Catalog:

  • Pesquisar recursos de dados aos quais você tem acesso

  • Incluir tags em recursos com metadados

Caso de uso do Data Catalog

Imagine que você seja o engenheiro de dados da empresa. Seu trabalho é garantir que os colegas, como cientistas de dados ou analistas de negócios, descubram e usem facilmente todos os conjuntos de dados. Ao receber um novo conjunto de dados, você anota informações importantes, como o proprietário, o número de linhas que o conjunto contém, se há dados de PII etc.

Para isso, você adiciona tags aos conjuntos de dados e às tabelas. Com o Data Catalog, você cria modelos de tags para definir quais tipos de atributos serão marcados. Assim, você pode acessar, mapear e descobrir com facilidade informações pertinentes nos bancos de dados e nas tabelas.

Conteúdo do laboratório

Neste laboratório, você aprenderá a fazer o seguinte:

  • Ativar a API Data Catalog para usar esse serviço no seu projeto do Google Cloud

  • Criar um conjunto de dados com o BigQuery

  • Copiar uma tabela pública de tarifas de táxi de Nova York para seu conjunto de dados

  • Criar um modelo de tag do Data Catalog

  • Marcar a tabela com as tags recém-criadas

Participe do Qwiklabs para ler o restante deste laboratório e muito mais!

  • Receber acesso temporário a Console do Google Cloud.
  • Mais de 200 laboratórios, do nível iniciante ao avançado.
  • Tamanho compacto para que você possa aprender no seu próprio ritmo.
Participe para iniciar este laboratório