menu
arrow_back

Procesamiento distribuido de imágenes en Cloud Dataproc

—/30

Checkpoints

arrow_forward

Create a development machine in Compute Engine

Install Software in the development machine

Create a GCS bucket

Download some sample images into your bucket

Create a Cloud Dataproc cluster

Submit your job to Cloud Dataproc

Procesamiento distribuido de imágenes en Cloud Dataproc

1 hora 7 créditos

GSP010

Labs de autoaprendizaje de Google Cloud

Descripción general

En este lab práctico, aprenderá a usar Apache Spark en Cloud Dataproc para distribuir una tarea de procesamiento de imágenes intensiva desde un punto de vista informático en un clúster de máquinas. Este lab es parte de una serie de labs sobre procesamiento de datos científicos.

Qué aprenderá

  • Cómo crear un clúster de Cloud Dataproc administrado con Apache Spark preinstalado

  • Cómo compilar y ejecutar trabajos que usan paquetes externos aún no instalados en su clúster

  • Cómo cerrar su clúster

Requisitos previos

Este es un lab de nivel avanzado. Se recomienda estar familiarizado con Cloud Dataproc y Apache Spark, aunque no es obligatorio. Si desea ponerse al día con estos servicios, asegúrese de consultar los siguientes labs:

Cuando esté listo, desplácese hacia abajo para obtener más información sobre los servicios que usará en este lab.

Únase a Qwiklabs para leer este lab completo… y mucho más.

  • Obtenga acceso temporal a Google Cloud Console.
  • Más de 200 labs para principiantes y niveles avanzados.
  • El contenido se presenta de a poco para que pueda aprender a su propio ritmo.
Únase para comenzar este lab