arrow_back

Caricamento dei dati in Google Cloud SQL

Partecipa Accedi
Test and share your knowledge with our community!
done
Get access to over 700 hands-on labs, skill badges, and courses

Caricamento dei dati in Google Cloud SQL

Lab 1 ora universal_currency_alt 5 crediti show_chart Intermedio
Test and share your knowledge with our community!
done
Get access to over 700 hands-on labs, skill badges, and courses

GSP196

Laboratori autogestiti Google Cloud

Panoramica

In questo lab importerai i dati da file di testo CSV in Cloud SQL ed eseguirai quindi analisi di base dei dati utilizzando semplici query.

Per questo lab viene utilizzato un set di dati dell'US Bureau of Transport Statistics che contiene i dati storici dei voli interni degli Stati Uniti. Il set di dati si può utilizzare per dimostrare una vasta gamma di concetti e tecniche di data science e si utilizza in tutti i lab della Quest Data Science on Google Cloud Platform.

Obiettivi

  • Creare un'istanza di Cloud SQL
  • Creare un database Cloud SQL
  • Importare dati di testo in Cloud SQL
  • Creare un modello di dati iniziale utilizzando le query

Configurazione e requisiti

Prima di fare clic sul pulsante Avvia lab

Leggi le seguenti istruzioni. I lab sono a tempo e non possono essere messi in pausa. Il timer si avvia quando fai clic su Avvia lab e ti mostra per quanto tempo avrai a disposizione le risorse Google Cloud.

Con questo lab pratico avrai la possibilità di completare le attività in prima persona, in un ambiente cloud reale e non di simulazione o demo. Riceverai delle nuove credenziali temporanee che potrai utilizzare per accedere a Google Cloud per la durata del lab.

Per completare il lab, avrai bisogno di:

  • Accesso a un browser internet standard (Chrome è il browser consigliato).
Nota: utilizza una finestra del browser in incognito o privata per eseguire questo lab. Ciò evita eventuali conflitti tra il tuo account personale e l'account Studente, che potrebbero causare addebiti aggiuntivi sul tuo account personale.
  • È ora di completare il lab: ricorda che, una volta iniziato, non puoi metterlo in pausa.
Nota: se hai già un account o un progetto Google Cloud personale, non utilizzarlo per questo lab per evitare addebiti aggiuntivi al tuo account.

Come avviare il lab e accedere alla console Google Cloud

  1. Fai clic sul pulsante Avvia lab. Se devi effettuare il pagamento per il lab, si apre una finestra popup per permetterti di selezionare il metodo di pagamento. A sinistra, trovi il riquadro Dettagli lab con le seguenti informazioni:

    • Pulsante Apri console Google
    • Tempo rimanente
    • Credenziali temporanee da utilizzare per il lab
    • Altre informazioni per seguire questo lab, se necessario
  2. Fai clic su Apri console Google. Il lab avvia le risorse e apre un'altra scheda con la pagina di accesso.

    Suggerimento: disponi le schede in finestre separate posizionate fianco a fianco.

    Note: se visualizzi la finestra di dialogo Scegli un account, fai clic su Utilizza un altro account.
  3. Se necessario, copia il Nome utente dal riquadro Dettagli lab e incollalo nella finestra di dialogo di accesso. Fai clic su Avanti.

  4. Copia la Password dal riquadro Dettagli lab e incollala nella finestra di dialogo di benvenuto. Fai clic su Avanti.

    Importante: devi utilizzare le credenziali presenti nel riquadro di sinistra. Non utilizzare le tue credenziali Google Cloud Skills Boost. Nota: utilizzare il tuo account Google Cloud per questo lab potrebbe comportare addebiti aggiuntivi.
  5. Fai clic nelle pagine successive:

    • Accetta i termini e le condizioni.
    • Non inserire opzioni di recupero o l'autenticazione a due fattori, perché si tratta di un account temporaneo.
    • Non registrarti per le prove gratuite.

Dopo qualche istante, la console Google Cloud si apre in questa scheda.

Nota: puoi visualizzare il menu con un elenco di prodotti e servizi Google Cloud facendo clic sul menu di navigazione in alto a sinistra. Icona menu di navigazione

Attiva Cloud Shell

Cloud Shell è una macchina virtuale in cui sono caricati strumenti per sviluppatori. Offre una home directory permanente da 5 GB e viene eseguita su Google Cloud. Cloud Shell fornisce l'accesso da riga di comando alle risorse Google Cloud.

  1. Fai clic su Attiva Cloud Shell Icona Attiva Cloud Shell nella parte superiore della console Google Cloud.

Quando la connessione è attiva, l'autenticazione è già avvenuta e il progetto è impostato sul tuo PROJECT_ID. L'output contiene una riga che dichiara il PROJECT_ID per questa sessione:

Your Cloud Platform project in this session is set to YOUR_PROJECT_ID

gcloud è lo strumento a riga di comando di Google Cloud. È preinstallato su Cloud Shell e supporta il completamento tramite tasto Tab.

  1. (Facoltativo) Puoi visualizzare il nome dell'account attivo con questo comando:
gcloud auth list
  1. Fai clic su Autorizza.

  2. L'output dovrebbe avere ora il seguente aspetto:

Output:

ACTIVE: * ACCOUNT: student-01-xxxxxxxxxxxx@qwiklabs.net To set the active account, run: $ gcloud config set account `ACCOUNT`
  1. (Facoltativo) Puoi elencare l'ID progetto con questo comando:
gcloud config list project

Output:

[core] project = <project_ID>

Output di esempio:

[core] project = qwiklabs-gcp-44776a13dea667a6 Nota: per la documentazione completa di gcloud, in Google Cloud, fai riferimento alla Panoramica dell'interfaccia a riga di comando gcloud.

Attività 1: prepara l'ambiente

Questo lab utilizza un set di esempi di codice e script sviluppati per il libro Data Science on Google Cloud Platform, 2nd Edition edito da O'Reilly Media, Inc. e tratta le attività di configurazione di Google Cloud SQL e di importazione di dati descritte nella prima parte del capitolo 3 "Creating Compelling Dashboards". Dovrai clonare da GitHub a Cloud Shell il repository di esempio utilizzato nel capitolo 2 ed eseguire da lì tutte le attività del lab.

Clona la data science sul repository di Google Cloud

  1. Inserisci i comandi seguenti in Cloud Shell per clonare il repository:
git clone \ https://github.com/GoogleCloudPlatform/data-science-on-gcp/
  1. Cambia la directory del repository:
cd data-science-on-gcp/03_sqlstudio
  1. Crea le variabili di ambiente che saranno utilizzate più avanti nel lab per il tuo ID progetto e il bucket di archiviazione che conterrà i dati:
export PROJECT_ID=$(gcloud info --format='value(config.project)') export BUCKET=${PROJECT_ID}-ml
  1. Inserisci il seguente comando per posizionare temporaneamente il file nel bucket Cloud Storage:
gsutil cp create_table.sql \ gs://$BUCKET/create_table.sql

Attività 2: crea un'istanza di Cloud SQL

  1. Inserisci i comandi seguenti per creare un'istanza di Cloud SQL:
gcloud sql instances create flights \ --database-version=POSTGRES_13 --cpu=2 --memory=8GiB \ --region={{{project_0.default_region | "REGION"}}} --root-password=Passw0rd

Il completamento dell'operazione richiede alcuni minuti.

Verifica l'attività completata

Fai clic su Controlla i miei progressi per verificare l'attività eseguita. Se hai creato correttamente l'istanza di Cloud SQL, ti verrà assegnato un punteggio di valutazione.

Crea un'istanza di Cloud SQL.
  1. Crea una variabile di ambiente con l'indirizzo IP di Cloud Shell:
export ADDRESS=$(curl -s http://ipecho.net/plain)/32
  1. Autorizza l'istanza di Cloud Shell ad accedere all'istanza di SQL per gestirla.
gcloud sql instances patch flights --authorized-networks $ADDRESS
  1. Al prompt premi Y per accettare la modifica.

Verifica l'attività completata

Fai clic su Controlla i miei progressi per verificare l'attività eseguita. Se hai autorizzato con successo Cloud Shell ad accedere all'istanza SQL, vedrai un punteggio di valutazione.

Autorizza l'istanza di Cloud Shell ad accedere all'istanza SQL.

Crea database e tabella

Per importare dati in una tabella Postgres, devi prima creare un database vuoto e una tabella con lo schema corretto.

  1. Nella console Cloud, nel menu di navigazione (Icona menu di navigazione), fai clic su SQL.

  2. Per aprire la pagina Panoramica di un'istanza, fai clic sul nome dell'istanza flights.

  3. Seleziona Database dal menu di navigazione SQL sulla sinistra.

  4. Fai clic su Crea database.

  5. Nella finestra di dialogo Nuovo database, denomina il database bts.

  6. Fai clic su Crea.

  7. Per aprire la pagina Panoramica di un'istanza, seleziona Panoramica dal menu di navigazione SQL.

  8. Fai clic su IMPORTA nella parte superiore.

  9. Nel campo File Cloud Storage, fai clic su Sfoglia.

  10. Nella sezione Bucket, fai clic sulla freccia di fronte al nome del bucket.

  11. Seleziona il file create_table.sql.

  12. Fai clic su Seleziona.

  13. Nella sezione Formato file, seleziona SQL.

  14. Specifica il database bts nella tua istanza Cloud SQL.

  15. Fai clic su Importa per avviare l'importazione.

Alcuni secondi dopo, verrà creata la tabella vuota.

Verifica l'attività completata

Fai clic su Controlla i miei progressi per verificare l'attività eseguita. Se hai creato correttamente il database bts e la tabella flights con il file create_table.sql, ti verrà assegnato un punteggio di valutazione.

Crea il database bts e la tabella flights utilizzando il file create_table.sql.

Attività 3: aggiungi dati a un'istanza Cloud SQL

Hai creato il database e la tabella vuoti, ora carica i file CSV in questa tabella. Carica i dati di gennaio passando a 201501.csv nel tuo bucket e specifica CSV come formato, bts come database e flights come tabella.

  1. Nella pagina dell'istanza di Cloud SQL, fai clic su IMPORTA.

  2. Nel campo File Cloud Storage, fai clic su Sfoglia, poi fai clic sulla freccia di fronte al nome del bucket e su 201501.csv.

  3. Fai clic su Seleziona.

  4. Seleziona CSV nel campo Formato file.

  5. Seleziona il database btse digita flights come nome della tabella.

  6. Fai clic su IMPORTA.

Attività 4: interagisci con il database

  1. Connettiti all'istanza Cloud SQL da Cloud Shell come segue:
gcloud sql connect flights --user=postgres
  1. Quando viene richiesta la password, inserisci Passw0rd. Potresti non vedere le lettere durante la digitazione.

  2. Nel prompt che viene visualizzato, connettiti al database bts:

\c bts;
  1. Quando viene richiesta la password, inserisci Passw0rd.

  2. Quindi, esegui una query per ottenere i 5 aeroporti più trafficati:

SELECT "Origin", COUNT(*) AS num_flights FROM flights GROUP BY "Origin" ORDER BY num_flights DESC LIMIT 5;

Mentre questa query risulta efficiente perché il set di dati è relativamente piccolo (solo gennaio), il database rallenterà man mano che si aggiungono altri mesi.

I database relazionali sono adatti a set di dati di piccole dimensioni su cui eseguire query ad hoc che restituiscono un piccolo sottoinsieme di dati. Per set di dati più grandi, puoi ottimizzare le prestazioni di un database relazionale indicizzando le colonne di interesse. Inoltre, poiché i database relazionali in genere supportano le transazioni e garantiscono una elevata coerenza, sono una scelta eccellente per i dati che verranno aggiornati spesso.

Tuttavia, un database relazionale è una scelta sbagliata se:

  • I tuoi dati sono principalmente di sola lettura
  • Le dimensioni del tuo set di dati rientrano nell'intervallo di terabyte
  • È necessario eseguire la scansione dell'intera tabella (ad esempio per calcolare il valore massimo di una colonna) o se i flussi di dati vengono trasmessi a velocità elevate.

Descrive il caso d'uso del ritardo dei voli. In questo caso passeresti da un database relazionale a un data warehouse di analisi: BigQuery. Il data warehouse analitico ci consentirà di utilizzare SQL ed è molto più in grado di gestire grandi set di dati e query ad hoc (ovvero non ha bisogno di indicizzare le colonne).

Complimenti!

Ora sai come creare tabelle e importare in Google Cloud SQL dati di testo archiviati su Cloud Storage.

Passaggi successivi/Scopri di più

Ecco alcune attività di follow-up:

Formazione e certificazione Google Cloud

… per utilizzare al meglio le tecnologie Google Cloud. I nostri corsi ti consentono di sviluppare competenze tecniche e best practice per aiutarti a metterti subito al passo e avanzare nel tuo percorso di apprendimento. Offriamo vari livelli di formazione, dal livello base a quello avanzato, con opzioni di corsi on demand, dal vivo e virtuali, in modo da poter scegliere il più adatto in base ai tuoi impegni. Le certificazioni ti permettono di confermare e dimostrare le tue abilità e competenze relative alle tecnologie Google Cloud.

Ultimo aggiornamento del manuale: 28 novembre 2023

Ultimo test del lab: 28 novembre 2023

Copyright 2024 Google LLC Tutti i diritti riservati. Google e il logo Google sono marchi di Google LLC. Tutti gli altri nomi di società e prodotti sono marchi delle rispettive società a cui sono associati.