menu
arrow_back

Machine learning avec TensorFlow

Machine learning avec TensorFlow

Hours Minutes 7 Credits

GSP273

Google Cloud – Ateliers adaptés au rythme de chacun

Présentation

Dans cet atelier, vous allez apprendre à utiliser Google Cloud Machine Learning et TensorFlow pour développer et évaluer des modèles de prédiction à l'aide du machine learning. Développée par Google, TensorFlow est une bibliothèque Open Source de machine learning portable, performante et capable de fonctionner avec de très grands ensembles de données.

Cet atelier fait suite aux ateliers précédents de cette série dans lesquels vous avez créé un modèle de prédiction de base utilisant la régression logistique avec Spark et Pig, puis utilisé Cloud Dataflow pour créer des ensembles de données d'entraînement et de test à l'aide d'un pipeline également utilisable pour la prédiction. Résultat : vous avez évité le risque de décalage entraînement/diffusion avec vos modèles de prédiction. Cet atelier s'appuie sur le chapitre 9 de l'ouvrage "Data Science on Google Cloud Platform" publié par O'Reilly Media, Inc.

Vous commencerez par créer un framework expérimental dans Python pour répliquer le modèle de régression linéaire de base à l'aide de TensorFlow. Vous développerez alors ce framework pour évaluer des modèles comportant plus de variables. Ce framework peut ensuite servir à comparer les performances de ces modèles de machine learning de base par rapport à des modèles de machine learning plus complexes.

Comme tous les autres ateliers de cette série, cet atelier offre une expérience utile du traitement des données et des techniques de modélisation des données. Vous pourrez ainsi développer un modèle de données afin de prédire si les vols arriveront à destination en retard, compte tenu des détails spécifiques du départ tels que le lieu, l'heure de départ, le retard effectif au départ, le roulage au départ, etc.

L'ensemble de données utilisé comporte des informations historiques concernant les vols intérieurs aux États-Unis, qui proviennent du site Web du Bureau du transport américain (Bureau of Transports Statistics). Tous les autres ateliers de la quête Data Science on Google Cloud Platform: Machine Learning reposent également sur cet ensemble de données, car il permet d'illustrer un large éventail de concepts et techniques en matière de science des données. Les ensembles de données spécifiques de cet atelier sont les ensembles agrégés développés dans le précédent atelier de cette quête intitulé Traitement de données par périodes avec Apache Beam et Cloud Dataflow (Java).

Objectifs

  • Développer un framework expérimental TensorFlow de base dans Python

  • Étendre ce framework pour créer un modèle de classificateur linéaire doté de fonctionnalités supplémentaires

  • Déployer le framework expérimental d'entraînement et d'évaluation dans Google Cloud ML

Join Qwiklabs to read the rest of this lab...and more!

  • Get temporary access to the Google Cloud Console.
  • Over 200 labs from beginner to advanced levels.
  • Bite-sized so you can learn at your own pace.
Join to Start This Lab
Score

—/100

Check that the Python model.py file has been created

Réaliser l'étape

/ 25

Check for a Tensorflow model in the /tensorflow/trained_model directory

Réaliser l'étape

/ 25

Check for successful run of a gcloud ai-platform training job called flights-*

Réaliser l'étape

/ 25

Check that a trained model has been saved to Google Storage

Réaliser l'étape

/ 25