Advanced 6 Steps Hours 42 Credits
Dies ist die zweite von zwei Quests von praktischen Übungen aus den Übungen aus dem Buch abgeleiteten Daten Wissenschaft auf Google Cloud Platform von Valliappa Lakshmanan, veröffentlicht von O'Reilly Media, Inc. In dieser zweiten Quest bedeckt Kapitel 9 bis zum Ende der das Buch, erweitern Sie die Fähigkeiten in der ersten Quest-praktiziert wird, und vollwertiges maschinelles Lernen Jobs mit state-of-the-art-Tools und der realen Welt Datensätze ausgeführt, die alle mit Google Cloud Platform-Tools und Dienstleistungen.
Prerequisites:
Diese Quest übernimmt zwei Voraussetzungen erfüllt sein: 1) Sie Zugriff auf das O'Reilly Buch Daten Wissenschaft auf der Google Cloud Platform haben, wie die Labore nur die Übungen am Ende jedes Kapitels umfassen und enthalten nicht die Konzepte oder Lehre aus der Text selbst. 2) Sie haben bereits beendet die erste Quest-in dieser Reihenfolge: Daten Wissenschaft auf der Google Cloud Platform sowie alle für die Suche erforderlichen Voraussetzungen. Ohne diese Voraussetzungen werden die Studierenden nicht die Fähigkeiten haben, oder Erfahrung, um hier erfolgreich zu sein.Quest Outline
Maschinelles Lernen mit Spark in Google Cloud Dataproc
In diesem Lab lernen Sie, wie Sie die logistische Regression mithilfe einer Bibliothek für maschinelles Lernen von Apache Spark implementieren, das in einem Google Cloud Dataproc-Cluster ausgeführt wird. So können Sie ein Modell für Daten aus einem multivariaten Dataset entwickeln.
Zeitfenstergesteuerte Daten mit Apache Beam und Cloud Dataflow (Java) verarbeiten
Stellen Sie mit Maven eine Java-Anwendung bereit, um Daten mit Cloud Dataflow zu verarbeiten. Die Java-Anwendung implementiert eine zeitfensterbasierte Aggregation, um die Rohdaten zu erweitern und somit konsistente Trainings- und Testdatasets zu erstellen.
Maschinelles Lernen mit TensorFlow
In diesem Lab lernen Sie, wie Sie mit Google Cloud Machine Learning und TensorFlow Vorhersagemodelle entwickeln und bewerten, die auf maschinellem Lernen basieren.
Verteiltes maschinelles Lernen mit Google Cloud ML
In diesem Artikel erfahren Sie, wie Sie ein Dataset in zwei separate Teile unterteilen: einen Trainingssatz zum Entwickeln eines Modells und einen Testsatz, mit dem sich die Genauigkeit des Modells bewerten und Vorhersagemodelle wiederholt unabhängig evaluieren lassen.
Maschinelles Lernen in Echtzeit mit Google Cloud ML
Mit Cloud DataProc, das auf einem Hadoop-Cluster ausgeführt wird, analysieren Sie einen Datensatz unter Verwendung der Bayes-Klassifizierung.
Bayes-Klassifizierung mit Cloud Datalab, Spark und Pig in Google Cloud Dataproc
In diesem Lab stellen Sie einen Google Cloud Dataproc-Cluster bereit, bei dem Google Cloud Datalab bereits vorinstalliert ist. Dann führen Sie mit Spark eine Quantisierung durch, um die Genauigkeit der Datenmodellierung zu erhöhen.