menu
arrow_back

BigQuery ML 예측 모델을 사용하여 택시 요금 예측하기

BigQuery ML 예측 모델을 사용하여 택시 요금 예측하기

1시간 크레딧 7개

GSP021

Google Cloud 사용자 주도형 실습

개요

BigQuery는 Google의 완전 관리형, NoOps(무인 운영), 저비용 분석 데이터베이스입니다. BigQuery를 사용하면 관리할 인프라나 데이터베이스 관리자가 없어도 테라바이트 단위의 데이터를 쿼리할 수 있습니다. BigQuery는 SQL을 사용하므로 종량제 모델의 장점을 활용할 수 있습니다. BigQuery는 데이터를 분석하여 의미 있고 유용한 정보를 찾는 데 집중할 수 있게 해줍니다.

BQML(BigQuery 머신러닝, 베타 제품)은 데이터 분석가가 최소한의 코딩으로 머신러닝 모델을 생성, 학습, 평가하고, 이를 통해 예측할 수 있는 BigQuery의 새로운 기능입니다.

이 실습에서는 BigQuery 공개 데이터세트에서 제공되는 수백만 건의 뉴욕 옐로캡 택시 운행 데이터를 살펴보게 됩니다. 그런 다음 BigQuery 내에서 머신러닝 모델을 만들어 주어진 모델 입력을 바탕으로 택시 운행 요금을 예측해봅니다. 마지막으로는 모델의 성능을 평가하고 예측을 수행해봅니다.

목표

이 실습에서는 다음 작업을 수행하는 방법에 대해 알아봅니다.

  • BigQuery를 사용하여 공개 데이터세트 찾기

  • 공용 택시 데이터세트 쿼리 및 탐색

  • 일괄 예측에 사용할 학습 및 평가 데이터세트 만들기

  • BQML에서 예측(선형 회귀) 모델 만들기

  • 머신러닝 모델의 성능 평가

준비물

  • Google Cloud Platform 프로젝트

  • Google Chrome, Mozilla Firefox 등의 브라우저

이 실습의 나머지 부분과 기타 사항에 대해 알아보려면 Qwiklabs에 가입하세요.

  • Google Cloud Console에 대한 임시 액세스 권한을 얻습니다.
  • 초급부터 고급 수준까지 200여 개의 실습이 준비되어 있습니다.
  • 자신의 학습 속도에 맞춰 학습할 수 있도록 적은 분량으로 나누어져 있습니다.
이 실습을 시작하려면 가입하세요
점수

—/100

Calculate trips taken by Yellow taxi in each month of 2015

단계 진행

/ 10

Calculate average speed of Yellow taxi trips in 2015

단계 진행

/ 10

Test whether fields are good inputs to your fare forecasting model

단계 진행

/ 20

Create a BigQuery dataset to store models

단계 진행

/ 10

Create a taxifare model

단계 진행

/ 20

Evaluate classification model performance

단계 진행

/ 10

Predict taxi fare amount

단계 진행

/ 20