menu
arrow_back

Google 머신러닝을 사용한 브라켓톨로지

Google 머신러닝을 사용한 브라켓톨로지

1시간 15분 크레딧 5개

GSP461

Google Cloud 사용자 주도형 실습

개요

이 실습에서는 BigQuery, 머신러닝(ML), NCAA 남자부 농구 데이터세트를 사용하여 NCAA 남자부 농구 토너먼트 경기의 승자를 예측해 봅니다.

이 실습에서는 SQL을 사용하여 분류 및 예측을 위한 ML 모델을 생성할 수 있는 BigQuery 머신러닝(BQML)을 활용합니다.

실습할 내용

이 실습에서는 다음 작업을 수행하는 방법을 학습합니다.

  • BigQuery를 사용하여 공개 NCAA 데이터세트에 액세스하기
  • NCAA 데이터세트를 탐색하며 이용 가능한 데이터의 스키마와 범위에 익숙해지기
  • 기존 데이터를 준비하여 특성 및 라벨로 변환하기
  • 데이터세트를 학습 및 평가 하위 집합으로 분할하기
  • BQML을 사용하여 NCAA 토너먼트 데이터세트에 기반을 둔 모델 빌드하기
  • 새로 만든 모델을 사용하여 NCAA 토너먼트 승자 예측하기

기본 요건

이 실습은 기초 레벨 실습입니다. SQL 및 언어 키워드를 사용해 본 경험이 있어야 시작할 수 있습니다. BigQuery에 익숙하면 더욱 좋습니다. 이 영역에서 좀 더 빠르게 진행하고 싶다면 이 실습을 시도하기 전에 다음과 같은 실습 중 하나 이상을 수행하시기 바랍니다.

준비가 되었다면 아래로 스크롤하여 실습에서 사용하게 될 서비스에 대한 정보와 실습 환경을 적절하게 설정하는 방법을 자세히 알아보세요.

BigQuery

BigQuery는 Google의 완전 관리형, NoOps(무인 운영), 저비용 분석 데이터베이스입니다. BigQuery를 사용하면 인프라를 관리하지 않고 데이터베이스 관리자가 없어도 테라바이트 단위의 데이터를 쿼리할 수 있습니다. BigQuery는 SQL을 사용하고 종량제 모델의 장점을 지닙니다. BigQuery는 데이터를 분석하여 의미 있고 유용한 정보를 찾는 데 집중할 수 있게 해줍니다.

NCAA 농구 경기/팀/선수에 관한 데이터세트가 새롭게 제공되었습니다. 2009년까지의 경기 데이터에서는 플레이 바이 플레이 기록 및 박스 스코어 기록이 제공되며, 최종 스코어는 1996년까지 기록되어 있습니다. 1894~5 시즌까지의 승패 데이터가 추가로 제공되는 팀도 있습니다.

머신러닝

Google Cloud는 데이터 애널리스트와 데이터 과학자에게 폭넓은 머신러닝 옵션을 제공합니다. 인기 있는 옵션은 다음과 같습니다.

  • Machine Learning API: Cloud Vision처럼 사전 학습된 API로 일반적인 ML 작업에 적합합니다.
  • AutoML: 코딩 없이 맞춤형 ML 모델을 만들 수 있습니다.
  • BigQuery ML: SQL 지식이 있다면 BigQuery에 이미 존재하는 데이터를 활용하여 빠르게 ML 모델을 빌드할 수 있습니다.
  • Cloud Machine Learning Engine의 TensorFlow: 맞춤형 ML 모델을 빌드하고 Google 인프라를 통해 실제 프로덕션 환경에 배치할 수 있습니다.

이 실습에서는 BigQuery ML을 사용하여 프로토타입을 제작하고, 학습을 진행하고, 평가를 마친 후 NCAA 농구 토너먼트에서 두 팀을 선정해 '승자'와 '패자'를 예측해봅니다.

이 실습의 나머지 부분과 기타 사항에 대해 알아보려면 Qwiklabs에 가입하세요.

  • Google Cloud Console에 대한 임시 액세스 권한을 얻습니다.
  • 초급부터 고급 수준까지 200여 개의 실습이 준비되어 있습니다.
  • 자신의 학습 속도에 맞춰 학습할 수 있도록 적은 분량으로 나누어져 있습니다.
이 실습을 시작하려면 가입하세요