Google Cloud Platform 사용하기 - Google Cloud Datalab을 개인 노트북에 설치하는 방법

Google Cloud Datalab(https://datalab.cloud.google.com/)이 베타 버전으로 공개 되었다. 

Datalab은 수집된 빅데이터을 분석하여 챠트 등 데이터를 가시화 하는데 유용하다. Datalab을 사용한 빅데이터 처리는 Twitter 이슈 빅데이터 처리 포스팅에 다룰 예정이다.

(Cloud Datalab makes it easy to securely access all your data and public datasets, and use the power of Google BigQuery with SQL and Python to explore, visualize, analyze, and transform data.)

기존 버전에서는 Google Cloud Platform의 프로젝트와 연동되어 자동으로 Compute Engine(VM) 인스턴스가 하나 생성되어 처리했는데, 새로운 버전에서는 개인 노트북이나 컴퓨터에도 설치하여 사용이 가능하다. 시험적으로 옛날 버전으로 하나 생성했는데, 원하지 않게 24시간 Compute Engine이 실행되고 있어서 무료 사용기간이 아니라면 비용이 청구될 수 있을 것 같다.

따라서 지속적인 사용이 아니라면 개인 노트북이나 컴퓨터에 설치해서 사용하는 것이 비용 측면에서 좋을 것 같다.

개인 노트북이나 컴퓨터에 Datalab을 설치하기 위해서는 위 화면에서 Please use the new version of Datalab beta. This version is now obsolete. 을 선택하면 새로운 Datalab을 어떤 방법으로 설치할 것인지 선택하는 페이지가 나온다. 
  1. Run Cloud Datalab locally
  2. Run Cloud Datalab kernels on Google Cloud Platform
  3. Run Cloud Datalab notebooks on Google Cloud Platform VM
개인 노트북에 설치하기 위해서는 'Run Cloud Datalab locally'을 선택한다. 설치 단계는 다음과 같다. Linux, macOS 및 Windows 모두 지원을 한다. 이 포스팅은 macOS을 기준으로 하며, 다른 OS는 웹 페이지를 참고하면 된다. (https://cloud.google.com/datalab/docs/quickstarts/quickstart-local)

  1. Docker 최신 버전 설치
  2. gcloud 툴 설치
  3. Google Cloud Platform의 프로젝트 설치
  4. Docker 실행

1. Docker 최신 버전 설치

각 OS 에 맞춰 설치 파일들이 제공된다. 다운로드 후 설치만 하면 된다. 설치할 때는 환경 변수 저장을 위해 관리자의 권한이 필요하다.
Docker가 설치 후 실행하면 서비스는 백그라운드에서 실행된다.

2. gcloud 툴 설치(Google Cloud SDK 설치)

 gcloud 툴 설치는 두 가지 방법이 있다. 하나는 Google Cloud SDK 설치 파일을 다운로드 받아 실행하는 것이고, 다른 방법은 Interactive installer을 사용하는 것이다. 웹 페이지에 설치 방법이 설명되어 있다. (https://cloud.google.com/sdk/downloads)

2.1 SDK 설치 파일 다운로드 방식

각 OS 에 맞춰 SDK을 다운로드 받은 후 압축 파일을 푼다.

(1) SDK 설치

아래와 같이 OS 별로 셀 또는 배치 파일을 실행한다.

  • On Linux or Mac OS X:
    ./google-cloud-sdk/install.sh
  • On Windows:
    .\google-cloud-sdk\install.bat

(2) SDK 초기화 

다음과 같이 SDK을 초기화 한다.
./google-cloud-sdk/bin/gcloud init

2.2 Interactive installer 사용 방식

OS에 맞춰 웹 페이지를 참고하면 쉽게 설치가 가능하다.
 

3. Datalab Docker Container 실행 

Linux와 macOS는 Command Line에서 Datalab Docker Container 실행 방법이 동일하나, Windows는 어플리케이션에서 바로 실행할 수 있다.

3.1 Linux/macOS 실행

3.2 Windows에서 실행


4. 웹 브라우저에서 Cloud Datalab 사용하기 

Docker Container가 실행되면 Cloud Datalab을 사용할 수 있는 웹 서버가 실행되며, 다음과 같이 웹 주소가 표시가 된다. 
Open your browser to http://localhost:8081/ to connect to Datalab.

웹 브라우저에서 'http://localhost:8081' 주소를 입력하면 다음과 같이 Datalab 웹 페이지가 표시되고, 빅데이터을 검색하고 챠트 등 그래프를 그릴 수 있다.

댓글

이 블로그의 인기 게시물

macOS가 갑자기 부팅이 되지 않을 경우 데이터 복구 또는 백업 방법

C++로 프로그래밍할 때 인자 또는 리턴 값으로 std::vector 등 STL 데이터 타입 처리하는 좋은 방법

Git 저장소를 병합하는 방법(How to merge repositories in Git)