この記事のざっくりとした内容

AWSが公開しているデータ分析サービスの入門ハンズオンをやってみたので、
振り返りの意味も込め、その時に行った手順などをまとめたものになります。

ハンズオン全体の手順

ハンズオン全体のおおまかな手順はこちら
また、本記事では全体のうち 手順 4 , 5 , 6 で実施した手順を扱います

  1. Redshiftクラスターの作成
  2. Amazon Redshiftクラスターへのデータロード
  3. Amazon Redshift上でのクエリ実行
  4. Amazon QuickSightの事前セットアップ
  5. Amazon QuickSightでのデータ可視化
  6. リソースの削除

本記事では記載しない内容

全体手順のうち、本記事では扱わない内容についてご覧になりたい場合はこちらをご参照ください:

AWSデータ分析系入門ハンズオンをやってみた1 – Redshiftクラスター作成編

AWSデータ分析系入門ハンズオンをやってみた2 – Redshiftをさわってみた編

本記事で記載する手順

  1. Amazon QuickSightの事前セットアップ
    4-1. QuickSightのサインアップ
    4-2. Redshift用セキュリティグループの作成
    4-3. Redshiftへのセキュリティグループ紐づけ
    4-4. QuickSight用セキュリティグループの作成
    4-5. Redshift接続用のVPC接続設定

  2. Amazon QuickSightでのデータ可視化
    5-1. データセットの新規作成
    5-2. データ分析の新規作成
    5-3. 円グラフでのデータ表示

  3. 使用リソースの削除

4-1. QuickSightのサインアップ

QuickSightコンソール > Sign up for QuickSight

file

言語設定を変更する:
画面右上のEnglish > 任意の言語を選択 で変更可能

file

エンタープライズ版を選択 > 続行
→ QuickSightアカウントの作成画面に遷移

file

[QuickSightアカウントの作成画面]

設定項目 設定値
エディション デフォルトのまま
リージョン ハンズオン解説では東京を選択していました
アカウント名 任意(グローバルで一意である必要がある)
通知のEメールアドレス アドレスを入力
データベースユーザー awsuser

その他、デフォルトのままでOK > 完了 > Amazon QuickSight に移動する

file

初期接続時には以下のようこそ画面が表示されるので×閉じてOK

file

これにて QuickSight へのログインは完了

file

4-2. Redshift用セキュリティグループの作成

QuickSightからRedshiftへ接続できるようにセキュリティグループを設定

設定項目 設定値
セキュリティグループ名 redshift-sg-private
リージョン ハンズオン解説では東京を選択していました
アカウント名 任意(グローバルで一意である必要がある)
通知のEメールアドレス アドレスを入力
データベースユーザー awsuser

Redshift用セキュリティグループの作成

設定項目 設定値
セキュリティグループ名 任意の名前を入力

今回は redshift-sg-private で設定

4-3. Redshiftへのセキュリティグループ紐づけ

作成したRedshiftクラスターを選択 > プロパティ > ネットワークとセキュリティ 編集

file

VPCセキュリティグループ
既存で設定されている default を削除 → 作成したRedshift用セキュリティグループを適用

file


file

4-4. QuickSight用セキュリティグループの作成

設定項目 設定値
セキュリティグループ名 任意の名前を入力

今回は quicksight-sg-private で設定

インバウンドルールを追加

タイプ ソース
すべてのTCP 作成したRedshift用セキュリティグループ

Redshift用セキュリティグループの編集

EC2コンソール > セキュリティグループ > Redshift用セキュリティグループを選択 > インバウンドルールを編集 > ルールを追加

タイプ ソース
Redshift 作成したQuickSight用セキュリティグループ

編集後、ルールを保存

4-5. Redshift接続用のVPC接続設定

QuickSightからRedshiftに接続できるようVPC接続設定をおこなう

QuickSightコンソール > アカウント名のアイコン > QuickSightの管理

file

VPC接続の管理 > VPC接続の追加

file

設定項目 設定値
VPC接続名 任意の名前を入力(今回はprivate-vpcで設定)
VPC ID デフォルトVPCを選択
サブネット ID リストから選択
セキュリティグループ ID 作成したQuickSight用セキュリティグループのIDを入力

その他はデフォルトのままでOK > 作成

VPC接続の設定完了!

5-1. データセットの新規作成

QuickSightコンソール > 新しい分析

file

新しい分析 > 画面遷移後 > 新しいデータセット > Redshift(自動検出)

file

[新規 Redshift データソース]

設定項目 設定値
データソース名 任意の名前を入力(今回はprivate-redshiftで設定)
インスタンスID 作成したRedshiftを選択
接続タイプ VPC接続名
データベース名 dev
ユーザー名 awsuser
パスワード 先の手順にて設定した値を入力

入力完了後 > 画面左下接続を検証

file

検証済みになればOK!> データソースを作成

file
※ 検証済みにならない場合、VPC接続の設定やセキュリティグループの設定を確認

[テーブル選択画面] salesを選択 > データの編集/プレビュー

file

salesのデータ取り込み完了

file

同様にdateテーブルも取り込む
[データの追加] > date > 選択

テーブル間の結合設定:

sales と date のテーブルが表示される > ピンクの〇〇を押下

file

[結合設定]
結合句 — sales:#dateid = date=#dateid
結合タイプ — Inner

file

データの取り込み完了

file

データの視覚化をおこなうため、画面上部[保存して視覚化]を押下

フィールドリストから caldate , qtysold を選択し視覚化を実現

file

実現したいシナリオ:2008年1月5日の総売り上げ量の確認

フィルターから日付を設定

file

視覚化のタイプを適切に変更
・視覚化 > Table
file

Tableに変更に伴い、表示も変更される
= 2008年1月5日の総売り上げ量

file

実現したいシナリオ:総売り上げ量に基づくTop10バイヤーの確認

usersテーブルのデータを追加

[結合設定]
結合句 — sales:#buyerid = users=#userid
結合タイプ — Inner

適用 > 画面上部[保存して視覚化]を押下

file

5-2. データ分析の新規作成

画面左上[+追加] > ビジュアルを追加

file

ビジュアルタイプ:テーブルを選択
フィールドリストを適切に設定

上位10名を出力することができました

file

5-3. 円グラフでのデータ表示

円グラフでの表示もビジュアルタイプの選択などで簡単に実現できます

file

ここまででハンズオンの手順は完了となります
振り返りや手順の確認などが完了したら使用したリソースを削除していきます

6. 使用リソースの削除

ハンズオンでは以下の順に削除していくよう案内されています

  1. Redshiftクラスター
  2. Redshift用 IAMロール
  3. S3バケット
  4. QuickSightのVPC接続設定
  5. QuickSightのアカウント
  6. 各種セキュリティグループ

これにてすべての手順が完了です、お疲れ様でした!

Last modified: 2021-08-01

Author