TOPコラム一覧Amazon SageMaker Canvas + AWS Glue DataBrewによるノーコード開発(前編)

ユースカジノ 退会 Amazon SageMaker Canvas + AWS Glue DataBrewによるノーコード開発(前編)

はじめに

はじめまして、伊藤忠テクノソリューションズ 山近です。みなさんは、ユースカジノ 退会が手元にあって機械学習でAIモデルを開発したい場合、何が必要だと思いますか。一般的には、以下の3つのプロセスを経ることになります。

  1. ① プラットフォームの用意
  2. ② ユースカジノ 退会加工プログラムによる準備
  3. ③ 機械学習アルゴリズムの適用

①については、答えはもちろんAWSです。AWSのアカウントを用意できれば、ユースカジノ 退会レイク/ユースカジノ 退会加工/機械学習プラットフォームは、インストール作業等することなくすぐに使うことができます。

②③はどうでしょうか。どちらもpythonに代表されるようなプログラムで記述する必要があり、しんどいな、と思う方は多いと思います。

そこで、今回は、AWSのサービスである Amazon SageMaker CanvasとAWS Glue DataBrewを利用して、ノーコードでユースカジノ 退会加工と機械学習のAIモデル開発を実施してみましょう。

1.全体概要

今回のシナリオの全体概要は以下のようになっています。RawDataをAWS Glue DataBrewで前処理し、そのユースカジノ 退会をSageMaker Canvasで機械学習を行って予測結果を出力します。そして、これらをすべてノーコードで行ってみます。

ユースカジノ 退会

2.Amazon SageMaker Canvasセットアップ

まず、SageMaker Canvasをセットアップします。こちらの記事に従って、セットアップしてみてください。

Amazon SageMakerについて調べてみた

なお、SageMakerで使用されるデフォルトのS3バケットは

sagemaker-<ユースカジノ 退会たリージョン-<アカウントID

になります。今回はこちらのバケット使用する前提で進めます。

※Amazon SageMaker Canvasセットアップの過程で作成されるS3バケットとサンプルユースカジノ 退会を使用するため、手順の最初に持ってきています。別途用意したS3バケットやユースカジノ 退会を使用する場合は、この手順を後に回してもでも構いません。

3.AWS Glue DataBrewについて

AWS Glue DataBrewはGUIベースのユースカジノ 退会準備ツールです。エンジニアに限らず、利用部門のユーザにも広く使われています。プログラムを組むことなく分析を行ったり、機械学習用のユースカジノ 退会を用意することが可能です。

https://aws.amazon.com/jp/glue/features/databrew/

4.AWS Glue DataBrewセットアップ

AWS Glue DataBrewをセットアップします。以下のマニュアルに従って実施してみてください。

https://docs.aws.amazon.com/ja_jp/databrew/latest/dg/setting-up.html

なお、今回の検証用にユースカジノ 退会たロールとアタッチしたポリシーの関係を記載しておきます。

※権限が強すぎる等でセキュリティ的に問題があると想定される場合には、適切なものに各自で変更してください。

ユースカジノ 退会

5.AWS Glue DataBrewでの実施概要

いよいよ、AWS Glue DataBrewで前処理していきます。DataBrewでの実施概要は次のようになります。

ユースカジノ 退会

SageMaker Canvasに投入する学習用ユースカジノ 退会(canvas-sample-loans-train.csv)と、テスト用ユースカジノ 退会(canvas-sample-loans-test.csv)を作成することがゴールとなります。

6.AWS Glue DataBrewでの実施詳細

① ユースカジノ 退会セットの読み込み

最初にDataBrewにユースカジノ 退会セットを接続します。今回使用するのは、以下の2つのCSVファイルで、それぞれ別で2つのユースカジノ 退会セットを作成してください。このユースカジノ 退会セットは、2.Amazon SageMaker Canvasセットアップの過程でユースカジノ 退会されています。

ユースカジノ 退会セット名:

canvas-sample-loans-part-1
            canvas-sample-loans-part-2

バケット名:

sagemaker-<ユースカジノ 退会たリージョン-<アカウントID

ファイル名

バケット名/canvas/ sample_dataset/ canvas-sample-loans-part-1.csv
            バケット名/canvas/ sample_dataset/ canvas-sample-loans-part-2.csv

また、

ファイルタイプ:

csv

CSV区切り記号:

カンマ(,)

列ヘッダ値:

最初の行をヘッダとして扱う

を選択し、[ユースカジノ 退会セットの作成]を押下します。

② プロファイルのユースカジノ 退会

今回のシナリオには直接関係ないので簡単に触れる程度にしますが、作成したデータセットに対してユースカジノ 退会を作成できます。ユースカジノ 退会は、接続したデータセットに対しての詳細なデータ情報で、列の欠損情報や列同士の相関係数などが分かるため、未知のデータセットに対してどのような前処理を行っていけば良いかといった方針を立てるために用いることができます。

作成するには、データセットから[ユースカジノ 退会を実行]を押下します。

その後、プロファイルジョブの各項目を入力・選択する画面に遷移するので、適宜、入力・選択し、プログラムジョブを実行します。少し待つと、以下のようなユースカジノ 退会が作成されます。

③ プロジェクトのユースカジノ 退会

最初に学習用ユースカジノ 退会生成のためのプロジェクトとレシピを新規作成します。先ほど作成したユースカジノ 退会セットのうち、片方(canvas-sample-loans-part-1)を紐づけます。なお、許可ロール名は、3.AWS Glue DataBrewセットアップでユースカジノ 退会たロールになります。

プロジェクト名:

canvas-sample-loans-train

レシピ名:

canvas-sample-loans-train-recipe

④ レシピのユースカジノ 退会

レシピを作成します。レシピとは、ユースカジノ 退会加工の工程を意味しています。レシピの各工程を説明する前に、今回のユースカジノ 退会加工で実施したいことは以下の通りです。

  • 今回の2つのユースカジノ 退会セットはid列で1対1に内部結合できる。
  • earliest_credit_line列において、2005/1/1以前のユースカジノ 退会を学習用ユースカジノ 退会、それ以降のユースカジノ 退会をテスト用ユースカジノ 退会として、ユースカジノ 退会全体を行で分割する。

実際にレシピをユースカジノ 退会てみましょう。まず、先ほど新規ユースカジノ 退会たレシピを編集してきます。プロジェクトの画面から、[レシピ]を押下します。

1. 結合

id列で内部結合します。レシピのステップの追加から、[結合]を選択します。

結合したいcanvas-sample-loans-part-2を選択します。

内部結合を選択し、結合する列として両方のテーブルでid列を選択します。

2. 条件に基づく列をユースカジノ 退会

日付列による行の分割ですが、いくつか方法はあります。ここでは、新規にフラグ列を追加し、その条件で行を分割する方法を実施しています。

earliest_credit_line列の値に基づいた列を新規追加します。レシピのステップの追加から、[列をユースカジノ 退会]-[条件に基づく]を選択します。

条件として、以下の内容でtrain_flag列を新規ユースカジノ 退会ます。

  1. A)earliest_credit_lineが2005-01-01 00:00:00より前
  2. B)A)に一致した場合は1,それ以外は0を選定
  3. C)B)の値を新規列とする

3. 条件に基づく行のフィルター

前項の作業によって、train_flag列が1の行が学習用ユースカジノ 退会になるため、train_flag=1の行を抽出します。レシピのステップの追加から、[フィルター]-[条件別]を選択します。

train_flagが1に等しい行を選択します。

4. レシピの発行

レシピが完成しました。レシピを発行することで正式なものとなりますので、発行を押下します。

5. レシピジョブのユースカジノ 退会と実行

レシピジョブをユースカジノ 退会ます。主な設定情報を以下に記載します。

レシピジョブ名:

canvas-sample-loans-train-job

プロジェクト:

canvas-sample-loans-train

出力先:

Amazon s3

ファイルタイプ:

csv

CSV区切り記号:

カンマ(,)

S3の場所:

バケット名/canvas/ work



⑥ 加工後ユースカジノ 退会の出力確認

レシピジョブジョブを実行すると、以下のように設定したS3出力先にファイルが出力されます。

生成されたファイルはCanvasで使用する学習ユースカジノ 退会となりますので、以下のファイル名に変更しておいてください。

ファイル名:

canvas-sample-loans-train.csv

⑦ プロジェクトの複製とレシピ修正

いまの手順で学習用ユースカジノ 退会が生成できました。今度は、テスト用のユースカジノ 退会(canvas-sample-loans-test.csv)を生成します。

テスト用ユースカジノ 退会生成のためのプロジェクトとレシピ名を、先ほどまで作成したプロジェクトとレシピから複製します。

プロジェクト名:

canvas-sample-loans-test

レシピ名:

canvas-sample-loans-train-test

これで、名前の異なる全く同じプロジェクトとレシピができました。では、テスト用ユースカジノ 退会ユースカジノ 退会を生成するにはどこを修正すればよいでしょうか。

答えは、レシピにおける第3工程です。train_flagが0に等しい行を選択すれば、テスト用のユースカジノ 退会が出力されることになります。

⑧ テスト用ユースカジノ 退会の生成

あとは、⑤レシピジョブの作成と実行 を参考にしてレシピジョブを作成し、テスト用ユースカジノ 退会を生成してください。

レシピジョブ名:

canvas-sample-loans-test-job

生成されたファイルは、Canvasで使用するテスト用ユースカジノ 退会となりますので、以下のファイル名に変更しておいてください。

ファイル名:

canvas-sample-loans-test.csv

これで、SageMaker Canvasに投入するユースカジノ 退会が完成しました。

7.まとめ

いかがでしたでしょうか。ユースカジノ 退会前処理にプログラミングは一切しませんでした。AWS Glue DataBrewはもっと複雑なユースカジノ 退会加工も可能です。是非、いろいろ試してみてください。

後編では、作成したユースカジノ 退会をAmazon SageMaker Canvasに投入して、ノーコードで機械学習を実施してみます。

カジノゲームは、AWSのビジネス利活用に向けて、お客様のステージに合わせた幅広い構築・運用支援サービスを提供しています。
経験豊富なエンジニアが、ワンストップかつ柔軟にご支援します。
ぜひ、お気軽にお問い合わせください。

お問い合わせ

関連コラム

【著者プロフィール】

山近 和樹(やまちか かずき)

伊藤忠テクノソリューションズ株式会社 機械学習エンジニア

AWS Certified Machine Learning – Specialty
AWSを中心に機械学習における分析やAIシステム導入のプリセールス及び設計・導入を担当。
社内活動としてAWS AI/MLサービスの啓蒙活動に取り組んでいる。
山近 和樹(やまちか かずき)

TOPコラム一覧Amazon SageMaker Canvas + AWS Glue DataBrewによるノーコード開発(前編)

pagetop