初めてのカスタマイズ
どうも、maboroshiです。
“スタイリッシュなBI, Einstein Analytics”と題して、全3回でお送りするEinstein Analyticsの紹介です。第2回(前編、後篇)では、実際にSalesforceデータを取り込んでダッシュボードを作成するまでをご紹介いたしました。今回は、より実践に近い内容をお送りいたします。
今回はEinsein Analyticsのなかでも特に利用頻度の高い、以下の2つの機能をご紹介いたします。
1.CSVデータをインポートしてみよう!
2.レシピを利用してみよう!
※この記事執筆時点のバージョンは”Spring’18″です
※どんなツールか触ってみたい、導入したけれど利用方法がいまいちよくわからない といった初心者の方を対象としています。データセットの結合やグラフのデータ変換などのテクニカルな部分は別の回で書く予定です。
※gifアニメおよび画像をクリックすると、別ウィンドウで表示され見やすくなります
1.CSVデータをインポートしてみる
多くの企業では、システムを統一しているといったことは少なく、複数のシステムを併用しているところが多いのではないかと思います。
Salesforceで管理していない外部データを取り込んで分析をしたい!という場合に、Einstein AnalyticsではCSV形式でデータを取り込んで分析する方法があります。
では、始めてみましょう!
使用するデータ
今回は下記のようなCSVデータを利用します。
①rec_date(計上月):日付(format:yyyy-MM-dd)
②branch(支店):テキスト
③product(商品):テキスト
④accuracy(確度):数値
⑤total(合計金額):数値
CSVデータのインポート
・CSVデータを元データとしたデータセットを作成していきます。まずはAnalyticsのホーム画面から、”作成” → “データセット”を選択します
・”データソースの選択”画面で”CSVデータ”を選択し、次へをクリック。
・”新規データセット”画面でインポートするファイルを選択し、次へをクリック。
データ型の選択
・インポートしたCSVの各項目のデータ型を設定していきます。ここで選択できるデータ型は、日付/ディメンジョン/基準の3種類です。
・左側にある項目をクリックすると、右側に各パラメータ入力欄が表示されるので、項目の属性を設定していきます。今回は以下のように設定。
①rec_date(日付)→データ型:日付, 日付形式※:yyyy-MM-dd
②branch(テキスト)→データ型:ディメンジョン
③product(テキスト)→データ型:ディメンジョン
④accuracy(数値)→データ型:基準, [精度, スケール, デフォルト]:[18, 1, 0], 数値形式:#.0
⑤total(数値)→データ型:基準, [精度, スケール, デフォルト]:[18, 0, 0], 数値形式:0
※ポイントですが、日付のフォーマットに ”yyyy/MM/dd”はありませんので、ご注意ください
・設定が完了したら、次へを押下します。
・CSVアップロードのデータフローが実行されますので、データマネージャで確認し、成功すればデータセットの完成です。
確認方法
・投入したデータを手っ取り早く確認するには、「値テーブル」を利用して確認するのが早いです。
・作成されたデータセットをクリックし、”テーブルモード”から”値テーブル”を選択します。
・項目を選択し、問題がないかをスクロールで確認していきます。
項目はドラッグ&ドロップで移動できますので、任意の順番に変更できます。
注意
値デーブルの場合、デフォルトで表示されるのは100件です。
100件以上確認したい場合は、画面左上のギアアイコンをクリックし→制限の設定から任意の値を入力し、確認します、(Sptring’18 新機能 NEW!!!)
2.レシピを利用してみよう!
2-1.レシピとは?
レシピとは、作成したデータセットから、さらに加工を加えた新しいデータセットを作成するという機能です。
利用ケースとしては、
・購買金額をベースに、「優良顧客」、「一般顧客」、「潜在顧客」の3段階に分類した項目を追加したデータセットを作る
・ABCの商品が入ったデータセットで、分析用にAの商品だけに特化したデータセットを作る
等が想定されます。
今回はレシピの機能の1つである「バケット」機能を使い、既存のデータセットから項目”accuracy”(確度)の値を「高」「中」「低」の3段階に分類した項目”accuracy_text”を追加した、新しいデータセットを作ってみたいと思います。
2-2.レシピの作成
データセットの選択
・画面右上のギアアイコンをクリックし、データマネージャを起動します
・データマネージャの左のメニューから「データセット」を選択し、対象のデータセットをクリックします
・データセット名を入力し、次へをクリックすると、レシピの編集画面が表示されます
レシピの編集画面の概要は以下の通り
a:変更の一覧
既存のデータセットに加えた変更の一覧が表示されます。
b:データセット内容
現在のデータセットの項目が表示されます。項目の右側にある逆三角のボタンをクリックすると、項目に対する各種操作を選択することができます。
c:サジェスチョン&編集
選択している項目に対する推奨操作を提案してくれます。
操作を選択すると、編集画面が表示されます。
d:列のプロファイル
選択した項目の情報が表示されます。メジャー/日付/基準のデータ型によって表示される
内容が変化します。
例えば、メジャーだとMax/Min/中央値や標準偏差などの簡単な統計量も表示されます。
分類の検討&設定
今回は項目「確度(accuracy)」に対して低/中/高の分類を追加していきたいと思います。
・項目を選択し、列のプロファイルを表示します。
・ここで、統計量を確認し各分類の閾値を決定していきます。
今回は高:0.8以上、中:0.3~0.8未満、残りを低とします。
・項目を選択し、右側のボタンから「バケット」を選択します。
・範囲が足りないようであれば、追加をクリックして追加し、任意の値を設定していきます。
・区分の設定が完了したら、右上の”追加ボタン”をクリックして終了します。
データセットの作成
・追加した項目のラベル・API名を変更するには、追加した項目をクリックし、プロファイルの属性タブをクリック。任意の値を設定します。
・編集が完了した場合、右上の「データセットを更新」ボタンを押下。含める項目やスケジューリングの有無を選択していきます。
※ポイントとしてスケジュールを設定しても、設定した時点でまず1回実行されまのでご留意ください!
・データフローが成功していれば完了です。
データイメージ
出来上がりのデータイメージは以下の通り。確度(accuracy)に基づいて区分”accuracy_text”が設定されていることがわかります。
追加した区分の活用
追加したバケットですが、ディメンジョンなのでグループ化項目として利用できます。
例えば積み上げの項目にしてみたり
ダッシュボード上で切換えウィジェットとして活用してみたり
というような感じで使えます。
数値の範囲をいちいち指定するよりも大分楽になりますね。
3.まとめ
「スタイリッシュなBI, Einstein Analytics」と題して全3回で紹介してきましたが、いかがだったでしょうか?Einstein Analyticsはバージョンアップごとに進化しており、今回のSpring’18でも様々な機能が追加されていますので、使い勝手はかなり良くなってきています。
簡単な分析であればすぐにでも始めることができると思いますので、ぜひ一度触ってみてください!
今後もTipsなど定期的に紹介してければと思いますので、ぜひチェックしてみてください。