よくある質問

商品別のよくある質問と回答です。以下に無い質問についてはページ内のお問合せからご質問ください。

 
bodaisプラットフォーム
ログインできない
パスワードを変更したい
パスワードを忘れてしまった
利用プランを確認したい
現在の利用ポイントを確認したい
利用プランを変更したい
オートクレンジング機能とはなんですか?
無効な属性/カテゴリとはなんですか?
解析結果のついたリストをダウンロードしたい
効果指標とはなんですか?
モデル評価値とはなんですか?
カテゴリ名の横についているダッシュはなんですか?
ジョブを削除したい
エラー/アラート(スコアリング):カテゴリあたりの正解数が少ない・・・
エラー/アラート(スコアリング):モデル用データの平均正解率が低いため、モデルの信頼度が低い可能性があります。
エラー/アラート(スコアリング):個人属性値には整数を入力してください
エラー/アラート(スコアリング):正解には0または1を入力してください
エラー/アラート(スコアリング):個人識別子には半角の英数記号を入力してください
エラー/アラート(スコアリング):非正解数が10未満です
エラー/アラート(スコアリング):正解数が10未満です
エラー/アラート(スコアリング):モデルファイルが100行未満のため、解析できません
エラー/アラート(クラスタリング):クラスタ数が範囲外となりました・・・
エラー/アラート(クラスタリング):各列のカテゴリ数を100以下にして・・・
エラー/アラート(クラスタリング):クラスタ番号列の値が全て同じ・・・
エラー/アラート(クラスタリング):クラスタ番号列に、数字以外の文字・・・
エラー/アラート(クラスタリング):データの偏りが大きかったため・・・
エラー/アラート(クラスタリング):個人属性情報が含まれていない行があります
スコアリング
クラスタリング
 
bodaisプラットフォーム

ログインできない

キーボードでCapsLock がオンになっていないことと、キーボードの言語設定が正しいことを確認し、正しいIDとパスワードが入力されているか確認してください。
それでもログインできない場合は、以下ヘルプデスク宛にご登録の会社名・部署名・利用者名・利用メールアドレスをご連絡ください。ヘルプデスクより追ってご連絡させていただきます。

ヘルプデスク

パスワードを変更したい

  1. ログイン後、右上にある『スパナ』マークを押します。
  2. 『パスワードの変更』を選択します
         

    bodaisパスワード画面

         
  3. 「パスワードの変更」ページが表示されます。

    『現在のパスワード』欄に今お使いのパスワードを、[新パスワード]欄にこれから使いたい新しいパスワードを入力します。
    『確認のためもう一度入力』欄にも、同じように入力します。
    bodaisパスワード画面

  4. 『変更』ボタンを押すと、変更が完了します。

パスワードを変更したい

  1. ログイン後、右上にある『スパナ』マークを押します。
  2. 『パスワードの変更』を選択します
         

    bodaisパスワード画面

         
  3. 「パスワードの変更」ページが表示されます。
    『現在のパスワード』欄に今お使いのパスワードを、[新パスワード]欄にこれから使いたい新しいパスワードを入力します。
    『確認のためもう一度入力』欄にも、同じように入力します。
    bodaisパスワード画面

  4. 『変更』ボタンを押すと、変更が完了します。

パスワードを忘れてしまった

ログイン画面の「パスワードを忘れましたか?」をクリック
画面よりEメールを送っていただき、パスワードの再設定を手順に従って行ってください。

利用プランを確認したい


  1. ログイン後右上にある「スパナ」マークを押します。
  2. 『パスワードの変更』を選択します

    bodaisパスワード画面

  3. 「登録情報確認」を選択します。
    bodaisパスワード画面
  4. 『変更』ボタンを押すと、変更が完了します。

現在の利用ポイントを確認したい

  1. ログイン後右上にある「スパナ」マークを押します。

  2. 「ご利用年月」で確認したい年月を選択すれば、ご利用ポイントを確認できます。

    bodaisパスワード画面

  3. 「ご利用年月」で確認したい年月を選択すれば、ご利用ポイントを確認できます。

    bodaisパスワード画面

利用プランを変更したい

以下ヘルプデスク宛にご登録の会社名・部署名・利用者名・利用メールアドレスをご連絡ください。
担当者より追ってご連絡させていただきます。

オートクレンジング機能とはなんですか?

一般的にデータ解析を行う際には、解析結果の精度を上げるため「変数選択」「変数加工」といったデータのクレンジング処理を手動で行う必要があります。
bodaisでは弊社研究者が開発したクレンジングロジックにより、様々なクレンジング処理が自動で行われています。この機能をオートクレンジング機能と言い、統計知識のない方でも簡単にデータ解析を行うことが可能となっております。例えば、クレンジング処理には以下のような処理があります。

カテゴリ統合

サンプル数の少ないカテゴリを他のカテゴリに統合することで、統計的信頼性の確保を行います。

カテゴリ統合情報

サンプル数の極端に少ないカテゴリは、他のカテゴリに統合することで統計的信頼性の確保を行っています。
図の場合ですと、最新アクセス日において、「3ヵ月以上」のカテゴリは、「3ヵ月以内」のカテゴリへ統合され、 新しく「3ヵ月以内′」というカテゴリとなっています。
なお、統合されたカテゴリには「’」が表示されます。

カテゴリ統合情報表

欠損処理

投入されたデータに欠損がある場合、「欠損」というカテゴリとして解析を行います。
なお、欠損データが多すぎる場合には、モデル作成に悪影響を与えるため、モデル作成から除外します。

相関処理

正解と各変数の相関係数を計算し、閾値以上になった『変数』を削除します。 詳しくは「無効な属性/カテゴリ」をご覧ください。

マルチコ処理

各変数カテゴリ間(同一の変数を除く)の相関係数またはVIF値が高いものを削除します。

無効な属性/カテゴリとはなんですか?

bodaisでは欠損データが多い属性や、他のカテゴリと関連が強いカテゴリについては、モデル作成に悪影響を与えるため、システムで自動的に判定し、モデル作成から除外しています(クレンジング処理)。
除外されたカテゴリは、モデル詳細画面の、効果指標・無効な属性/カテゴリ欄にて確認できます。

img

無効な属性/カテゴリ

「無効な属性/カテゴリ」にはモデル作成時に除外されたカテゴリが記載されています。 欠損データが多すぎる場合や、他のカテゴリと関連が強いカテゴリについて、モデル作成に悪影響を与えるためシステムで自動的に判定しモデル作成から除外しています。
他のカテゴリと関連が強いというのは、モデル作成に同じような影響を与えるデータを示します。 同じ影響を与えるカテゴリが複数ある場合、システムが自動判定し一方のカテゴリをモデル作成から除外します。

解析結果のついたリストをダウンロードしたい

スコアリング

スコア付きリストをダウンロードする

img

クラスタリング

クラスタ番号付きリストをダウンロードする

作成したクラスタ番号を、アップロードしたデータに付与したリストをダウンロードできます。 教師なしの場合、モデルの基本情報画面最下部にある「クラスタ番号付きリストをダウンロードする」ボタンをクリックしてください。CSV形式でダウンロードされます。

img

教師ありの場合、予測の基本情報画面最下部にある「クラスタ番号付きリストをダウンロードする」ボタンをクリックしてください。
CSV形式でダウンロードされます。

img

効果指標とはなんですか?

効果指標とは「どのカテゴリが効いているか」を確認することができる指標です。
スコアリングの場合-100~100の値を、クラスタリングの場合0~100の値を取ります。

スコアリング:効果指標

効果指標は「どのカテゴリが効いているか」を確認することができる指標です。
効果指標の値が、
「0よりも大きければ大きいほど、正解を増加させる影響力がある」 、逆に
「0よりも小さければ小さい(マイナス値が大きい)ほど、正解を減少させる影響力がある」ということになります。
値は-100~100をとり、効果指標画面の「効果指標をダウンロードする」をクリックすると効果指標一覧をダウンロードすることが出来ます。

img

モデルが直感と合うか確認

各カテゴリにおける影響力の大小が、マーケッターの方の感覚と合うかご確認いただくことが可能です。

施策の検討

影響力のあるカテゴリを参考にして、様々な施策を検討いただくことが可能です。

新規リスト収集の参考

今後新規リストを収集される際などに、より可能性の高いリストを集めるのに参考にしていただくことが可能です。

クラスタリング:効果指標

効果指標は「どのカテゴリが効いているか」を確認することができる指標です。
効果指標の値が、
「0よりも大きければ大きいほど、クラスタを区別(識別)する影響力がある」ことを示しています。
つまり、クラスタごとに違いの出やすいカテゴリだと言い換えることもできます。
値は0~100をとり、効果指標画面の「効果指標をダウンロードする」をクリックすると効果指標一覧をダウンロードすることが出来ます。

img

モデル評価値とはなんですか?

      

モデル評価値とは作成したモデルの良し悪しを判断する指標の一つで、評価値0.7以上が「良い」モデルの目安とされています。
予測の精度とは異なりますのでご注意ください。

スコアリング・モデル評価値

モデル評価値とは、作成したモデルをもとに予測を行った際に、より良い結果を出すことができるかを表した指標です。
1に近いほど「良い」モデルであるとみなすことができ、評価値が0.7以上であれば「良い」モデルである目安となります。 正解がスコア上位に集まればモデル評価値が良くなり、ゲインチャートは上に膨らみを持った曲線となります。 img 左)モデル評価値が高い場合のゲインチャート:右)モデル評価値が低い場合のゲインチャート

クラスタリング・モデル評価値

クラスタリングのモデル評価値とは、作成したモデルをもとに予測分類を行った際に、より良い結果を出すことができるかを表した指標です。 1に近いほど「良い」分類ができているとみなすことができ、評価値が0.7以上であれば「良い」モデルである目安となります。

カテゴリ名の横についているダッシュはなんですか?

ヒストグラムや効果指標一覧画面において、カテゴリ名にダッシュ「’」がついている場合があります。
これは、bodaisのオートクレンジング機能によりカテゴリ統合が行われた際に「’」が表示されます。
どのカテゴリが統合されたのかは、モデル詳細画面の「カテゴリ統合情報」から確認できます。

1

カテゴリ統合

サンプル数の少ないカテゴリを他のカテゴリに統合することで、統計的信頼性の確保を行います。

カテゴリ統合情報

サンプル数の極端に少ないカテゴリは、他のカテゴリに統合することで統計的信頼性の確保を行っています。
図の場合ですと、最新アクセス日において、「3ヵ月以上」のカテゴリは、「3ヵ月以内」のカテゴリへ統合され、 新しく「3ヵ月以内′」というカテゴリとなっています。
なお、統合されたカテゴリには「’」が表示されます。

カテゴリ統合情報表

ジョブを削除したい

  1. ジョブ詳細を表示し、右上の「詳細メニューを表示する」をクリックします。

  2. 詳細メニューが開きますので、「このジョブを削除する」をクリックします。

  3. ジョブの削除が完了します。

エラー/アラート(スコアリング):カテゴリあたりの正解数が少ない・・・

カテゴリあたりの正解数が少ないため、モデルの信頼度が低い可能性があります。
カテゴリあたりの平均正解数: XXXX
(5以上が推奨されます)

このエラーメッセージは、アップロードされたモデルファイルの、カテゴリ当たりの正解数が少ない、場合に表示されます。

カテゴリ当たりの正解数が少ない、とはつまり、 ・正解数÷(個人属性列数×各カテゴリ数) が、5より少ないということです。 意味的には、 少ない正解を、多量の変数で予測すると、過学習になってしまう、 ということを表しています。 例えば、下記のようなデータだった場合、

  • 正解数が100
  • 個人属性列が10
  • 各列のカテゴリが4ずつ

100÷(10×4)=2.5
で、カテゴリ当たりの正解数が

  • 2.5
なので、推奨下限値の5を下回っており、信頼性が低い、となります。
100個の正解を当てるために、40個もカテゴリがあると、多すぎるということです。

計算式を見てわかるとおり、カテゴリあたりの正解数を増やすには、

  • 正解数を増やす
  • 個人属性列を減らす
  • カテゴリを減らす
の3つの方法があります。

正解数を増やすには、

  • 業務を進めて正解を増やす
  • 取り扱う課題(≒正解)の段階を変更する
などが考えられます。

対応しやすいのは、個人属性列を減らす、です。
一番効果の薄そうな(正解の増減に関係なさそうな)個人属性列を削ります。
次に対応しやすいのは、カテゴリを減らす、です。
例えば、47都道府県をそのまま数値化して投入している場合には、
関東地方、関西地方、のようにカテゴリを統合すれば、大幅に減らすことができます。

具体的な解析の手順について、当社データサイエンティストが助言させていただく データ活用カウンセリングサービス もございます。

エラー/アラート(スコアリング):モデル用データの平均正解率が低いため、モデルの信頼度が低い可能性があります。

モデル用データの平均正解率が低いため、モデルの信頼度が低い可能性があります。
平均正解率:XXXX

このエラーメッセージは、アップロードされたモデル作成用ファイルの最終列に「1」(正解)が少ない場合に表示されます。
正解数が全体の0.5%未満の場合、このメッセージが表示されます。 列数やカテゴリ数、データの性質、解析結果の使用シーン等々によって、必要になる正解数は異なります。

正解数が少ないと、その少数の正解を当てるためのモデルになってしまいますので、 過学習(オーバーフィッティング)になりがちです。
過学習になってしまうと、一見、モデルはうまく作れているように見えるのですが、 予測の際に、全く当たらない、ということが起こります。

過学習を避けるためにも、正解数を増やす必要があります。

  • 業務を進めて正解を増やす
  • 取り扱う課題(≒正解)の段階を変更する

などによって、解決する場合があります。
例えば、法人営業の効率化にbodaisスコアリングを使う、といった場合に、
正解を、

  • 受注
とせずに、
  • 商談化
にする、といった例です。
こうすると、比較的容易に正解数を増やすことが可能です。


具体的な解析の手順について、当社データサイエンティストが助言させていただくデータ活用カウンセリングサービスもございます。

エラー/アラート(スコアリング):個人属性値には整数を入力してください

不正なデータがあります。
個人属性値には整数を入力してください。

このエラーメッセージは、アップロードされたファイルの先頭列とヘッダー行以外の部分に、
小数や文字列が使用されている、場合に表示されます。

bodaisには、数値変換したデータをアップロードしていただく必要があります。

例)

  • 男性 → 1
  • 女性 → 2

データの数値変換を行ったにもかかわらず、このエラーメッセージが表示される場合は、

  • 小数の使用
がないか、ご確認ください。
EXCELでデータ変換をすると、見かけ上は「1」ですが、実際は「0.9999」などということがありますので、「.」で検索するなどして、小数が無いようにしてください。

データ変換を素早く簡単に行えるデータ変換アプリもございます。
また、データ変換ルールの決定をデータサイエンティストがお手伝いする データ変換サービスもございます。

エラー/アラート(スコアリング):正解には0または1を入力してください

不正なデータがあります。
正解には0または1を入力してください。

このエラーメッセージは、アップロードされたファイルの最終列(正解)に0または1以外の文字がある、場合に表示されます。
2以上の整数やその他数値、或いは文字列が使用されている、ということです。

  • 正解列の無いデータ(例えば、予測用データ)
  • 正解の種類が多いデータ(例えば、クラスタリング用データ)

が誤ってアップロードされた可能性があります。
アップロードされたファイルの最終列をご確認ください。

エラー/アラート(スコアリング):個人識別子には半角の英数記号を入力してください

不正なデータがあります。
個人識別子には半角の英数記号を入力してください。

このエラーメッセージは、アップロードされたファイルの、先頭列(ID)が半角英数記号でない、場合に表示されます。

ひらがなやカタカナ、或いは全角英数文字が使用されていないか、
アップロードされたファイルの1列目をご確認ください。

エラー/アラート(スコアリング):非正解数が10未満です

非正解数が10未満です

このエラーメッセージは、アップロードされたモデル作成用ファイルの最終列に「1」(正解)が多い場合に表示されます。
正解「1」と不正解「0」が逆になっている可能性があります。
アップロードしたデータをご確認ください。

エラー/アラート(スコアリング):正解数が10未満です

正解数が10未満です

このエラーメッセージは、アップロードされたモデル作成用ファイルの最終列に「1」(正解)が少ない場合に表示されます。
正解数が少ないと、その少数の正解を当てるためのモデルになってしまいますので、 過学習(オーバーフィッティング)になりがちです。

過学習になってしまうと、一見、モデルはうまく作れているように見えるのですが、 予測の際に、全く当たらない、ということが起こります。

過学習を避けるためにも、正解数を増やす必要があります。
などによって、解決する場合があります。

  • 業務を進めて正解を増やす
  • 取り扱う課題(≒正解)のレベルを変更する

例えば、法人営業の効率化にbodaisスコアリングを使う、といった場合に、正解を、

  • 受注
とせずに、
  • 商談化
にする、といった例です。
こうすると、比較的容易に正解数を増やすことが可能です。
また、正解数が10以上の場合でも、正解率が低い場合、モデルの信頼度が低い可能性があります。

具体的な解析の手順について、当社データサイエンティストが助言させていただくデータ活用カウンセリングサービスもございます。

エラー/アラート(スコアリング):モデルファイルが100行未満のため、解析できません

モデルファイルが100行未満のため、解析できません。
件数を増やして実行をお願いします。

このエラーメッセージは、アップロードされたモデル作成用ファイルの、行数が少なすぎる、場合に表示されます。

bodaisスコアリングサービスの下限行数は、

  • 100行
となっております。

データ行数が多ければ多いほど、よいモデルを作ることができます。
モデル作成には500行以上のデータのご使用をご検討ください。
実際は、列数やカテゴリ数、データの性質、解析結果の使用シーン等々によって、必要になるデータ行数は異なるので、一概には言えませんが、大まかな指標として、捉えてください。

300行弱のデータで、実際に業務に使えるスコアリングが行えた事例もあるので、
行数が少ない場合も、まずは一度トライしていただくのも良いかもしれません。

それでもやはりデータ行数が足りない場合は、

  • 業務を進めてデータ行を増やす
  • (とりあえずの応急処置として)データをコピーして行数を増やす
  • 取り扱う課題(≒正解)の段階を変更する
などによって、解決する場合があります。

取り扱う課題の段階を変更する、というのは、
例えば、法人営業の効率化にbodaisスコアリングを使う、といった場合に、

  • 初回訪問済リストから、受注確率の高い顧客を見つける という課題設定でなく、
  • 未訪問リストから、アポ獲得確率の高い顧客を見つける
という課題設定にする、というような例です。
こうすると、比較的容易にデータ行を増やすことが可能です。

具体的な解析の手順について、当社データサイエンティストが助言させていただくデータ活用カウンセリングサービス

もございます。

エラー/アラート(クラスタリング):クラスタ数が範囲外となりました・・・

クラスタ数が範囲外となりました。
クラスタ数は2~15の範囲にしてください。

このエラーメッセージは、教師ありクラスタリングにおいて、アップロードされたモデルファイルで、
クラスタ数が16以上ある、場合に表示されます。
最終列の数値の種類が、16種類を超えている、ということです。

教師ありのクラスタリングでは、最終列(=クラスタ番号列)を「教師」として分類モデルを作成します。
教師に使えるクラスタ数(=分類数)は、2~15です。
クラスタ数がこの範囲になるデータをアップロードしてください。

また、教師なしクラスタリング用のクラスタ番号列の無いデータをアップロードした可能性も考えられます。
適切なクラスタ数のデータがない場合は、

  • 教師なしクラスタリングを利用する
  • 特定の属性で上手くデータを分割できないか検討する(例えば性別などで)
  • クラスタを統合する
などの対処方法が考えられます。

具体的な解析の手順について、当社データサイエンティストが助言させていただく データ変換サービス もございます。

エラー/アラート(クラスタリング):各列のカテゴリ数を100以下にして・・・

各列のカテゴリ数を100以下にして実行をお願いします。
列番号:XXXX、 列名:XXXX

このエラーメッセージは、アップロードされたファイルに、カテゴリが100種類以上存在する列がある、場合に表示されます。

例えば、

  • 合計購入金額をそのまま使用
した場合などに起こります。
「~1万円」→1、「1万円~5万円」→2、「5万円~10万円」→3、「10万円~」→4
の4カテゴリに分けるなどのデータ加工が必要です。

また、先頭列以外に連番のあるファイルをアップロードすると、このエラーが出てしまいます。
併せてご確認ください

具体的な解析の手順について、当社データサイエンティストが助言させていただく データ変換サービスもございます。

エラー/アラート(クラスタリング):クラスタ番号列の値が全て同じ・・・

クラスタ番号列の値が全て同じになっています。

このエラーメッセージは、教師ありクラスタリングにおいて、アップロードされたモデル作成用ファイルで、
最終列が全て同じ値になっている、場合に表示されます。
全ての行が同じクラスタ(=クラスタ数が1)では、分類モデルは作成できません。

教師ありのクラスタリングでは、最終列(=クラスタ番号列)を「教師」として分類モデルを作成します。
教師に使えるクラスタ数(=分類数)は、2~15です。
クラスタ数がこの範囲になるデータをアップロードしてください。
適切なクラスタ数のデータがまだない場合は、「教師なしクラスタリング」をご利用ください。

具体的な解析の手順について、当社データサイエンティストが助言させていただく データ変換サービスもございます。

エラー/アラート(クラスタリング):クラスタ番号列に、数字以外の文字・・・

クラスタ番号列に、数字以外の文字か空の値が含まれています。

このエラーメッセージは、教師ありクラスタリングにおいて、アップロードされたモデル作成用ファイルで、
最終列に適切なクラスタ番号が入っていない、場合に表示されます。
整数以外の数値や文字列が入っていたり、そもそもクラスタ番号がない行がある、ということになります。

教師ありのクラスタリングでは、既にクラスタ番号の付与されたデータを用いる必要があります。 まだクラスタ番号のないデータを、初めて分類する場合は「教師なしクラスタリング」を使用します。

具体的な解析の手順について、当社データサイエンティストが助言させていただく データ変換サービスもございます。

エラー/アラート(クラスタリング):データの偏りが大きかったため・・・

データの偏りが大きかったため、クラスタリング処理を中断しました。

このエラーメッセージは、アップロードされたファイルに、個人属性情報が全く同じのIDが多い、場合に表示されます。

  • 個人属性列が少ない場合
  • カテゴリを統合しすぎた場合
に起こりやすいエラーです。
変数を増やすか、カテゴリ数を増やす、という対策が考えられます。

カテゴリを統合しすぎた場合というのは、
例えば、年齢という列があった場合に、
・10代、20代、30代、40代、50代、60代、70代以上
とすれば、カテゴリ数は7になりますが、
・40歳未満、40歳以上
としてしまうと、カテゴリ数は2になってしまいます。

年齢を2カテゴリにしたほうが良い場合もありますので、一概には言えませんが、
このエラーが出る場合には、対策として有効です。

具体的な解析の手順について、当社データサイエンティストが助言させていただく データ変換サービスもございます。

エラー/アラート(クラスタリング):個人属性情報が含まれていない行があります

個人属性情報が含まれていない行がありますがよろしいですか。

このエラーメッセージは、アップロードされたファイルに、カンマしかない行が含まれている、場合に表示されます。

そのようなファイルを意図的に投入された場合は、OKを押して、解析に進んでください。
意図的でない場合は、ファイルの取り違えや、データ作成の誤りなどが疑われますので、ご確認ください。


スコアリング

効率化シミュレーション

「1件対応当たりの費用」「1レスポンス当たりの売上」「対応件数」を入力すると予測結果に基づいて売上予測や利益予測を算出します。ランキングの上位何件まで配信 を行えばよいかを判断することができます。

スコアリング予測を作成する

予測

モデルで抽出したロジックと予測用データの属性情報をもとに、各レコードにスコア付を行うプロセスです。
予測には今後の管理のため名称を指定することができます。

 

予測用ファイル

「ファイルを選択」をクリックして、予測作成用のCSVファイルを指定してください。
「解析を開始する」をクリックすると予測が始まります。

モデル評価値 – スコアリング

   

モデル評価値とは、作成したモデルをもとに予測を行った際に、より良い結果を出すことができるかを表した指標です。
1に近いほど「良い」モデルであるとみなすことができ、評価値が0.7以上であれば「良い」モデルである目安となります。
正解がスコア上位に集まればモデル評価値が良くなり、ゲインチャートは上に膨らみを持った曲線となります。

img

   

左)モデル評価値が高い場合のゲインチャート:右)モデル評価値が低い場合のゲインチャート

デシル分布

   

デシル分布とは顧客をスコアの高い順に並べ、10等分し、10のグループに分けた場合の属性分布のことです。
グラフの目盛りの1が10等分した中で一番スコアの高い集団、10がスコアの一番低い集団を表しています。

img

   

スコアリングサンプルデータ

ご利用方法とサンプルデータ

サンプルデータをご利用戴き、bodaisの利用方法をご確認いただけます。
サンプルデータをこちらからダウンロードしてください。

サンプルデータについて

Readme.txt

サンプルデータに関する注意事項など記載しております。 はじめにご覧ください。

(A)モデル用データ.csv

bodaisでのモデル構築に利用するサンプルデータです。

(B)予測用データ.csv

bodaisでの予測に利用するサンプルデータです。

(C)検証用データ.csv

bodaisで構築したモデルによる予測の効果を検証するためのサンプルデータです。

(F)変換方法.xls

モデル構築や予測に利用するデータを、bodais用に加工する方法の例を記載したファイルです。
(A)(B)のサンプルデータがどのように作成されたかが、わかるものになっています。

(G)データ変換定義.csv

サンプルデータにおけるカテゴリ値とカテゴリ名称の対応表です。
本ファイルをアップすることで、画面に表示されるカテゴリ値をカテゴリ名称に変換して表示することが出来ます。

レスポンスチャート

レスポンスチャートとは、横軸にスコア降順位、縦軸にスコア降順位までの累積レスポンス率(累積レスポンス数÷アクション数)を描いた曲線です。目標とするレスポンス率を条件とした場合に、どれだけアクションできるかが分かります。
DM配信を例に取ると、図の場合に、目標とするレスポンス率を22%前後とするなら、約9,000通配信が可能といえます。 なお、グレー線のAVG(Average)はbodaisを使用しなかった場合のレスポンス率を表しています。

img

ゲインチャート

ゲインチャートとは、横軸にスコア降順位、縦軸にスコア降順位までの累積レスポンス数を描いた曲線です。
予測モデルを使用した場合と、予測モデル未使用の場合の差分がわかります。
グリーンの曲線(bodais使用時のレスポンス数)とグレーの直線(bodais未使用時のレスポンス数)を比較し、膨らみが大きいほうが、より効果的なモデルといえます。

img

スコアリングモデルを作成する

モデル

属性情報に対応する正解フラグをもとにロジックを抽出するプロセスです。 モデルには今後の管理のため名称を指定することができます。

モデル用ファイル

「ファイルを選択」をクリックして、モデル作成用のCSVファイルを指定してください。
データの行数が100件未満だとデータが少なすぎて解析できません。
データは多いほうが解析精度が良いので、できるだけ1,000件以上のデータを投入するようにしてください。

bodais FTPアップロード機能チュートリアル

1. はじめに

サービスの概要

bodaisでは、http接続ではアップロードできないような大きな容量のデータファイル(10万行を超えるファイル)のアップロードに対して、FTPクライアントを使用したファイルアップロード機能で対応しております。各bodaisユーザーは専用のディレクトリ領域を有しており、固有の「ユーザー名」「パスワード」でその領域に接続しファイルをアップロードすることが可能です。

2. ユーザー名、パスワードの発行

ユーザー名・パスワードの発行

ユーザー固有の「ユーザー名」「パスワード」は、bodaisアカウント発行時にbodais-supportよりご連絡しております。もし「ユーザー名」「パスワード」をお忘れの場合は、bodaisヘルプデスクまでご連絡ください。

3. FTPクライアントによるファイルアップロード

はじめに

使用するFTPクライアントに制限はございませんが、本マニュアルでは「FFFTP」を使用した場合を想定しご説明いたします。「FFFTP」はフリーのFTPクライアントで、日本で広く使用されており多くのオンラインソフト公開ページで配布されています。基本操作は多くのFTPクライアントで共通となりますので、FTPクライアントはその他の一般的なものでも構いません。実際に使用するFTPクライアントはお客様ご自身でダウンロード・インストールしてご使用下さい。

FTPクライアントによる接続

FTPクライアントからユーザー固有の領域に接続します。以下「FFFTP」の画像を使用しご説明いたします。


FFFTPデフォルト画面

img

メニューから「接続」、「ホストの設定」選択します

img

ホスト一覧画面から、「新規ホスト」を選択します

img

ホスト設定画面が開きますので必要項目を入力していきます。

ホストの設定名:お好きなホスト名を入力してください。※画像では仮に「bodais」と入力しています
ホスト名:「app.bodais.jp」と入力してください。
ユーザー名:発行された「ユーザー名」を入力してください。
パスワード/パスフレーズ:発行された「パスワード」を入力してください
PASVモードを使う:チェックを外してください。(「拡張」タブに項目があります)

img

img

「OK」ボタンを押してください。これ以外の項目は未入力で構いません。

「ホスト一覧」画面に戻るので、「接続」ボタンを押してください。

img

接続に成功しました

img

接続に失敗した場合はエラーメッセージが出るので設定を再度やり直してください。

img

FTPクライアントによるファイルアップロード

「フォルダの移動」を選択し、アップロードしたいファイルが格納されているフォルダを選択してください。

img

フォルダ内に格納されているファイルが表示されますので、アップロードしたいファイルを選択し「アップロード」ボタンを押してください。なお、ファイル名には半角英数のみ使用できます。

img

ファイルが右側の画面に表示され、アップロードに成功しました。

img

ファイルはドラッグアンドドロップでもアップロードすることが出来ます。

※bodaisでは、デフォルトの領域直下にアップロードされた「ファイル」しか認識できません。FTPクライアントで「フォルダ」を作成してもbodaisでは認識されませんので、フォルダを作成しないようにお願いします。

img

4. bodaisサービス画面でのファイルの選択

・bodaisサービスのモデル作成画面で、「FTPでアップロードしたファイルを使用」を選択してください。

img

・先ほどアップロードしたファイルが選択可能になっています。

img

・アップロードしたファイルを選択し、解析を開始してください。この後の作業は通常の解析と同様です。

なお、アップロードしたファイルは一度解析に使用するとbodais上のFTP領域から削除されますのでご注意ください。

bodaisスコアリング利用チュートリアル

1.概要・全体の流れ

サービスの概要

スコアリングサービスは、過去の実績をもとに、お持ちのリストをレスポンスの見込みの高い順にランキングするサービスです。
このサービスを用いて、

  • 過去の実績をもとにモデルを作成する【モデル作成】
  • お持ちのリストに予測スコアを付与する【予測】
  • 作成した予測の効果を検証する【検証】
  • 実際の結果をもとにモデルの再構築を行う【リモデル】

が可能です。

img

2.サンプルデータ

bodaisでは実際の解析の流れをつかんでいただくために、サンプルデータを用意しております。 サンプルデータは こちらからダウンロードできるようになっておりますのでご使用ください。
なお、サンプルデータでの解析は無料(課金対象外)ですので、お気軽に何度でもお試しいただくことが可能です。ただし、一部でもデータ書き換えなどがあると、課金対象となりますのでご注意ください。

3.ジョブ

ジョブとはbodaisのモデル・予測・検証を、プロジェクト毎にまとめて管理するための概念です。一つのジョブに、複数のモデルを作成することができます。またさらに、一つのモデルに複数の予測・検証を作成することが可能です。
まずはジョブを作成します。ご不明な場合は、ジョブのヘルプページをご覧ください。

4.モデル作成

モデル作成の項目では、属性情報と正解フラグをもとに、モデルの作成を行います。

img

モデル用データの準備(使用するデータ)

まず、お客様がお持ちの、スコアをつけたいデータをご用意いただきます。これをbodaisで解析することができる解析用データに加工していただきます。データは、ID(番号)、属性(顧客属性など)、正解フラグ(購入)の三つの部分で構成されている必要があります。
※以下ではサンプルデータを例に説明いたします。

img

IDは顧客の属性情報と正解フラグを管理するために設定します。この値が被ることはありません。
属性情報には顧客の「年齢」、「性別」などの基本情報から、「アクセス回数」、「最新アクセス日」、「購入回数」などの顧客の行動履歴などがあります。
正解フラグは、あるアクションがあった際の行動結果を表しています。望ましい結果が得られた際には「あり」、得られなかった際には「なし」で表示します。
データは下記の形式に従って、作成してください。

  • データ形式は、カンマ区切りテキスト(CSV形式)にします。
  • 1レコード目はデータ列の項目名を記入してください。
  • 1列目はユーザーを識別するためのIDにします(モデル作成には使われません)。
  • 2列目以降にユーザーの属性を記入します。 属性は整数でコード化してください(例:性別の場合、男性を1、女性を2とする)。
  • 最終列に正解フラグを記入します。 正解(あり)の場合1、正解でない(なし)場合0を記入してください。

モデルの作成

モデルの下の+ボタンをクリックし、新規モデル作成に移って下さい。 画面最下部の「新規モデルを作成する」でも同様の効果が得られます。
モデル名称を入力後、モデル用ファイルの「ファイルを選択」ボタンをクリックし、モデル用データを選択してください。

ファイルのアップロードが確認できたら、「解析を開始する」のボタンをクリックして下さい。
プレビュー画面が出てくるので、問題が無ければ最下部の「解析を開始する」をクリックして下さい。
モデル作成日時が「解析待ち」から「解析中」に変わり、最終的に日付に変わったら解析完了です。
解析完了後、次のような画面(モデル詳細情報)になります。

img

モデル詳細

モデルの詳細情報は「基本情報」、「ヒストグラム」、「デシル分布」、「効果指標」の4つで構成されています。

基本情報:基本情報は主に、モデルの詳細とチャートから成り立っています。詳細情報としては、モデルの名称・作成日時・モデルの評価値などを表示します。下の方までスクロールすれば、モデルに対応する予測の一覧も見る事ができます。
ヒストグラム:縦軸に度数、横軸に階級をとった統計グラフの一種
デシル分布:顧客をスコアの高い順に並べ10等分し、10のグループに分けた場合の属性分布のことです
効果指標:「どのカテゴリが効いているか」を確認することができる指標

レポーティング機能

bodaisではビジュアル化された解析結果をワンクリックでエクセル形式の報告書に出力でき、社内での報告書や企画書にすぐに反映できます。
レポート欄の「レポート取得」ボタン(上記画面の赤枠)をクリックしてください。報告書が自動で作成され、ダウンロードができるようになります。レポートはモデル・予測・検証全ての基本情報画面からダウンロードできます。

効果指標をダウンロード

bodaisでは「どのカテゴリが効いているか」を確認することができる指標、「効果指標」の一覧をダウンロードすることが出来ます。効果指標画面の「効果指標をダウンロードする」(下記画面の赤枠)をクリックしてください。CSV形式でダウンロードされます。

img

5.予測

予測の項目では、モデルで作成したモデルと、予測用データの属性の値を用いて「予測用データ」へのスコアリング(スコア付け)を行います。

img

予測用データの準備

まず、お客様がお持ちの、これからスコアを付与したいデータをご用意いただきます。これをbodaisで解析することができる解析用データに加工していただきます。加工は、モデル作成用データと同じ方法で行ってください。コードへの変換方法が、モデルの場合と異なると正しい解析結果が出ませんのでご注意ください。最終列に正解フラグ(購入のありなし)は必要ありません。
※ここではサンプルデータを使用することを前提としています。

予測用データの準備

予測の作成

画面上部概念図の「予測」の下の+をクリックして下さい。現れた画面から予測を作成します。基本的に、モデル作成時と同様の操作になります。 解析完了後、予測詳細画面が表示されます。表示内容は、モデル作成の場合とほぼ同様です。

6.検証

検証では、予測結果をもとにアクションを行った結果(実績)の検証ができるようになっています。予測と実績の精度比較や、各変数毎の適合度を検証し、次のアクションの検討が可能になっています。

img

検証用データの準備

実績データは以下のように個人IDと正解フラグの2つで成り立っています。
ID番号が予測データと異なっていると正しく検証が行えませんのでご注意下さい。

img

検証の作成

画面上部概念図の検証の下の+をクリックして下さい。現れた画面から検証を作成します。基本的に、モデル作成時と同様の操作になります。 解析完了後、検証詳細画面が表示されます。

img

検証の詳細情報は「全体検証」、「個別検証」の2つで構成されています。

全体検証

全体検証は主に、検証の詳細とチャートから成り立っています。詳細情報としては、モデル、予測、検証それぞれの名称・作成日時・評価値などを表示します。

個別検証

属性ごとの実績正解率、また平均正解率を示したグラフです。

7.リモデル

リモデルとはモデル用データに加えて、予測用データの「属性データ」と、検証用データの「正解フラグ」を組み合わせて新たにモデルを作ることを指します。 これにより、定期的なモデルの更新が簡単に行えます。
※古いモデルを使っていては、前提条件が異なるために現状に即した結果がでてこないことがあります。そのためモデルの更新は定期的に行うようにしてください。

リモデルの作成

検証詳細画面下部、もしくは右上の「リモデル」をクリックしてください。現れた画面からリモデルを作成します。基本的に、モデル作成時と同様の操作になります。

スコアチャート

スコアチャートとは、横軸にスコア降順位、縦軸にスコアを描いた曲線です。アクション数を条件として、さらに1回のアクションを行う場合の期待度を表します。
(DM配信を例に取ると、図の場合に、3,000通既に配信しているなら、それから1通配信する場合には23.45%のレスポンスが期待できる、といえます)

img

予測実績比較ゲインチャート

検証詳細とゲインチャートを表示しています。
ゲインチャートでは予測と実績の比較を行い、全体としての適合度の検証を行う事を可能にしています。



クラスタリング

bodaisクラスタリング利用チュートリアル

はじめに

サービスの概要

bodaisクラスタリングサービスは、お持ちのデータを、その属性に応じて分類(クラスタリング)するサービスです。本サービスには、「教師なし」及び「教師あり」と呼ばれる2つのサービスを含みます。「教師なし」は、分類のついていないデータに分類を付与するサービスです。「教師あり」は、既に分類のついているデータを用いて分類モデルを構築し、新しいデータに分類を付与(予測)するサービスです。

「教師なし」クラスタリング

  1. 既存の、分類がついていないデータに対してbodaisにより統計的に分類を付与します。
  2. 分類を付与したデータを、次の教師ありクラスタリングでの分類モデル構築に利用することができます。

「教師なし」クラスタリング

「教師あり」クラスタリング

  1. 既存の、分類がついているデータをbodaisに学習させ、分類モデルを構築します。
  2. 新たな、まだ分類のついていないデータに、分類を付与(予測)します。

「教師なし」クラスタリングと比較して、お客様が行った分類に基づいた分類付与を行うことが可能です。

「教師なし」クラスタリング

2. サンプルデータ

bodaisでは実際の解析の流れをつかんでいただくために、サンプルデータをご用意しています。
サンプルデータのページより、適切なものを選んでお使いください。 なお、サンプルデータでの解析は無料(課金対象外)ですので、お気軽に何度でもお試しいただくことが可能です。ただし、一部でもデータ書き換えなどがあると、課金対象となりますのでご注意ください。

3. ジョブ

ジョブとはbodaisのモデル・予測・検証を、プロジェクト毎にまとめて管理するための概念です。一つのジョブに、複数のモデルを作成することができます。またさらに、一つのモデルに複数の予測・検証を作成することが可能です。
まずはジョブを作成します。ご不明な場合は、ジョブのヘルプページをご覧ください。

4. モデル作成(教師なし)

モデル作成(教師なし)では、分類がついていないデータに対してbodaisにより分類を付与します。その後、結果をbodaisに学習させ、分類モデルを構築することもできます(教師ありのモデル作成)。

モデル(教師なし)用データの準備

まず、分類をつけたいデータをご用意いただきます。これをbodaisで解析することができる解析用データに加工していただきます。データは、ID(番号)、属性(顧客属性など)の二つの部分で構成されている必要があります。 ※以下ではサンプルデータを例に説明いたします。

「教師なし」クラスタリング

IDは、各レコード(データの1行)を一意に管理するために設定します。つまり、おなじIDを持つレコードが存在しないように番号を振る必要があります。
属性は、顧客の「年齢」、「性別」などの基本情報から、「アクセス回数」、「最新アクセス日」などの顧客の行動履歴などがあります。 (分類対象が、「顧客」でない場合にももちろんお使いいただけます。)
データは下記の形式に従って、作成してください。

  • データ形式は、カンマ区切りテキスト(CSV形式)にします。
  • 1レコード目はデータ列の項目名を記入してください。
  • 1列目はユーザーを識別するためのIDにします(モデル作成には使われません)。
  • 2列目以降にユーザーの属性を記入します。
  • 属性は整数でコード化してください(例:性別の場合、男性を1、女性を2とする)。

モデルの作成

モデルの下の+ボタンをクリックし、新規モデル作成に移って下さい。 画面最下部の「新規モデルを作成する」でも同様の効果が得られます。

モデルの作成
モデルの作成

モデル名称を入力し、教師データは「なし(クラスター生成)」を選択します。モデル用ファイルの「参照」ボタンをクリックし、教師なしクラスタリング用のデータを選択します。また、クラスタ数をプルダウンから「自動」又は数値を選択し指定します。
ファイルのアップロードが確認できたら、「解析を開始する」のボタンをクリックして下さい。 プレビュー画面が出てくるので、問題が無ければ最下部の「解析を開始する」をクリックして下さい。 モデル作成日時が「解析待ち」から「解析中」に変わり、最終的に日付に変わったら解析完了です。 解析完了後、次のような画面(モデルの詳細情報)になります。

モデルの作成

モデルの詳細情報は「基本情報」、「ヒストグラム」、「プロファイルチャート」、「バブルチャート」、「効果指標」の5つで構成されています。

基本情報

基本情報は主に、モデルの詳細とチャートから成り立っています。
詳細情報としては、モデルの名称・作成日時・モデルの評価値、分割クラスタ数、推奨クラスタ数が表示されます。
チャートには、セグメントボリューム、評価値分布、特徴属性リストが表示されます。
また上部の「クラスタ名を付与する」をクリックして各クラスタの名称を変更することができます。

レポーティング機能

bodaisではビジュアル化された解析結果をワンクリックでエクセル形式の報告書に出力でき、社内での報告書や企画書にすぐに反映できます。
レポート欄の「レポート取得」ボタンをクリックしてください。報告書が自動で作成され、ダウンロードができるようになります。レポートはモデル・予測・検証全ての基本情報画面からダウンロードできます。

クラスタ番号付きリストをダウンロード

作成したクラスタ番号を、アップロードしたデータに付与したリストをダウンロードできます。 基本情報画面下部の「クラスタ番号付きリストをダウンロードする」をクリックしてください。CSV形式でダウンロードされます。

効果指標をダウンロード

bodaisでは「どのカテゴリが効いているか」を確認することができる指標、「効果指標」の一覧をダウンロードすることが出来ます。効果指標画面の「効果指標をダウンロードする」(下記画面の赤枠)をクリックしてください。CSV形式でダウンロードされます。

分類結果を用いた教師ありモデルの作成

分類を付与したこのデータをbodaisに学習させることで、分類モデルを構築することができます(教師ありのクラスタリング)。モデル詳細の基本情報画面下部の「教師ありモデルを作成する」ボタンをクリックします。
詳細は、後述するクラスタリング(教師あり)をご覧ください。

5. モデル作成(教師あり)

モデル作成(教師あり)では、既存の、分類が付いているデータをbodaisに学習させ、分類モデルを構築します。
教師なしクラスタリングで付与した分類を使って、分類モデルを構築することも可能です。

モデル(教師あり)用データの準備

まず、お客様がお持ちの、分類がついているデータをご用意いただきます。これをbodaisで解析することができる解析用データに加工していただきます。データは、ID(番号)、属性(顧客属性など)、正解フラグ(クラスタ番号=分類)の三つの部分で構成されている必要があります。
※以下ではサンプルデータを例に説明いたします。

分類結果を用いた教師ありモデルの作成

データの作り方は、教師なしの場合と同様です。教師なしの場合に無かった「正解フラグ」は、最終列に入力してください。
正解フラグは、クラスタ番号、すなわち分類を記載します。分類は、整数で記載してください。なおクラスタ数の上限は「15」です。これ以上のクラスタ数では分析が行えません。ご注意ください。

モデルの作成

モデルの下の+ボタンをクリックし、新規モデル作成に移って下さい。 画面最下部の「新規モデルを作成する」でも同様の効果が得られます。
モデル名称を入力し、教師データは「あり(クラスター判別)」を選択します。モデル用ファイルの「参照」ボタンをクリックし、教師ありモデル用のデータを選択します。

分類結果を用いた教師ありモデルの作成

ファイルのアップロードが確認できたら、「解析を開始する」のボタンをクリックして下さい。 プレビュー画面が出てくるので、問題が無ければ最下部の「解析を開始する」をクリックして下さい。 モデル作成日時が「解析待ち」から「解析中」に変わり、最終的に日付に変わったら解析完了です。 解析完了後、モデル詳細画面が表示されます。表示内容は、教師なしの場合とほぼ同様です。

6. 予測

予測作成では、モデル作成で作った「分類モデル」を使って、新たな、まだ分類のついていないデータに、分類を付与します。

予測用データの準備

まず、お客様がお持ちの、これから分類付与したいデータをご用意いただきます。これをbodaisで解析することができる解析用データに加工していただきます。加工は、モデル作成用データと同じ方法で行ってください。コードへの変換方法が、モデルの場合と異なると正しい分析結果が出ませんのでご注意ください。最終列に正解フラグ(分類=クラスタ番号)は必要ありません。

分類結果を用いた教師ありモデルの作成

予測の作成

画面上部の概念図の「予測」の下の+をクリックして下さい。現れた画面から予測を作成します。基本的に、モデル作成時と同様の操作になります。
解析完了後、予測詳細画面が表示されます。表示内容は、モデル作成の場合とほぼ同様です。

7. 検証

検証では、作成した分類モデルが、適切な分類付与を行えているかどうかを検証することができます。
ただし利用できるのは、事後的に正しい分類がわかる場合に限られます。

検証用データの準備

事後的に正しい分類がわかったデータをご用意いただきます。以下のように予測データのID番号とその正解フラグ(正解クラスタ番号=事後的にわかった正しい分類)が2列で記載されているcsvファイルを作成してください。ID番号が予測データと異なっていると正しく検証が行えませんので、ご注意ください。

検証用データの準備

検証の作成

画面上部の概念図の「検証」の下の+をクリックして下さい。現れた画面から検証を作成します。基本的に、モデル作成時と同様の操作になります。
完了後、次のような画面になります。

検証の作成<

検証の詳細情報は「全体検証」、「個別検証」の2つで構成されています。

全体検証

全体検証は主に、検証の詳細とチャートから成り立っています。詳細情報としては、モデル、予測、検証それぞれの名称・作成日時・評価値などを表示します。

個別検証

属性ごとのクラスタ正解率、また平均正解率を示したグラフです。

8.リモデル

リモデルでは、モデル用データに加えて、予測用データ、そして検証で用いたその正解フラグを組み合わせて新たにモデルを構築します。これにより、定期的なモデルの更新が簡単に行えます。
※古いモデルを使っていては、前提条件が異なるために現状に即した結果がでてこないことがあります。そのためモデルの更新は定期的に行うようにしてください。

リモデルの作成

検証詳細画面下部の「リモデル」をクリックして下さい。現れた画面からリモデルを作成します。基本的に、モデル作成時と同様の操作になります。

クラスタ数

以下のクラスタ数を表示しています。
教師なしの場合:分割するクラスタ数
教師ありの場合:アップロードしたファイルのクラスタの種類の数

特徴属性リストをダウンロードする

全属性・カテゴリのクラスタ特徴度を表示しています。
クラスタに特徴的なカテゴリは、高いスコアになります。
スコアが高いものは赤、スコアが低いものは青で表示されます。

クラスタ名を付与する

各クラスタの名称を指定することができます。

所属確率

モデルによって、当該のサンプルが、各クラスタに振り分けられる確率のこと。
ルールとしては、当該の属性カテゴリを持つサンプルが、各クラスタに振り分けられる確率を用います。

バブルチャート

バブルチャートとはクラスタ間の関係を見るため、各クラスタを2次元にプロットした図です。
円の大きさはそのクラスタのサンプル数を表しています。
クラスタ間の距離が近いほど、そのクラスタ同士が類似していることを示しています。
グラフの軸は、多次元データであるクラスタを2次元にマッピングした際の第1因子(横軸)、第2因子(縦軸)を表しています。

バブルチャート

因子軸は多次元データであるクラスタを2次元にマッピングした際の軸で、横軸は第1因子、縦軸は第2因子を表しています。
各属性の順位はその属性の因子への寄与の大きさを表しています。
[全てを見る]をクリックすると、すべての属性の因子の大きさを見ることができます。

プロファイルチャート

プロファイルチャートとはクラスタごとの属性分布のことです。
例えば下図では、会員属性の分布が、各クラスタでどのように異なるか、を見ることができます。
一番左のCL1(クラスタ1)では、カテゴリ1(ゴールド会員)が109人(全体の41.13%)、カテゴリ2(シルバー会員)が68人(25.66%)、カテゴリ3(通常会員)が29人(10.94%)、カテゴリ4(非会員)が59人(22.26%)だということがわかります。

バブルチャート

セグメントボリューム

クラスタ番号が付与されたサンプル数を、クラスタごとに計数したグラフです。
各クラスタに該当するデータが、何件あったのかを把握することができます。

セグメントボリューム

推奨クラスタ数

サンプルデータから統計的に良いクラスタ数を計算し表示しています。

特徴属性リスト

各クラスタを表す、特徴的な属性を示しています。全体平均よりも、その属性に該当するレコードの比率が、一定以上高いものが表示されています。
例えば下記の例だと、CL1(クラスタ1)は、「最新アクセス日_2ヶ月以内」という性質を持っていることが多い、ということがわかります。逆に言うと、「最新アクセス日_2ヶ月以内」の場合は、CL1に分類される可能性が高い、とも解釈することができます。

セグメントボリューム

クラスタ名変更

クラスタの名称を変更することができます。
各チャートに反映されるので、クラスタの特徴を表すような名称を付けると良いでしょう。

クラスタリングモデルを作成する

モデル

属性情報に対応する正解フラグ(=クラスタ、教師データ)をもとに、ロジックを抽出するプロセス。
教師なしの場合は、クラスタを付与する解析も含みます。
また、モデルには今後の管理のため名称を指定することができます。

教師データ

正解フラグ(クラスタ番号=分類)のことです。
bodaisクラスタリングサービスでは、あり、なしを選択できます。
「教師なし」は、入力するモデル作成用ファイルに、まだクラスタ情報(分類)がついていない場合に選択します。教師なしクラスタリングにより分類を付与します。
「教師あり」は、入力するモデル作成用ファイルに、すでにクラスタ情報(分類)がついている場合に選択します。分類モデルを構築します。

クラスタ数

分類の数です。
「教師なし」の場合には、分割するクラスタ数を指定できます。
「自動」の場合は、統計的に良いクラスタ数を計算し、クラスタ分割を行います。

モデル用ファイル

「ファイルを選択」をクリックして、モデル作成用のCSVファイルを指定してください。
「教師なし」を選択している場合は、最右列に、クラスタ情報が入っていないファイルをアップロードしてください。
「教師あり」を選択している場合は、最右列に、クラスタ情報が入っているファイルをアップロードしてください。

クラスタリング予測を作成する

予測

モデルで抽出したロジックと予測用データの属性情報をもとに、各レコードに所属クラスタ付与を行うプロセスです。
予測には今後の管理のため名称を指定することができます。

予測用ファイル

「ファイルを選択」をクリックして、予測作成用のCSVファイルを指定してください。
「解析を開始する」をクリックすると予測が始まります。

モデル評価値 – クラスタリング

クラスタリングのモデル評価値とは、作成したモデルをもとに予測分類を行った際に、より良い結果を出すことができるかを表した指標です。
1に近いほど「良い」分類ができているとみなすことができ、評価値が0.7以上であれば「良い」モデルである目安となります。

クラスタリングサンプルデータ

ご利用方法とサンプルデータ

サンプルデータをご利用戴き、bodaisの利用方法をご確認いただけます。
サンプルデータを こちらからダウンロードしてください。

サンプルデータについて

Readme.txt

サンプルデータに関する注意事項など記載しております。 はじめにご覧ください。

(A)モデル用データ(教師なし).csv

bodaisでのモデル構築に利用する教師なしのサンプルデータです。

(B)モデル用データ(教師あり).csv

bodaisでのモデル構築に利用する教師ありのサンプルデータです。

(C)予測用データ.csv

bodaisでの予測に利用するサンプルデータです。

(D)検証用データ.csv

bodaisで構築したモデルによる予測の効果を検証するためのサンプルデータです。

(F)変換方法.xls

モデル構築や予測に利用するデータを、bodais用に加工する方法の例を記載したファイルです。
(A)(B)(C)のサンプルデータがどのように作成されたかが、わかるものになっています。

(G)データ変換定義.csv

サンプルデータにおけるカテゴリ値とカテゴリ名称の対応表です。
本ファイルをアップすることで、画面に表示されるカテゴリ値をカテゴリ名称に変換して表示することが出来ます。

bodais FTPアップロード機能チュートリアル

1. はじめに

サービスの概要

bodaisでは、http接続ではアップロードできないような大きな容量のデータファイル(10万行を超えるファイル)のアップロードに対して、FTPクライアントを使用したファイルアップロード機能で対応しております。各bodaisユーザーは専用のディレクトリ領域を有しており、固有の「ユーザー名」「パスワード」でその領域に接続しファイルをアップロードすることが可能です。

2. ユーザー名、パスワードの発行

ユーザー名・パスワードの発行

ユーザー固有の「ユーザー名」「パスワード」は、bodaisアカウント発行時にbodais-supportよりご連絡しております。もし「ユーザー名」「パスワード」をお忘れの場合は、bodaisヘルプデスクまでご連絡ください。

3. FTPクライアントによるファイルアップロード

はじめに

使用するFTPクライアントに制限はございませんが、本マニュアルでは「FFFTP」を使用した場合を想定しご説明いたします。「FFFTP」はフリーのFTPクライアントで、日本で広く使用されており多くのオンラインソフト公開ページで配布されています。基本操作は多くのFTPクライアントで共通となりますので、FTPクライアントはその他の一般的なものでも構いません。実際に使用するFTPクライアントはお客様ご自身でダウンロード・インストールしてご使用下さい。

FTPクライアントによる接続

FTPクライアントからユーザー固有の領域に接続します。以下「FFFTP」の画像を使用しご説明いたします。


FFFTPデフォルト画面

img

メニューから「接続」、「ホストの設定」選択します

img

ホスト一覧画面から、「新規ホスト」を選択します

img

ホスト設定画面が開きますので必要項目を入力していきます。

ホストの設定名:お好きなホスト名を入力してください。※画像では仮に「bodais」と入力しています
ホスト名:「app.bodais.jp」と入力してください。
ユーザー名:発行された「ユーザー名」を入力してください。
パスワード/パスフレーズ:発行された「パスワード」を入力してください
PASVモードを使う:チェックを外してください。(「拡張」タブに項目があります)

img

img

「OK」ボタンを押してください。これ以外の項目は未入力で構いません。

「ホスト一覧」画面に戻るので、「接続」ボタンを押してください。

img

接続に成功しました

img

接続に失敗した場合はエラーメッセージが出るので設定を再度やり直してください。

img

FTPクライアントによるファイルアップロード

「フォルダの移動」を選択し、アップロードしたいファイルが格納されているフォルダを選択してください。

img

フォルダ内に格納されているファイルが表示されますので、アップロードしたいファイルを選択し「アップロード」ボタンを押してください。なお、ファイル名には半角英数のみ使用できます。

img

ファイルが右側の画面に表示され、アップロードに成功しました。

img

ファイルはドラッグアンドドロップでもアップロードすることが出来ます。

※bodaisでは、デフォルトの領域直下にアップロードされた「ファイル」しか認識できません。FTPクライアントで「フォルダ」を作成してもbodaisでは認識されませんので、フォルダを作成しないようにお願いします。

img

4. bodaisサービス画面でのファイルの選択

・bodaisサービスのモデル作成画面で、「FTPでアップロードしたファイルを使用」を選択してください。

img

・先ほどアップロードしたファイルが選択可能になっています。

img

・アップロードしたファイルを選択し、解析を開始してください。この後の作業は通常の解析と同様です。

なお、アップロードしたファイルは一度解析に使用するとbodais上のFTP領域から削除されますのでご注意ください。

弊社サービスに関するお問い合わせ・ご相談についてはお気軽にお問い合わせください。

お問い合わせはこちら 

03-5259-9004
受付時間 月~金 10:00~18:00 ※土日祝日、年末年始は除きます