bodais 自動進化型データ解析
クラウドプラットフォーム

03-5359-9004 受付:平日10:00~18:00 

  • TOP
  • よくある質問

はじめに

キーボードでCapsLock がオンになっていないことと、キーボードの言語設定が正しいことを確認し、正しいIDとパスワードが入力されているか確認してください。

それでもログインできない場合は、以下ヘルプデスク宛にご登録の会社名・部署名・利用者名・利用メールアドレスをご連絡ください。ヘルプデスクより追ってご連絡させていただきます。

ヘルプデスク

  1. ログイン後、右上にある『スパナ』マークを押します。
  2. 『パスワードの変更』を選択します
         

    bodaisパスワード画面

         
  3. 「パスワードの変更」ページが表示されます。

    『現在のパスワード』欄に今お使いのパスワードを、[新パスワード]欄にこれから使いたい新しいパスワードを入力します。
    『確認のためもう一度入力』欄にも、同じように入力します。

       

    bodaisパスワード画面

  4. 『変更』ボタンを押すと、変更が完了します。

ログイン画面の「パスワードを忘れましたか?」をクリック

      

画面よりEメールを送っていただき、パスワードの再設定を手順に従って行ってください。

  1. ログイン後右上にある「スパナ」マークを押します。
  2. 『パスワードの変更』を選択します

    bodaisパスワード画面

  3. 「登録情報確認」を選択します。

    bodaisパスワード画面

  4. 『変更』ボタンを押すと、変更が完了します。
  1. ログイン後右上にある「スパナ」マークを押します。

  2. 「ご利用年月」で確認したい年月を選択すれば、ご利用ポイントを確認できます。

    bodaisパスワード画面

  3. 「ご利用年月」で確認したい年月を選択すれば、ご利用ポイントを確認できます。

    bodaisパスワード画面

以下ヘルプデスク宛にご登録の会社名・部署名・利用者名・利用メールアドレスをご連絡ください。
担当者より追ってご連絡させていただきます。

ヘルプデスク

操作に困ったら

一般的にデータ解析を行う際には、解析結果の精度を上げるため「変数選択」「変数加工」といったデータのクレンジング処理を手動で行う必要があります。
bodaisでは弊社研究者が開発したクレンジングロジックにより、様々なクレンジング処理が自動で行われています。この機能をオートクレンジング機能と言い、統計知識のない方でも簡単にデータ解析を行うことが可能となっております。例えば、クレンジング処理には以下のような処理があります。

カテゴリ統合

サンプル数の少ないカテゴリを他のカテゴリに統合することで、統計的信頼性の確保を行います。

カテゴリ統合情報

サンプル数の極端に少ないカテゴリは、他のカテゴリに統合することで統計的信頼性の確保を行っています。
図の場合ですと、最新アクセス日において、「3ヵ月以上」のカテゴリは、「3ヵ月以内」のカテゴリへ統合され、 新しく「3ヵ月以内′」というカテゴリとなっています。
なお、統合されたカテゴリには「’」が表示されます。

カテゴリ統合情報表

欠損処理

投入されたデータに欠損がある場合、「欠損」というカテゴリとして解析を行います。
なお、欠損データが多すぎる場合には、モデル作成に悪影響を与えるため、モデル作成から除外します。

相関処理

正解と各変数の相関係数を計算し、閾値以上になった『変数』を削除します。 詳しくは「無効な属性/カテゴリ」をご覧ください。

マルチコ処理

各変数カテゴリ間(同一の変数を除く)の相関係数またはVIF値が高いものを削除します。

bodaisでは欠損データが多い属性や、他のカテゴリと関連が強いカテゴリについては、モデル作成に悪影響を与えるため、システムで自動的に判定し、モデル作成から除外しています(クレンジング処理)。
除外されたカテゴリは、モデル詳細画面の、効果指標・無効な属性/カテゴリ欄にて確認できます。

img

無効な属性/カテゴリ

「無効な属性/カテゴリ」にはモデル作成時に除外されたカテゴリが記載されています。 欠損データが多すぎる場合や、他のカテゴリと関連が強いカテゴリについて、モデル作成に悪影響を与えるためシステムで自動的に判定しモデル作成から除外しています。
他のカテゴリと関連が強いというのは、モデル作成に同じような影響を与えるデータを示します。 同じ影響を与えるカテゴリが複数ある場合、システムが自動判定し一方のカテゴリをモデル作成から除外します。

スコアリング

スコア付きリストをダウンロードする

img

クラスタリング

クラスタ番号付きリストをダウンロードする

作成したクラスタ番号を、アップロードしたデータに付与したリストをダウンロードできます。 教師なしの場合、モデルの基本情報画面最下部にある「クラスタ番号付きリストをダウンロードする」ボタンをクリックしてください。CSV形式でダウンロードされます。

img

教師ありの場合、予測の基本情報画面最下部にある「クラスタ番号付きリストをダウンロードする」ボタンをクリックしてください。
CSV形式でダウンロードされます。

img

効果指標とは「どのカテゴリが効いているか」を確認することができる指標です。
スコアリングの場合-100~100の値を、クラスタリングの場合0~100の値を取ります。

スコアリング:効果指標

効果指標は「どのカテゴリが効いているか」を確認することができる指標です。
効果指標の値が、
「0よりも大きければ大きいほど、正解を増加させる影響力がある」 、逆に
「0よりも小さければ小さい(マイナス値が大きい)ほど、正解を減少させる影響力がある」ということになります。
値は-100~100をとり、効果指標画面の「効果指標をダウンロードする」をクリックすると効果指標一覧をダウンロードすることが出来ます。

img

モデルが直感と合うか確認

各カテゴリにおける影響力の大小が、マーケッターの方の感覚と合うかご確認いただくことが可能です。

施策の検討

影響力のあるカテゴリを参考にして、様々な施策を検討いただくことが可能です。

新規リスト収集の参考

今後新規リストを収集される際などに、より可能性の高いリストを集めるのに参考にしていただくことが可能です。

クラスタリング:効果指標

効果指標は「どのカテゴリが効いているか」を確認することができる指標です。
効果指標の値が、
「0よりも大きければ大きいほど、クラスタを区別(識別)する影響力がある」ことを示しています。
つまり、クラスタごとに違いの出やすいカテゴリだと言い換えることもできます。
値は0~100をとり、効果指標画面の「効果指標をダウンロードする」をクリックすると効果指標一覧をダウンロードすることが出来ます。

img

      

モデル評価値とは作成したモデルの良し悪しを判断する指標の一つで、評価値0.7以上が「良い」モデルの目安とされています。
予測の精度とは異なりますのでご注意ください。

スコアリング・モデル評価値

モデル評価値とは、作成したモデルをもとに予測を行った際に、より良い結果を出すことができるかを表した指標です。
1に近いほど「良い」モデルであるとみなすことができ、評価値が0.7以上であれば「良い」モデルである目安となります。 正解がスコア上位に集まればモデル評価値が良くなり、ゲインチャートは上に膨らみを持った曲線となります。 img 左)モデル評価値が高い場合のゲインチャート:右)モデル評価値が低い場合のゲインチャート

クラスタリング・モデル評価値

クラスタリングのモデル評価値とは、作成したモデルをもとに予測分類を行った際に、より良い結果を出すことができるかを表した指標です。 1に近いほど「良い」分類ができているとみなすことができ、評価値が0.7以上であれば「良い」モデルである目安となります。

ヒストグラムや効果指標一覧画面において、カテゴリ名にダッシュ「’」がついている場合があります。
これは、bodaisのオートクレンジング機能によりカテゴリ統合が行われた際に「’」が表示されます。
どのカテゴリが統合されたのかは、モデル詳細画面の「カテゴリ統合情報」から確認できます。

1

カテゴリ統合

サンプル数の少ないカテゴリを他のカテゴリに統合することで、統計的信頼性の確保を行います。

カテゴリ統合情報

サンプル数の極端に少ないカテゴリは、他のカテゴリに統合することで統計的信頼性の確保を行っています。
図の場合ですと、最新アクセス日において、「3ヵ月以上」のカテゴリは、「3ヵ月以内」のカテゴリへ統合され、 新しく「3ヵ月以内′」というカテゴリとなっています。
なお、統合されたカテゴリには「’」が表示されます。

カテゴリ統合情報表

  1. ジョブ詳細を表示し、右上の「詳細メニューを表示する」をクリックします。

  2. 詳細メニューが開きますので、「このジョブを削除する」をクリックします。

  3. ジョブの削除が完了します。

エラー

カテゴリあたりの正解数が少ないため、モデルの信頼度が低い可能性があります。
カテゴリあたりの平均正解数: XXXX
(5以上が推奨されます)

このエラーメッセージは、アップロードされたモデルファイルの、カテゴリ当たりの正解数が少ない、場合に表示されます。

カテゴリ当たりの正解数が少ない、とはつまり、 ・正解数÷(個人属性列数×各カテゴリ数) が、5より少ないということです。 意味的には、 少ない正解を、多量の変数で予測すると、過学習になってしまう、 ということを表しています。 例えば、下記のようなデータだった場合、

  • 正解数が100
  • 個人属性列が10
  • 各列のカテゴリが4ずつ

100÷(10×4)=2.5
で、カテゴリ当たりの正解数が

  • 2.5
なので、推奨下限値の5を下回っており、信頼性が低い、となります。
100個の正解を当てるために、40個もカテゴリがあると、多すぎるということです。

計算式を見てわかるとおり、カテゴリあたりの正解数を増やすには、

  • 正解数を増やす
  • 個人属性列を減らす
  • カテゴリを減らす
の3つの方法があります。

正解数を増やすには、

  • 業務を進めて正解を増やす
  • 取り扱う課題(≒正解)の段階を変更する
などが考えられます。

対応しやすいのは、個人属性列を減らす、です。
一番効果の薄そうな(正解の増減に関係なさそうな)個人属性列を削ります。
次に対応しやすいのは、カテゴリを減らす、です。
例えば、47都道府県をそのまま数値化して投入している場合には、
関東地方、関西地方、のようにカテゴリを統合すれば、大幅に減らすことができます。

具体的な解析の手順について、当社データサイエンティストが助言させていただく データ活用カウンセリングサービス もございます。

モデル用データの平均正解率が低いため、モデルの信頼度が低い可能性があります。
平均正解率:XXXX

このエラーメッセージは、アップロードされたモデル作成用ファイルの最終列に「1」(正解)が少ない場合に表示されます。
正解数が全体の0.5%未満の場合、このメッセージが表示されます。 列数やカテゴリ数、データの性質、解析結果の使用シーン等々によって、必要になる正解数は異なります。

正解数が少ないと、その少数の正解を当てるためのモデルになってしまいますので、 過学習(オーバーフィッティング)になりがちです。
過学習になってしまうと、一見、モデルはうまく作れているように見えるのですが、 予測の際に、全く当たらない、ということが起こります。

過学習を避けるためにも、正解数を増やす必要があります。

  • 業務を進めて正解を増やす
  • 取り扱う課題(≒正解)の段階を変更する

などによって、解決する場合があります。
例えば、法人営業の効率化にbodaisスコアリングを使う、といった場合に、
正解を、

  • 受注
とせずに、
  • 商談化
にする、といった例です。
こうすると、比較的容易に正解数を増やすことが可能です。


具体的な解析の手順について、当社データサイエンティストが助言させていただくデータ活用カウンセリングサービスもございます。

不正なデータがあります。
個人属性値には整数を入力してください。

このエラーメッセージは、アップロードされたファイルの先頭列とヘッダー行以外の部分に、
小数や文字列が使用されている、場合に表示されます。

bodaisには、数値変換したデータをアップロードしていただく必要があります。

例)

  • 男性 → 1
  • 女性 → 2

データの数値変換を行ったにもかかわらず、このエラーメッセージが表示される場合は、

  • 小数の使用
がないか、ご確認ください。
EXCELでデータ変換をすると、見かけ上は「1」ですが、実際は「0.9999」などということがありますので、「.」で検索するなどして、小数が無いようにしてください。

データ変換を素早く簡単に行えるデータ変換アプリもございます。
また、データ変換ルールの決定をデータサイエンティストがお手伝いする データ変換サービスもございます。

不正なデータがあります。
正解には0または1を入力してください。

このエラーメッセージは、アップロードされたファイルの最終列(正解)に0または1以外の文字がある、場合に表示されます。
2以上の整数やその他数値、或いは文字列が使用されている、ということです。

  • 正解列の無いデータ(例えば、予測用データ)
  • 正解の種類が多いデータ(例えば、クラスタリング用データ)

が誤ってアップロードされた可能性があります。
アップロードされたファイルの最終列をご確認ください。

不正なデータがあります。
個人識別子には半角の英数記号を入力してください。

このエラーメッセージは、アップロードされたファイルの、先頭列(ID)が半角英数記号でない、場合に表示されます。

ひらがなやカタカナ、或いは全角英数文字が使用されていないか、
アップロードされたファイルの1列目をご確認ください。

非正解数が10未満です

このエラーメッセージは、アップロードされたモデル作成用ファイルの最終列に「1」(正解)が多い場合に表示されます。
正解「1」と不正解「0」が逆になっている可能性があります。
アップロードしたデータをご確認ください。

正解数が10未満です

このエラーメッセージは、アップロードされたモデル作成用ファイルの最終列に「1」(正解)が少ない場合に表示されます。
正解数が少ないと、その少数の正解を当てるためのモデルになってしまいますので、 過学習(オーバーフィッティング)になりがちです。

過学習になってしまうと、一見、モデルはうまく作れているように見えるのですが、 予測の際に、全く当たらない、ということが起こります。

過学習を避けるためにも、正解数を増やす必要があります。
などによって、解決する場合があります。

  • 業務を進めて正解を増やす
  • 取り扱う課題(≒正解)のレベルを変更する

例えば、法人営業の効率化にbodaisスコアリングを使う、といった場合に、正解を、

  • 受注
とせずに、
  • 商談化
にする、といった例です。
こうすると、比較的容易に正解数を増やすことが可能です。
また、正解数が10以上の場合でも、正解率が低い場合、モデルの信頼度が低い可能性があります。

具体的な解析の手順について、当社データサイエンティストが助言させていただくデータ活用カウンセリングサービスもございます。

モデルファイルが100行未満のため、解析できません。
件数を増やして実行をお願いします。

このエラーメッセージは、アップロードされたモデル作成用ファイルの、行数が少なすぎる、場合に表示されます。

bodaisスコアリングサービスの下限行数は、

  • 100行
となっております。

データ行数が多ければ多いほど、よいモデルを作ることができます。
モデル作成には500行以上のデータのご使用をご検討ください。
実際は、列数やカテゴリ数、データの性質、解析結果の使用シーン等々によって、必要になるデータ行数は異なるので、一概には言えませんが、大まかな指標として、捉えてください。

300行弱のデータで、実際に業務に使えるスコアリングが行えた事例もあるので、
行数が少ない場合も、まずは一度トライしていただくのも良いかもしれません。

それでもやはりデータ行数が足りない場合は、

  • 業務を進めてデータ行を増やす
  • (とりあえずの応急処置として)データをコピーして行数を増やす
  • 取り扱う課題(≒正解)の段階を変更する
などによって、解決する場合があります。

取り扱う課題の段階を変更する、というのは、
例えば、法人営業の効率化にbodaisスコアリングを使う、といった場合に、

  • 初回訪問済リストから、受注確率の高い顧客を見つける という課題設定でなく、
  • 未訪問リストから、アポ獲得確率の高い顧客を見つける
という課題設定にする、というような例です。
こうすると、比較的容易にデータ行を増やすことが可能です。

具体的な解析の手順について、当社データサイエンティストが助言させていただくデータ活用カウンセリングサービス

もございます。

クラスタ数が範囲外となりました。
クラスタ数は2~15の範囲にしてください。

このエラーメッセージは、教師ありクラスタリングにおいて、アップロードされたモデルファイルで、
クラスタ数が16以上ある、場合に表示されます。
最終列の数値の種類が、16種類を超えている、ということです。

教師ありのクラスタリングでは、最終列(=クラスタ番号列)を「教師」として分類モデルを作成します。
教師に使えるクラスタ数(=分類数)は、2~15です。
クラスタ数がこの範囲になるデータをアップロードしてください。

また、教師なしクラスタリング用のクラスタ番号列の無いデータをアップロードした可能性も考えられます。
適切なクラスタ数のデータがない場合は、

  • 教師なしクラスタリングを利用する
  • 特定の属性で上手くデータを分割できないか検討する(例えば性別などで)
  • クラスタを統合する
などの対処方法が考えられます。

具体的な解析の手順について、当社データサイエンティストが助言させていただく データ変換サービス もございます。

各列のカテゴリ数を100以下にして実行をお願いします。
列番号:XXXX、 列名:XXXX

このエラーメッセージは、アップロードされたファイルに、カテゴリが100種類以上存在する列がある、場合に表示されます。

例えば、

  • 合計購入金額をそのまま使用
した場合などに起こります。
「~1万円」→1、「1万円~5万円」→2、「5万円~10万円」→3、「10万円~」→4
の4カテゴリに分けるなどのデータ加工が必要です。

また、先頭列以外に連番のあるファイルをアップロードすると、このエラーが出てしまいます。
併せてご確認ください

具体的な解析の手順について、当社データサイエンティストが助言させていただく データ変換サービスもございます。

クラスタ番号列の値が全て同じになっています。

このエラーメッセージは、教師ありクラスタリングにおいて、アップロードされたモデル作成用ファイルで、
最終列が全て同じ値になっている、場合に表示されます。
全ての行が同じクラスタ(=クラスタ数が1)では、分類モデルは作成できません。

教師ありのクラスタリングでは、最終列(=クラスタ番号列)を「教師」として分類モデルを作成します。
教師に使えるクラスタ数(=分類数)は、2~15です。
クラスタ数がこの範囲になるデータをアップロードしてください。
適切なクラスタ数のデータがまだない場合は、「教師なしクラスタリング」をご利用ください。

具体的な解析の手順について、当社データサイエンティストが助言させていただく データ変換サービスもございます。

クラスタ番号列に、数字以外の文字か空の値が含まれています。

このエラーメッセージは、教師ありクラスタリングにおいて、アップロードされたモデル作成用ファイルで、
最終列に適切なクラスタ番号が入っていない、場合に表示されます。
整数以外の数値や文字列が入っていたり、そもそもクラスタ番号がない行がある、ということになります。

教師ありのクラスタリングでは、既にクラスタ番号の付与されたデータを用いる必要があります。 まだクラスタ番号のないデータを、初めて分類する場合は「教師なしクラスタリング」を使用します。

具体的な解析の手順について、当社データサイエンティストが助言させていただく データ変換サービスもございます。

データの偏りが大きかったため、クラスタリング処理を中断しました。

このエラーメッセージは、アップロードされたファイルに、個人属性情報が全く同じのIDが多い、場合に表示されます。

  • 個人属性列が少ない場合
  • カテゴリを統合しすぎた場合
に起こりやすいエラーです。
変数を増やすか、カテゴリ数を増やす、という対策が考えられます。

カテゴリを統合しすぎた場合というのは、
例えば、年齢という列があった場合に、
・10代、20代、30代、40代、50代、60代、70代以上
とすれば、カテゴリ数は7になりますが、
・40歳未満、40歳以上
としてしまうと、カテゴリ数は2になってしまいます。

年齢を2カテゴリにしたほうが良い場合もありますので、一概には言えませんが、
このエラーが出る場合には、対策として有効です。

具体的な解析の手順について、当社データサイエンティストが助言させていただく データ変換サービスもございます。

個人属性情報が含まれていない行がありますがよろしいですか。

このエラーメッセージは、アップロードされたファイルに、カンマしかない行が含まれている、場合に表示されます。

そのようなファイルを意図的に投入された場合は、OKを押して、解析に進んでください。
意図的でない場合は、ファイルの取り違えや、データ作成の誤りなどが疑われますので、ご確認ください。


お問い合わせ

bodaisヘルプデスク

bodaisに関するデータ入力・操作等のご質問をお受けいたします。

受付時間 月~金 10:00~18:00 ※土日祝日、年末年始は除きます
TEL 03-5259-9004

ご利用にあたって

お客様のご質問へは、担当者より折り返しのご回答をさせていただきます。
お問い合わせフォームからもご質問等お受けいたします。