bodais 自動進化型データ解析
クラウドプラットフォーム

03-5259-9004 受付:平日10:00~18:00 

bodais FTPアップロード機能チュートリアル

目次

1. はじめに

サービスの概要

bodaisでは、http接続ではアップロードできないような大きな容量のデータファイル(10万行を超えるファイル)のアップロードに対して、FTPクライアントを使用したファイルアップロード機能で対応しております。各bodaisユーザーは専用のディレクトリ領域を有しており、固有の「ユーザー名」「パスワード」でその領域に接続しファイルをアップロードすることが可能です。

2. ユーザー名、パスワードの発行

ユーザー名、パスワードの発行

ユーザー固有の「ユーザー名」「パスワード」は、bodaisアカウント発行時にbodais-supportよりご連絡しております。もし「ユーザー名」「パスワード」をお忘れの場合は、bodaisヘルプデスクまでご連絡ください。

3. FTPクライアントによるファイルアップロード

はじめに

使用するFTPクライアントに制限はございませんが、本マニュアルでは「FFFTP」を使用した場合を想定しご説明いたします。「FFFTP」はフリーのFTPクライアントで、日本で広く使用されており多くのオンラインソフト公開ページで配布されています。基本操作は多くのFTPクライアントで共通となりますので、FTPクライアントはその他の一般的なものでも構いません。実際に使用するFTPクライアントはお客様ご自身でダウンロード・インストールしてご使用下さい。

FTPクライアントによる接続

FTPクライアントからユーザー固有の領域に接続します。以下「FFFTP」の画像を使用しご説明いたします。

・FFFTPデフォルト画面

1

・メニューから「接続」、「ホストの設定」選択します

2

・ホスト一覧画面から、「新規ホスト」を選択します

3

・ホスト設定画面が開きますので必要項目を入力していきます。

ホストの設定名:お好きなホスト名を入力してください。※画像では仮に「bodais」と入力しています
ホスト名:「app.bodais.jp」と入力してください。
ユーザー名:発行された「ユーザー名」を入力してください。
パスワード/パスフレーズ:発行された「パスワード」を入力してください
PASVモードを使う:チェックを外してください。(「拡張」タブに項目があります)

4

4

「OK」ボタンを押してください。これ以外の項目は未入力で構いません。

・「ホスト一覧」画面に戻るので、「接続」ボタンを押してください。

6

・接続に成功しました

7

・接続に失敗した場合はエラーメッセージが出るので設定を再度やり直してください。

8

FTPクライアントによるファイルアップロード

・「フォルダの移動」を選択し、アップロードしたいファイルが格納されているフォルダを選択してください。

9

・フォルダ内に格納されているファイルが表示されますので、アップロードしたいファイルを選択し「アップロード」ボタンを押してください。なお、ファイル名には半角英数のみ使用できます。

10

・ファイルが右側の画面に表示され、アップロードに成功しました。

11

ファイルはドラッグアンドドロップでもアップロードすることが出来ます。
※bodaisでは、デフォルトの領域直下にアップロードされた「ファイル」しか認識できません。FTPクライアントで「フォルダ」を作成してもbodaisでは認識されませんので、フォルダを作成しないようにお願いします。

14

4. bodaisサービス画面でのファイルの選択

・bodaisサービスのモデル作成画面で、「FTPでアップロードしたファイルを使用」を選択してください。

12

・先ほどアップロードしたファイルが選択可能になっています。

13

・アップロードしたファイルを選択し、解析を開始してください。この後の作業は通常の解析と同様です。

なお、アップロードしたファイルは一度解析に使用するとbodais上のFTP領域から削除されますのでご注意ください。

クラスタリングサンプルデータ

ご利用方法とサンプルデータ

サンプルデータをご利用戴き、bodaisの利用方法をご確認いただけます。
サンプルデータをこちらからダウンロードしてください。

サンプルデータについて

・(A)モデル用データ(教師なし).csv
bodaisでのモデル構築に利用する教師なしのサンプルデータです。

・(B)モデル用データ(教師あり).csv
bodaisでのモデル構築に利用する教師ありのサンプルデータです。

・(C)予測用データ.csv
bodaisでの予測に利用するサンプルデータです。

・(D)検証用データ.csv
bodaisで構築したモデルによる予測の効果を検証するためのサンプルデータです。

・(F)変換方法.xls
モデル構築や予測に利用するデータを、bodais用に加工する方法の例を記載したファイルです。
(A)(B)(C)のサンプルデータがどのように作成されたかが、わかるものになっています。

・(G)データ変換定義.csv
サンプルデータにおけるカテゴリ値とカテゴリ名称の対応表です。
本ファイルをアップすることで、画面に表示されるカテゴリ値をカテゴリ名称に変換して表示することが出来ます。

モデル評価値 – クラスタリング

クラスタリングのモデル評価値とは、作成したモデルをもとに予測分類を行った際に、より良い結果を出すことができるかを表した指標です。
1に近いほど「良い」分類ができているとみなすことができ、評価値が0.7以上であれば「良い」モデルである目安となります。

クラスタリング予測を作成する

予測

モデルで抽出したロジックと予測用データの属性情報をもとに、各レコードに所属クラスタ付与を行うプロセスです。
予測には今後の管理のため名称を指定することができます。

予測用ファイル

「ファイルを選択」をクリックして、予測作成用のCSVファイルを指定してください。
「解析を開始する」をクリックすると予測が始まります。

クラスタリングモデルを作成する

モデル

属性情報に対応する正解フラグ(=クラスタ、教師データ)をもとに、ロジックを抽出するプロセス。
教師なしの場合は、クラスタを付与する解析も含みます。
また、モデルには今後の管理のため名称を指定することができます。

教師データ

正解フラグ(クラスタ番号=分類)のことです。
bodaisクラスタリングサービスでは、あり、なしを選択できます。
「教師なし」は、入力するモデル作成用ファイルに、まだクラスタ情報(分類)がついていない場合に選択します。教師なしクラスタリングにより分類を付与します。
「教師あり」は、入力するモデル作成用ファイルに、すでにクラスタ情報(分類)がついている場合に選択します。分類モデルを構築します。

クラスタ数

分類の数です。
「教師なし」の場合には、分割するクラスタ数を指定できます。
「自動」の場合は、統計的に良いクラスタ数を計算し、クラスタ分割を行います。

モデル用ファイル

「ファイルを選択」をクリックして、モデル作成用のCSVファイルを指定してください。
「教師なし」を選択している場合は、最右列に、クラスタ情報が入っていないファイルをアップロードしてください。
「教師あり」を選択している場合は、最右列に、クラスタ情報が入っているファイルをアップロードしてください。

クラスタ名変更

クラスタの名称を変更することができます。
各チャートに反映されるので、クラスタの特徴を表すような名称を付けると良いでしょう。

特徴属性リスト

各クラスタを表す、特徴的な属性を示しています。全体平均よりも、その属性に該当するレコードの比率が、一定以上高いものが表示されています。
例えば下記の例だと、CL1(クラスタ1)は、「最新アクセス日_2ヶ月以内」という性質を持っていることが多い、ということがわかります。逆に言うと、「最新アクセス日_2ヶ月以内」の場合は、CL1に分類される可能性が高い、とも解釈することができます。

tokutyou

推奨クラスタ数

サンプルデータから統計的に良いクラスタ数を計算し表示しています。

セグメントボリューム

クラスタ番号が付与されたサンプル数を、クラスタごとに計数したグラフです。
各クラスタに該当するデータが、何件あったのかを把握することができます。

3

評価値分布とは

モデル評価値分布

クラスタごとのモデル評価値をレーダーチャートで示しています。
各値は1に近いほど「良い」分類ができている、とみなせます。評価値0.7以上が「良い」目安となります。

予測評価値分布

予測評価値の、クラスタごとの値をレーダーチャートで示しています。
バランスが重要で、モデル評価値に比べ極端に低い値のクラスタがあった場合には、そのクラスタを別クラスタと統合、あるいは分割するようなことを検討したほうが良いかもしれません。

検証評価値分布

検証評価値の、クラスタごとの値をレーダーチャートで示しています。
バランスが重要で、モデル評価値に比べ極端に低い値のクラスタがあった場合には、そのクラスタを別クラスタと統合、あるいは分割するようなことを検討したほうが良いかもしれません。