• 用語集

用語集


ア行

アウトバウンドコール最適化

過去の顧客データと架電した回数、接続時間、通話中のポジティブワードの出現回数、商品お届けの曜日などのデータから、コンタクト確率や成約確率が高いお客様の特徴をデータ解析する事で、新しい顧客のコンタクト確率や成約確率を算出します。

アカウント・ベースド・マーケティング

優良な顧客に対して、効果的にアプローチする手法の一つ。幅広い顧客に対し均一に対応するのではなく、売上が最大化する顧客を明確にして戦略的に個別アプローチする手法。

アップセル

グラフィックデザイン及び動画編集、ウェブデザインのアプリケーションソフトウェアをサブスクリプション方式で利用できるサービス。

アトリビューション分析/間接効果

コンバージョンに至るまでにユーザーが流入したチャネルや接触したページが、どれほど最終的なコンバージョンに寄与したかを測定し、それぞれの経路やページの貢献度合いを評価・分析する手法。

アナリティクス

ある目的に基づいて、様々な分析手法やソフトウェアベースのアルゴリズムを駆使しながら、データに潜んでいる特定のパターンや相関関係などの知見を抽出することを意味する。

アフィリエイト広告

ユーザーが広告をクリックし、広告主のサイトで商品購入や会員登録などの成果が発生した際、その成果に対して報酬をお支払いする「成果報酬型広告」とも呼ばれるインターネット広告手法。成果につながらないユーザーの訪問に対して不要な費用が発生しないため、多くのインターネット広告(Web広告)の中でも優れた費用対効果を発揮しインターネット集客には欠かせない手法として、多くの企業に認知・導入されている。

アブストラクト

抽象的・抽象化(Abstraction)・要旨。

アプリケーション

ソフトウェアの一つで、特定の作業の目的に応じて設計されたもの。コンピューターで、使用者の業務に応じて作成したプログラム。

誤り検出・誤り訂正技術

情報伝送の信号は、ノイズやタイミングのずれの影響によりデータが破損し、正しく伝送できないことがあります。そのため、エラーを検出したり(誤り検出)、訂正したり(誤り訂正)する技術が必要となります。代表的な誤り検出の手法には「パリティチェック」「チェックサム」「CRC」などがあります。誤り訂正の手法には、ハミング符号、BCH符号、リード・ソロモン符号などがあります。

アルゴリズム

問題を解くための手順を定式化した形で表現したものをいう。

アンケート

質問調査のこと。情報収集のための調査手法のひとつで、あらかじめ用意した質問について多数の人から回答を集め、それを集計して資料化する手法。

案件化率向上

過去の成約データからモデルを構築し、それぞれのリード(潜在顧客)に最適な提案内容の推奨を導き出します。

イールドマネジメント/レベニューマネジメント

ホテルの収益を最大化するには、多少高い料金でも払ってくれるビジネス客を多く取り込みたいところですが、ビジネス客は予約が直前になるケースがほとんどです。 そこで、過去の客室収入・販売できた客室数・稼働率・滞在日数・宿泊人数・予約経路などのデータを基にビジネス客の需要予測を行います。

異常値

他のデータと明らかにかけ離れているデータのこと。

遺伝的 アルゴリズム

最適化問題の解法の一つ。複数ある解の候補を生物の個体に見立て、適応度の高い個体を優先的に残しつつ、候補の淘汰、交叉、突然変異の操作を繰り返して最終的に適応度の高い解を得ようとする手法。

インサイドセールス

電話、メール等を用いて顧客とのコミュニケーションを行う役割。主には商談機会の創出、提案・成約行為を行う。

インシデント

事故などの危難が発生するおそれのある事態を言う。

因子分析

多変量解析の一種。直接観測された変数は直接観測できない潜在的な変数(因子)の影響を受けていると仮定し、因子で観測データを説明する手法。共分散構造分析とは異なり、因子と観測データの関係をモデル化しない。

インプレッション

広告の露出を表す指標。延べ閲覧回数や延べ閲覧時間など。

インターフェース層

DXにおける顧客層とプラットフォーム層を結ぶ層。顧客層より取得したデータをプラットフォーム層に接続する。

インバウンドマーケティング

ブログ、ニュースリリース、動画などのコンテンツをWebで公開し、検索エンジンの結果ページに上位表示されたり、ソーシャルメディア(SNS)で共有・拡散されるような取り組みをしたりすることで、見込み顧客に見つけてもらい、自社やその商品・サービスに興味を持ってもらえるように仕掛けるマーケティング手法。

インプレッション

インプレッションとは、Webサイトに掲載される広告の効果を表す指標の一つである。サイトを開き広告が1回表示されると1インプレッションとなる。キャンペーンのインプレッションでは、広告を掲載したWebページの閲覧回数に、1ページあたりの掲載広告数を乗じたものになる。インプレッション数とは、広告が表示された回数のこと。広告が表示された回数が多いということは、自社の広告文や広告画像がインターネットユーザーの目に入る機会が多いということ。インプレッション数を増やすことでクリックされる機会増加を狙う。

インフルエンサー

世間に与える影響力が大きい行動を行う人物。そのような人物の発信する情報を企業が活用して宣伝すること。

引用解析

書籍の文献や雑誌の記事に記載されている引用(参考文献ともいう)について分析する。

ウェイトバック

サンプル集団と母集団で構成比が同じになるよう、サンプルに重みをつけて集計をすること。この重みをウェイト値、重みをつけた集計のことをウェイトバック集計という。

営業活動効率化

顧客属性や成約情報、過去の営業活動データを用いて、成約に至るまでに必要な営業活動を可視化(推奨)します。 また、過去の成約データからモデルを構築し、商談(案件)毎の成約確率を予測します。 これにより、どの案件を優先的に営業活動するかを可視化できます。

エグゼクティブサマリー

ビジネス目的で作成された短いドキュメントまたはドキュメントのセクション。長いレポートや提案、または関連するレポートのグループを要約して、読者がすべてを読むことなく大量の資料をすばやく理解できるようにする。

エンジン

特定の処理を行うための機能を提供するひとまとまりになった処理装置のこと。コンピュータを使用し、さまざまな情報処理を実行する機構。ITの分野では、入力を受け取ると決められた目的やルールに従って処理を施し出力を返すシステムや、システムの中核に据えられる汎用的なソフトウェアなどの意味で用いられることが多い。

エンタープライズ

IT業界における市場や製品カテゴリの区分の一つで、大企業や中堅企業、公的機関など、複数の部門で構成されるような比較的規模の大きな法人に向けた市場や製品のこと。

オーガニック

オーガニックとは、「検索連動型広告(リスティング広告)」などの広告表示を除いた検索結果からのトラフィック(サイトへのアクセス数)のこと。「自然検索」「ナチュラル検索」ともいう。

黄金ルート分析

顧客がロイヤルカスタマー(ある企業や商品やサービスに対しての忠誠心の高い顧客のこと)に至るまでの購入意向(黄金ルート)を割り出すための分析手法。

オーディエンスデータ

ある人の属性情報と行動ログ。

オートクレンジング機能

一般的にデータ解析を行う際には、解析結果の精度を上げるため「変数選択」「変数加工」といったデータのクレンジング処理を手動で行う必要があります。 bodaisでは弊社研究者が開発したクレンジングロジックにより、様々なクレンジング処理が自動で行われています。この機能をオートクレンジング機能と言い、統計知識のない方でも簡単にデータ解析を行うことが可能となっております。

オープンソース

ソフトウェアの設計図にあたるソースコードを無償で公開し誰でも改良・再配布が行えるようにすること。

オープンデータ

誰でも許可されたルールの範囲内で自由に複製・加工や頒布などができるデータ。

オントロジー

コンピュータに知識を獲得させる方法に関する概念・技術。情報科学の分野では「概念化の明示的・形式的な仕様」と定義され、知識やデータ処理について記述する際のルールブック、仕様書が必要であるという考え方。

オンデマンド

ユーザーの要求があった際に、その要求に応じてサービスを提供する事を言う。ブラウザなどを通じてユーザーのリクエストに応じて、テキストや画像などのコンテンツを配信しているインターネット上の多くのデータ配信は、オンデマンド方式といえる。オンデマンドであることをアピールしているインターネットサービスには、ゲームやeラーニング、動画配信などがあげられる。決められたスケジュールで配信されるインターネット放送は、インターネットでもオンデマンドではない。また、映像データをダウンロードして試聴する方式もオンデマンドとはいえず、一般的にはデータが端末に保存されないストリーミング方式で配信される。

オンプレミス

企業の業務システムなどで、自社で用意した設備でソフトウェアなどを導入・利用すること。自社運用。もともとこのような形態が一般的だったため特に名称は無かったが、近年、インターネットなどを通じてメーカーなどが用意した環境を遠隔利用するクラウドコンピューティングやSaaS/PaaSなどが普及してきたため、これらと対比する文脈で従来の方式を意味する用語として広まった。

カ行

回帰分析

多変量解析の一種。ある変数の値を、別の変数の値を使って説明しようとする分析方法。説明に使う変数を説明変数や独立変数と呼び、説明される変数を被説明変数や従属変数あるいは目的変数と呼ぶ。例えば、人間の身長と胸囲を独立変数として、体重という従属変数を説明しようとすることができる。

階層的クラスター分析

サンプル間の類似度に基づいて逐次的にサンプルをグループ化して統合した後、同じ階層の幾つかのクラスター(塊)に分類する手法。この手法におけるサンプル統合の様子を視覚化したものがデンドログラムである。最短距離法、最長距離法、群平均法、ウォード法、メジアン法、重心法、可変法などが含まれる。

回答自動レコメンド

チャットやお問い合わせフォーム、メールの内容を自動解析し、オペレーターに推薦される回答をレコメンドします。また、緊急度の高いキーワードを設定しておくことでエスカレーションの必要がある問い合わせを判別する事ができます。

解約予測・予防

CRM情報と過去の解約情報から、解約予測モデルを構築し、近未来の解約予備軍を導き出します。

過学習

学習(訓練)データにあまりに適合しすぎて、学習(訓練)データでは正解率が高いのに学習(訓練)データとは異なるデータ(例えば、評価データ)では正解率が低くなってしまう、つまり、学習(訓練)データだけに最適化されてしまって汎用性がない状態に陥ること。

係り受け解析

主語―述語、連体修飾語―体言などの係り受け関係を解析すること。日本語表現の文節同士にある関係を文法ルールや機械学習を取り入れたアルゴリズムに基づいて解析する。

格変化

名詞・代名詞・形容詞などが、文中で他の語との関係によってその語形を変えること。

可視化

データをグラフや絵などで視覚的に表現することで、データの概要を直感的に理解できるようにすること。

間隔尺度

順序尺度の性質に加えて、等間隔性を持つ尺度のこと。例として、温度では0度、1度、2度という大小関係があり、かつ等間隔でもある。しかし、摂氏と華氏の2種類の温度があるように、原点と単位の大きさの取り方は自由なので、間隔尺度同士の掛け算や割り算は意味をなさない。

ガントチャート

プロジェクト管理や生産管理などで工程管理に用いられる表の一種で、作業計画を視覚的に表現するために用いられる。

キーグラフ

単語の共起性と出現頻度とに基づき、単語間の関係性を視覚的に表現したグラフ。話題やキーワードの抽出に用いたり、つながりの中から話題転換などを探すことにより新しい発想を導く分析に用いられる。

機械学習

AIの1つの要素技術。データからルールやパターンを発見する方法。識別と予測が主な使用用途。

記述統計

与えられたデータの平均値や分散など基本的な統計量を計算し、利用することで、データの特徴や傾向を説明する手法。

基本語彙

どの分野にも広く出現する語彙。一般分野に多く出現する高頻度語彙。

キャプチャー

ディスプレイに表示される静止画や映像のデータを画像ファイルに保存や、パソコンなどに取り込むことを指す。静止画のキャプチャーでは、画面イメージがJPEG/PNG/BMPなどの画像ファイル形式に変換されパソコンなどに保存できる。「画面キャプチャー」「スクリーンキャプチャー」あるいは「スクリーンショット(撮影)」などとも呼ばれる。

共起解析

文章中に同時に表れることが多い単語の組み合わせを分析する手法。

教師あり学習

正解となるデータを学習(ルールやパターン)することで、新しいデータ(正解が分からないデータ)に対しても対応が可能。学習と認識予測の2段階のプロセスに分かれている。正解が分かっているデータを元にルールやパターンを学習し、インプットされた正解が分からないデータに対してルールやパターンを元に認識や予測をする。回帰や分類が代表的な手法。

教師なし学習

データを学習しない。主にデータそのものが持つ構造・特徴を分析し、グループ分けやデータの簡略化をする。クラスタリングと次元削減が代表的な手法。

共分散構造分析

多変量解析の一種。直接観測された変数を直接観測できない潜在的な変数で説明しようとする分析手法。因子分析とは異なり、潜在的な変数が観測データに与える影響(因果関係)を明確にモデル化する。

ギャザリング

商品の販売方法の一つで、一定の購入希望者を募り、購入希望者の人数によって契約の成立や商品の価格が変動するもの。

クエリ

データベース管理システムに対する問合せ(処理要求)のこと。データの抽出や更新などの処理要求を文字列で表す。処理対象のテーブルやデータの抽出条件、並べ方などを指定する。「検索クエリ」は、上記述方法の区分ではなく、データを検索したい時に検索条件を記述したクエリのこと。Googleなどの検索サイトでユーザーが検索のために検索窓に入力するキーワードも検索クエリといわれる。ユーザーは意識せずに巨大なデータベースに問合せをしているわけである。

クラスター・クラスタリング・クラスタリングエンジン

クラスターとは異なるものが混ざり合っている集団の中から、お互いに似たものを集めて集落(クラスター)を作り対象を分類する方法。クラスタリングは多くのデータから類似性を見て自動的に分類する、一般的には機械学習の教師なし学習における手法のこと。クラスタリングエンジンは顧客リストにある複数のデータ項目を用いて、類似の顧客をいくつかのクラスターに分類するエンジン。分類したクラスターの特徴をプロファイリングして、顧客セグメントを作る。新規顧客のセグメント判別やセグメント移動をモニタリングするための判別モデルを構築し、セグメントを予測。活用例:顧客ペルソナ構築。

クラスタ数

bodaisクラスタリングでの、以下のクラスタ数を表示しています。
教師なしの場合:分割するクラスタ数
教師ありの場合:アップロードしたファイルのクラスタの種類の数

クラスター分析

多変量解析の一種。データの集まりをいくつかのグループ(クラスター)に分類する手法。データ間の類似度を計算し、類似度が高いものを同じクラスターに入れていく。

クラスタ名 クラスタメイ

bodaisクラスタリングでは各クラスタの名称を指定することができます。

クラスタ名変更

bodaisクラスタリングではクラスタの名称を変更することができます。
各チャートに反映されるので、クラスタの特徴を表すような名称を付けると良いでしょう。

クラスタリングサンプルデータ

bodaisクラスタリングのサンプルデータとして以下が用意されています。
(A)モデル用データ(教師なし).csv
bodaisでのモデル構築に利用する教師なしのサンプルデータです。
(B)モデル用データ(教師あり).csv
bodaisでのモデル構築に利用する教師ありのサンプルデータです。
(C)予測用データ.csv
bodaisでの予測に利用するサンプルデータです。
(D)検証用データ.csv
bodaisで構築したモデルによる予測の効果を検証するためのサンプルデータです。
(F)変換方法.xls
モデル構築や予測に利用するデータを、bodais用に加工する方法の例を記載したファイルです。
(A)(B)(C)のサンプルデータがどのように作成されたかが、わかるものになっています。
(G)データ変換定義.csv
サンプルデータにおけるカテゴリ値とカテゴリ名称の対応表です。
本ファイルをアップすることで、画面に表示されるカテゴリ値をカテゴリ名称に変換して表示することが出来ます。

クラスタリングモデル作成

モデル
属性情報に対応する正解フラグ(=クラスタ、教師データ)をもとに、ロジックを抽出するプロセス。
教師なしの場合は、クラスタを付与する解析も含みます。
また、モデルには今後の管理のため名称を指定することができます。
教師データ
正解フラグ(クラスタ番号=分類)のことです。
bodaisクラスタリングサービスでは、あり、なしを選択できます。
「教師なし」は、入力するモデル作成用ファイルに、まだクラスタ情報(分類)がついていない場合に選択します。教師なしクラスタリングにより分類を付与します。
「教師あり」は、入力するモデル作成用ファイルに、すでにクラスタ情報(分類)がついている場合に選択します。分類モデルを構築します。
クラスタ数
分類の数です。
「教師なし」の場合には、分割するクラスタ数を指定できます。
「自動」の場合は、統計的に良いクラスタ数を計算し、クラスタ分割を行います。
モデル用ファイル
「ファイルを選択」をクリックして、モデル作成用のCSVファイルを指定してください。
「教師なし」を選択している場合は、最右列に、クラスタ情報が入っていないファイルをアップロードしてください。
「教師あり」を選択している場合は、最右列に、クラスタ情報が入っているファイルをアップロードしてください。

クラスタリング予測作成

予測
モデルで抽出したロジックと予測用データの属性情報をもとに、各レコードに所属クラスタ付与を行うプロセスです。
予測には今後の管理のため名称を指定することができます。
予測用ファイル
「ファイルを選択」をクリックして、予測作成用のCSVファイルを指定してください。
「解析を開始する」をクリックすると予測が始まります。

グラフコメンテーター

グラフコメンテーターとは、入力された「項目名」と「値」からできるグラフに対して、あたかも分析者がコメントをしたような文章を、自動で作成する技術です。

クラメール係数

2つの質的変数の関連性の強さを表す指標。0と1の間の値をとり、値が1に近づくほど関連性が強い。2変数がmカテゴリーの変数とnカテゴリーの変数である場合、クラメール係数はm行n列のクロス集計表から計算されたカイ2乗値の平方根に比例する。

クレデンシャル

信任状・資格・資格証明書、信用情報。IDやpassなどのユーザーの認証に用いられる情報の総称。  

クローラー

インターネット上に存在するWebサイトや画像などのあらゆる情報を取得し、自動的に検索データベースを作成する巡回プログラムのことで、Google や Bing(Microsoft) などの検索サイトを提供している企業がそれぞれ運営しています。Web上を這う(クロールする)ことから「クローラー」と呼ばれます。クローラーの機能は検索エンジンの仕組みに結びついています。現在の検索エンジンは、ほとんどがロボット型検索エンジンです。ロボット型検索エンジンの主な仕組みは以下の通りです。インターネット上で収集したWebサイトのページ情報をデータベース化データベースに登録されたページのランク付け、その並び順で検索結果を表示。この仕組みのなかで、「インターネット上でWebサイトのページ情報を収集する」プログラムとして動いているのがクローラーです。(クローリングと言います。) 逆に言うと、Webサイトが検索エンジンの検索結果に表示されるには、クローラーの巡回で自社のサイトが認識されることが必要になります。

クロス集計

2つの属性を元にサンプルを集計した2次元の度数分布表のこと。

クロスセル

売り上げを上げるために、ある商品やサービスに加え、関連するものを組合せで購入してもらう営業活動のこと。

Googleアナリティクス

アクセス解析ツール。登録したサイトのユーザーの行動に関するデータがわかる。サイトの訪問者数はどれくらいか、訪問者はどこから来たのか、使われたデバイスはスマホかパソコンかなどのデータを計測することができる。チェック必須の4機能は、「ユーザー」、「集客」、「行動」、「コンバージョン」。

Google広告
(旧称Google Adwords)

Googleが提供する広告出稿サービス。出稿された広告は、Google AdSense(Googleの提供しているコンテンツ連動型広告配信サービス)などを用いて様々なWebサイトに表示される。予めその広告に関連するワードを設定しておくことで、Google検索の検索結果表示画面などにおいて、ユーザーの検索ワードに適した広告が表示される。広告費用はオークション等によって決定されたクリック単価と利用者のクリック回数に応じて金額が決定する。

グローバルナビゲーション

各ページに共通して設置された案内リンク。

傾向スコア

傾向スコアは、補正のための共変量を用いて計算され、データ分布の異なる 2 つのデータ群が有る場合に、任意のサンプルが「一方のデータ群に割り当てられる確率」を表わす。インターネット調査の場合は、あるサンプルが「インターネット調査に回答する確率」となる。

形態素解析

テキストマイニングでは、日本語をコンピュータが扱える情報に変換するため、「形態素解析」と呼ばれる技術が使われます。形態素解析とは、自然言語で書かれた文を形態素(言語で意味を持つ最小単位)の列に分割し、品詞を見分ける作業のことです。一般的には参照する情報源として対象言語の文法の知識(ここでは文法のルールの集まり)と辞書(品詞等の情報付きの単語リスト)を用いることになります。これにより、単語の単位で頻度を集計し、文章の特徴を把握することができるようになります。

欠損処理

投入されたデータに欠損がある場合、「欠損」というカテゴリとして解析を行います。 なお、欠損データが多すぎる場合には、モデル作成に悪影響を与えるため、モデル作成から除外します。

欠損値補完

欠損の多いデータでも、データマイニング(AI)のアプローチにより、未取得の属性にどんな属性があてはまるかを予測できます。

決定木

分析目的とした項目に対し、その他の項目の中から、より因果関係の強いものを木の幹に、弱いものを枝へと振分けて、項目間の関係を表現する。量的変数を振り分ける回帰木、質的変数を振り分ける分類木がある。

決定理論

個別の意思決定について価値、不確かさといった事柄を数学的かつ統計的に確定し、それによって最善の意思決定を導き出す理論。意思決定理論とも。

ゲインチャート

累積図。横軸にスコア降順位、縦軸にスコア降順位までの累積レスポンス数を描いた曲線。 予測モデルを使用した場合と、予測モデル未使用の場合の差分がわかる。

効果指標

効果指標とは「どのカテゴリが効いているか」を確認することができる指標です。

広告宣伝費

事業や商品の広告を作る費用・宣伝にかかる費用。販促のためにかける費用。

膠着語

ある単語に接頭辞や接尾辞のような形態素を付着させることで、その単語の文の中での文法関係を示す特徴を持つ。日本語は膠着語に分類される。

効率化シミュレーション

「1件対応当たりの費用」「1レスポンス当たりの売上」「対応件数」を入力すると予測結果に基づいて売上予測や利益予測を算出します。ランキングの上位何件まで配信 を行えばよいかを判断することができます。

コーディング

アンケートの回答データを統計解析するために、文字情報や質的変数をコード化する作業。例えば「犬」「猫」「小鳥」のうちいずれかの値を取る質的変数αがあるとき、これを3つの変数(A、B、C)に分解し、α=「犬」のときA=1、B=0、C=0、α=「猫」のときA=0、B=1、C=0、α=「小鳥」のときA=0、B=0、C=1、とする処理(数量化)。

コールドスタート

コンピューターの電源を完全に切って、ハードウェアが初期化された状態から再起動すること。

コールドリード

商品やサービスに対する興味が薄く、すぐに購入する可能性が低い見込み客のこと。

コールログ

商品やサービスについての、顧客からの電話による問い合わせの記録。商品やサービスの問題点やニーズの抽出に用いられる。

顧客購買行動最適化

過去に送付したDM発送リストとその際の反響(結果)情報を基に、モデルを構築し、新規DMの反応を個別に予測します。(予測確率を付与)

顧客接点

DXにおいて顧客が受けるサービスが、インターフェース層、プラットフォーム層、 サービス層を経由したサイクルで与えていることを表す。

顧客層

DXにおけるデータ提供及び受益の対象。サービス層のサービスを利用することで、データを取得しインターフェース層に接続する。

顧客満足向上

過去の対話履歴(テキスト)を頻度解析し、推奨回答のリアルタイム抽出を行います。

孤立語

単語は実質的意味だけをもち、それらが孤立的に連続して文を構成し、文法的機能は主として語順によって果たされる言語(語順によって意味が変わる)。例えば、中国語・チベット語・タイ語など。

コンジョイント分析

商品やサービスを特徴付けている要素のうち、消費者にとってどれがどれだけ重視されているかを分析する手法。

コンセプトムービー

企業理念、商品、プロジェクトに込めた想いを伝え、自社のブランディングにつなげていくための動画。

コンソール

コンピュータの制御に用いられる。入力・出力の機能を備えた装置のことで、主にキーボードやディスプレイをひとまとめに呼ぶときに使う。

コンテンツマーケティング

ユーザーにとって価値のある有益なコンテンツでWebサイトへ呼んでファン化し、問い合わせや商品購入などの行動へとつなげるマーケティング施策。

コンバージョン

CVと略され、ECサイト上で獲得てきる最終的な成果。

コンフリクト (conflict)

相反する意見、態度、要求などが存在し、互いに譲らずに緊張状態が生じること。

顧客セグメンテーション

顧客のニーズや特性に基づいてターゲットを絞って分類する。個別にマーケティングを実施し、より大きな価値の高い顧客層を育成、獲得することができる。

コール先の最適化

データマイニングの“ゴール”は顧客のより良い理解を 通じてマーケティング、販売、顧客サポートを企業が 改善できるようにすることである。過去のコール履歴や実績を用いた分析モデルの適用によって、コール対象となる1件1件の反応を事前に予測することが可能になるため、業務経験の浅いオペレーターであっても「最も効率の良いコール先」から優先的にコールすることができるようになる。

サ行

サーチコンソール Search Console (旧称:ウェブマスターツール)

主にGoogle検索結果でのサイトのパフォーマンスを監視、管理などができる無料ツール。

サービス層

DXにおけるプラットフォーム層と顧客層の中間層。プラットフォーム層より取得したデータを元に顧客層へのサービスを提供する。

最終受益者

DXにおける利益を得る対象。顧客や社会など。

最小二乗法

回帰分析などの予測式を最適化する手法。観測値と予測値の誤差の二乗和が最小になるように予測式に含まれるパラメータの値を決定する。

サイトマップ

サイト内のページリンクをまとめたページのことで、検索エンジンと検索ユーザー双方にそのサイトにどのようなページがあるかを伝えるためのもの。

サポートベクターマシン

ニューラルネットを用いたパターン認識の一種。カテゴリーの境界である識別平面を、パーセプトロンを使って求める手法。

サムネイル(thumbnail)

画像などを一覧表示する際に用いられる、アイコン大に縮小された画像。画像や動画、Webサイトなど何らかの対象を画面上で一覧表示して選択する場合に、視認性を高めるために個々の対象の内容を表す小さなサムネイル画像を作成し、名前などと合わせて表示する。大きなファイルを開かなくても、どんな画像や内容なのかがひと目で分るように縮小画像で見せることをサムネイル表示という。

3C分析 (Customer、Competitor、Company)

企業のマーケティングなどにおいて、顧客、競合、自社の観点から市場環境を分析し、経営戦略上の課題を導く分析ツールのひとつである。

サンプル割付

セグメントごとにサンプル数や回答者数を指定すること。

システム開発

データ解析プロジェクトでPoCを行うと次にくるのが、日々の業務の中で定常的にデータを活かすための業務アプリの開発やシステム開発です。アイズファクトリーでは、AIアプリやデータ解析システムの開発経験豊富な専任チームが、Pocで確認した解析アルゴリズムを実装した貴社むけのAIアプリ(業務アプリ)の開発や、AIアプリと貴社の既存基幹システムとのAPIを使った連携などをご支援します。自社開発を行うのに比べて、bodaisにあらかじめ用意されたスコアリングなどの解析エンジンを用いることでスムーズな構築が可能です

自然エネルギー発電量予測

過去の気象情報(天気、気温、湿度、風速、日射量など)と、自然エネルギーによる発電量の実績データ等から、発電可能量を予測します。

質的変数

名義尺度または順序尺度からなる変数。カテゴリー変数またはカテゴリカル変数とも言う。

尺度

実験で計測された数値やアンケートの回答結果などを、それらが表現する情報の性質により数学・統計学的に分類する基準のこと。名義尺度、順序尺度、間隔尺度、比例尺度の4つの尺度に分けられる。

主成分分析

多変量解析の1種。複数の変数の相関関係を、変数を合成することで得られた新たな変数(主成分)で説明しようとする分析手法。多くの変数を2つの主成分に集約することで、それぞれを軸としたグラフとして図示することができるため、変数の可視化を目的として実施されることがある。

主題語

テーマ語に同じ。基本語彙の類似概念。当該のテキスト集合において、全般的な主題を表す高頻度語彙。一般的なテキスト集合であれば、基本語彙であることが多く、専門的なテキスト集合であれば、専門語彙がテーマ語彙となることが多い。主題の強さは、統計的に「頻度」によって計られる。

守破離

茶道や武道などにおける師弟関係のあり方の一つ。もとは千利休の訓をまとめた歌にある。師匠から教わった型を徹底的に守る、身に付いたら自分のあったより良いと思われる型を模索し既存の型を破る、双方に精通したら既存の型に囚われることなく離れる。

主文章(メインテキスト)

文章の構成単位は大きく、単語、文(単語の集合)、文書(文の集合)のような要素で捉えることができます。 文章における単語の特徴を捉えるのに特徴度、文書に書かれた文の特徴を捉えるのに特徴文の概念が役立つように、主文章とは文章を比較単位としてどの文章が代表的あるいは特徴的なのかを表す文章を言います。
主題語を多く含む文章を抽出することで記述分野を象徴(代表)するような文章を抽出したり、特徴語を多く含む文章を抽出することでその文書の主張(要点)に関わる文章を抽出します。

主文章抽出

「特徴文抽出エンジン」では、句点「。」毎に分割された文章毎に「スコア」を付けて評価しますが、「主文章抽出エンジン」では、複数の句点「。」を含む文章ごとに、重要度を導出してスコアを付与します。

主文章抽出エンジン

文章群に対して各文章の重要度を算出するエンジン。

順序変数

名義尺度の性質に加えて、順序または大小関係も意味を持つ尺度のこと。例として、サービス満足度を、「不満」、「どちらともいえない」、「満足」の3段階で評価する場合が挙げられる。段階に順序関係はあるものの、段階の差に意味はない。中央値を定義することはできるが、平均値を定義することはできない。

障害発生予測

過去の障害情報を基にモデル化し、直近の稼働情報を充てることで、製品や生産設備の近未来の障害発生を予測します。

書誌同定

書誌が同じものか否かを判断する事。

所属確率

bodaisクラスタリングのモデルによって、当該のサンプルが、各クラスタに振り分けられる確率のこと。
ルールとしては、当該の属性カテゴリを持つサンプルが、各クラスタに振り分けられる確率を用います。

新規事業企画

自社のCRM情報と他社のCRM情報をマッチングし、新たな潜在顧客を見つけます。
当社の技術を用いれば、双方が顧客の個人情報を開示することなく、データの活用を行う事が出来ます。

シンクライアント

ユーザーが使うクライアント端末に必要最小限の処理をさせ、ほとんどの処理をサーバ側に集中させたシステムアーキテクチャ全般のこと

シングルアンサー(SA)

複数の選択肢の中から回答を1つだけ選択させる質問項目のこと。

事業予測

単に、BIツールを使っても“過去”を知ることしかできません。データマイニングを行い、事業別のデータモデルを構築し近未来を統計的に予測します。

樹状図

トーナメント表のように逐次的に標本がグループ化される様子をツリー状の結線図で表したもの。デンドログラムとも言う。

需要予測(負荷予測)

過去のエネルギー使用量(時系列解析)、や気象情報(天気、気温、湿度、風速、日射量など)、地域イベントの開催情報等を利用して、エネルギー需要を予測します。

助成想起(assisted recall)

あるブランド名を手掛かりとして与えられた時、そのブランドへの認識を確認できること。ブランド再確認とも呼ぶ。「〇〇を聞いたことがある、知っている」など。

純粋想起(pure recollection)

助成想起よりも記憶の程度が強い。製品のカテゴリ等の手掛かりが与えられた時、ブランド再生できること。「ハンバーガーショップと言えば〇〇」など。

自立語

単独で文節をつくることができる単語(1個で意味があるもの)。 かならず文節の最初にきて、一つの文節に一つだけある。

人材確保と定着化

採用時から現在までの人事データ(勤怠データ、人事評価、キャリア、等)を用いてモデル化し解析、現時点で採用すべき人材の属性を判定し、採用候補者リストに対して推奨を可視化します。 採用に際しての、最適な面談者の推奨も得ることができます。

情報資産

企業が所有または管理する情報で、財務情報、人事情報、顧客情報、技術情報、紙媒体や人の知識等を例として挙げられる。それらに基づいて科学的意思決定、リスク軽減・排除、経営効率向上をすることができる。

受注の件数を最⼤化

営業プロセスにおける営業業績目標の1つである。効率な営業計画を立ち、注力すべく顧客・顧客のニーズを明確にし、お客様との関係性や継続性を強化することが、業績最大や目標達成につながっている。最大化する方法は、アプローチの数を増やすことと、次のステップへ進む確率を上げることである。

推奨クラスタ数

bodaisクラスタリングの機能。サンプルデータから統計的に良いクラスタ数を計算し表示しています。

数量化理論

そのままでは統計的操作が困難な質的データや順序データを分析することを目的とする、一群の分析手法。

スコアチャート

スコアチャートとは、横軸にスコア降順位、縦軸にスコアを描いた曲線です。アクション数を条件として、さらに1回のアクションを行う場合の期待度を表します。

スコアリング

マーケティング分野におけるスコアリングは、個々の見込み客が持つ、自社への将来的な「価値」を予測し、その価値に準じて順位をつけること。スコアリング分析とは、リストに優先順位(もしくは劣後順位)をつける分析。モデル構築・予測の2ステップある。

スコアリングサンプルデータ

bodaisスコアリングのサンプルデータとして以下が用意されています。
(A)モデル用データ.csv
bodaisでのモデル構築に利用するサンプルデータです。

スコアリングモデル作成

モデル
属性情報に対応する正解フラグをもとにロジックを抽出するプロセスです。 モデルには今後の管理のため名称を指定することができます。

スコアリング予測作成

予測
モデルで抽出したロジックと予測用データの属性情報をもとに、各レコードにスコア付を行うプロセスです。

スコープ・タイム・コスト

プロジェクトに共通する制約条件、プロジェクトの三角形。
スコープ:作業範囲・対象範囲、タイム:時間、コスト:費用、予算

ストリーミング

インターネットに接続しながら映像、音声データが楽しめる再生方式。ダウンロードのように端末に転送しないためストレージ(データを長期間保管しておくための補助記録装置)容量を使わず、ネット環境があればスムーズに再生できるのが特徴。

ストレスチェック

ストレスが高い人の年齢や家族構成、勤続年数といった属性情報、職務内容、労働時間や有給休暇の利用日数等のデータを解析し、ストレスの高い人の特徴を明らかにします。

ステークホルダー

企業に対して利害関係にある人(株主、社員、顧客、地域社会)を指す。それを分析することによって、戦略を立てるときに主要な利害関係者の影響を区別するのに役立つ。

SECI(セキ)モデル

知識創造活動に注目したナレッジマネジメントの枠組み。個人が持つ暗黙的な知識(暗黙知)は、共同化(Socialization)、表出化(Externalization)、連結化(Combination)、内面化(Internalization)という4つの変換プロセスを経ることで、集団や組織の共有の知識(形式知)となる考え。

SECI(セキ)モデル

知識創造活動に注目したナレッジマネジメントの枠組み。個人が持つ暗黙的な知識(暗黙知)は、共同化(Socialization)、表出化(Externalization)、連結化(Combination)、内面化(Internalization)という4つの変換プロセスを経ることで、集団や組織の共有の知識(形式知)となる考え。

セグメント

属性や特徴が同一または類似するものをグルーピングしたもののこと。

セグメントボリューム

bodaisクラスタリングの機能。クラスタ番号が付与されたサンプル数を、クラスタごとに計数したグラフです。
各クラスタに該当するデータが、何件あったのかを把握することができます。

設備保全効率化

機器・設備やシステムのメンテナンス履歴、故障履歴等のデータを用いて、故障の確率を1台ごとに予測します。

セレンディピティ

素敵な偶然に出会ったり、予想外のものを発見したりすること。また何かを探しているときに、探しているものとは別の価値があるものを偶然見つけること。

線形回帰

ある結果(目的変数)を説明する際に、関連する複数の要因(説明変数)のうち、どの変数がどの程度、結果を左右しているのかを関数の形で数値化し両者の関係を表し、それを元にして将来の予測を行う統計手法のことです。説明変数が一つの場合は単回帰分析、二つ以上の場合は重回帰分析とも呼びます。

専門語彙

特定分野に特徴的な語彙。中・低頻度の専門性の高い語彙。一般分野との対比によって決まる語彙であり、一般分野では特徴のない語彙に相当する。

ゼロクライアント

OSもHDDも無い専用の端末を使い、サーバー上にある仮想化されたデスクトップですべての処理を行うシステムアーキテクチャー。

相関係数

2つの変数の関連性の強さを表す指標。

相関処理

正解と各変数の相関係数を計算し、閾値以上になった『変数』を削除します。

相関比

質的変数と量的変数の関連性の強さを表す指標。0と1の間の値をとり、値が1に近づくほど関連性が強い。質的変数がnカテゴリーの変数である場合、相関比はn個の各カテゴリーに分類されたグループ内での偏差平方和の合計をサンプル全体での偏差平方和で割った値に等しい。

忖度AI

ゲームや学習など様々な領域に適用可能な、自動的にレベルを合わせるAI

属性予測エンジン

データの欠損に既知のデータから予測した値を補間するエンジン。

タ行

ターゲットメディア

企業が広報活動をするうえで記事掲載(パブリシティ)を狙う媒体のこと。そのメディアにどんな読者や閲覧者、フォロワーがいるかを吟味し、露出したい商材やサービスのコミュニケーションターゲットと一致するかどうかを検討したうえで、ターゲットメディアとしてリストアップしていきます。たとえば働く女性向けの化粧品であれば、女性誌や女性向け情報サイトなどがターゲットメディアとなります。

ターゲティング

自社の顧客のクラスタリングを行い、顧客の特徴に応じたグループ分けとペルソナ構築を行います。

対偶

ある命題が成立する場合に、その命題の仮定と結論の両方を否定した命題も成立するという命題同士の関係性の事を言う。 命題「AならばB」の対偶は「BでないならAでない」である。

多変量解析

多次元の変数を対象に、その変化や関係などを説明しようとする分析手法の総称。クラスター分析、主成分分析、因子分析、判別分析、回帰分析、数量化理論などが含まれる。

単純集計

1つの属性を元にサンプル数を集計した度数分布表。

直帰率

ユーザーが閲覧を始めたページから他のページに移動することなくサイトを離脱したセッション(訪問)の割合。 直帰率は、1ページだけしか閲覧せずに離脱した人が増えるほど高くなります。

定性調査

グループインタビュー(GI)や面談などの形式で行われ、回答者には自然な言葉で自由に答えてもらう調査のこと。調査設計の時点では想定していなかったような意外な事実の発見や、心理的な分析などに用いられる。

定量調査

アンケート調査など、サンプル量を確保し統計的に分析を行う調査のこと。

ティザー広告

広義ではある要素を顧客に明らかにしないことによって注意をひこうとする商業広告の一手法、狭義では本来、広告で伝えるべき商品についての要素のいくつかを意図して明らかにせず注目を集める広告手法と定義することができる。

テーマ語

基本語彙の類似概念。当該のテキスト集合において、全般的な主題を表す高頻度語彙。一般的なテキスト集合であれば、基本語彙であることが多く、専門的なテキスト集合であれば、専門語彙がテーマ語彙となることが多い。主題の強さは、統計的に「頻度」によって計られる。

テキストマイニング/自然言語処理

文字列を対象としたデータマイニング。文書だけより比較軸(性別・年齢など)があると深い。通常の文章からなるデータを単語や文節で区切り、出現の頻度や共出現の相関、出現傾向、時系列などを解析し有用な情報を取り出すテキストデータの分析方法。得意とする課題:①大量のテキストの内容をすべて読まないで把握、②テキストの内容を定量的に捉えたい。

展開

データ分析の方法論CRISP-DMにおける6番目の工程。
データマイニングの結果として、特定の分類に属する人を対象にDMを送付したり、商品の陳列を変えたり、という単純なものも含めて、利益率の向上や業務効率化を目的としてフェーズ1(ビジネスの理解)で設定した目標を達成するための具体的アクションを起こしていきます。

テンプレート

文書などのコンピュータデータを作成する上で雛型となるデータ。

テキストデータ

コンピュータ画面に表示される文字情報のことを指す。テキストマイニング分析からその人に関する特徴、意図、価値観などを推測することができるという素材の一つである。

DSP(Demand Side Platform)

広告主が広告在庫の買い付けから配信、オーディエンスターゲティングなどを一括して管理できる広告配信プラットフォーム。

DX(デジタルトランスフォーメーション)

デジタルが社会を「変革(Transform)するという意味で使われ、デジタル技術をベースに社会構造やビジネスモデルなどを抜本的に変える行為を指します。

DM配信最適化分析

DM送付対象者の属性情報、コンタクト履歴などに基づいて予測購入率や入会率を算出し、可能性の高い対象者から優先的にダイレクトメールを送ることで、DMの費用対効果を高める。

DMP(Data Management Platform)

データを管理するプラットフォーム。広告主が持つデータや、第三者のデータなどを一元管理・分析し、加工した解析データ等をEmail、広告・サイトコンテンツ配信などデータ活用を必要としているチャネルに繋げる為のハブの役割。オープンDMPは、Webサイト訪問ユーザーのデモグラ情報や、興味関心・嗜好性等などの外部のオーディエンスデータとデータエクスチェンジさせることができるクラウド型のデータプラットフォーム。プライベートDMPは、オープンDMPの領域に加え、企業独自ののマーケティングデータを集約し、それを外部のオーディエンス情報とシンクさせ構築するプラットフォーム。CRMデータに、外部データを組み合わせたもの。データ格納先が企業側にあるというところがポイント。

ディスクリプション(description)

ディスクリプションとは、ページコンテンツの概要や要約を示したHTML内に記述するテキストのことです。ディスクリプションの文章はページ内には表示されず、Googleなどの検索エンジンに、ページ内容の要約を伝える役割があります。正式名称は「メタディスクリプション (meta description)」と言い、他にも「メタタグ」、「スニペット」などとも呼ばれます。ディスクリプションに設定したテキストは、Googleなどの検索エンジンの検索結果に引用される可能性が高く、ユーザーニーズにマッチした文章を設定することで、ページの興味付けになり、クリック率(CTR)アップにつながります。

ディスプレイ広告

Webサイトやアプリ上の広告枠に表示される画像、動画広告やテキスト広告のこと。バナーで表示されることが多く、バナー広告と呼ばれることもある。

ディレクトリ

コンピューターのファイルシステムにおいて、ファイルをグループ化するための特殊なファイルで、整理・管理などの目的で活用される。ディレクトリの中にも、通常のファイルだけでなく入れ子的にディレクトリを作って、任意の階層を持たせて管理できることがほとんどである。サブディレクトリとは、あるディレクトリの下の階層に作成されたディレクトリのことである。なお、もともとディレクトリとは、UNIXでの呼称であるため、WindowsやMac OSでは、ディレクトリのことをフォルダと呼ぶ。

データアナリスト

可視化や定型分析を中心とした「運用」を担当するAI人材です。

データウェアハウス(DWH)

基幹系などの複数システムから、必要なデータを収集し、目的別に再構成した統合データベースです。 データ分析や意思決定に役立てる目的で編成され作られるため、BI(ビジネスインテリジェンス)に位置づけられます。

データクレンジング

データクレンジングとは、データベースなどに保存されているデータの中から、重複や誤記、表記の揺れなどを探し出し、削除や修正、正規化などを行ってデータの品質を高めること。

データサイエンティスト

次のスキルセットをもったAI人材です。
・企業の経営課題を解析課題に落とし込む
・モデル構築を行う

データの準備

データ分析の方法論CRISP-DMにおける3番目の工程。
マイニングの前処理として、使用可能なデータを分析に適したデータに整形していきます。いわゆるデータクレンジング(洗浄)作業です。

データの理解

データ分析の方法論CRISP-DMにおける2番目の工程。
データマイニングにおいて、データが本当に利用できるかどうか吟味する必要があります。基本的にはデータ項目、量、品質を調査することになります。多くの場合、外れ値(データ分布上、数値的に懸け離れたデータ)や欠損値(ブランクのデータ)といったものが含まれており、分析に使用できるデータであるか否かを判断しなければなりません。

データマイニング

統計学、パターン認識、人工知能等のデータ解析の技法を大量のデータに網羅的に適用することで知識を取り出す技術。

データ要約

データ構造を把握するために、平均値などの統計値を算出したり、ヒストグラムなどを分析すること。

データレイク

データレイクは、規模にかかわらず、すべての構造化データと非構造化データを保存できる一元化されたリポジトリ(データやプログラムの情報が納められたデータベース(一元的な貯蔵庫のことを指す、レポジトリと表記される場合もある)です。データをそのままの形で保存できるため、データの構造化やさまざまなタイプの分析を実行しておく必要がありません。

デシル分布

デシル分布とは顧客をスコアの高い順に並べ、10等分し、10のグループに分けた場合の属性分布のことです。

デジタイゼーション

アナログデータを電子データに置き換えるなど、全体の一要素をデジタルにする行為を指します。

デジタライゼーション

プロセスやシステム全体をデジタルにする行為を指します。

デジタルプラットフォーム

デジタルプラットフォームは、情報通信のテクノロジーや収集したデータを活用してオンラインの「場」を意味します。この「場」は、さまざまな利用者が同時に存在する多面市場となり、間接的なネットワーク効果がはたらきます。

デモグラフィック

顧客データ分析の切り口の一つ。顧客のデータを分析して人口統計学的に属性を見つけて、性別・年齢・住んでいる地域・所得・職業・学歴・家族構成など、社会的な特質データを集約した物。

デンドログラム

樹状図に同じ。トーナメント表のように逐次的に標本がグループ化される様子をツリー状の結線図で表したもの。デンドログラムとも言う。

デジタルマーケティング

様々な形態のデジタルメディアを通じて製品やサービスを効率的に宣伝することを指す。電子広告、サーチエンジンマーケティング等を通じたインタネットルートのほか、テレビ、ラジオ、画像広告、テキスト広告等を通じた非インタネットルートも含まれる。

データ整備

企業が所有するデータベース内にある誤り、欠損、重複、違った形式、または冗長なデータを削除、補正、補完することにより、一貫した形式で企業データを統合することを指す。

特徴解析

ある文章が何に関して述べられたものなのかを大まかに示す単語・文や、その文章の独自性を特徴付ける単語・文を探り出し、分析する手法。

特徴語

頻度分布におけるテキスト統計量に基づいて抽出される語彙。専門語やトピック語がこれに相当する。

特徴属性リスト

bodaisクラスタリングの一機能。全属性・カテゴリのクラスタ特徴度を表示しています。 クラスタに特徴的なカテゴリは、高いスコアになります。

特徴度

特徴語を抽出するための指標。特徴的であるかどうかは、基本語彙を抽出する集合と専門語彙を抽出する集合との対比において、各語の出現頻度、出現文書数、出現分布等を組み合わせた計算式によって決定される。出現頻度を用いて計算される代表的な指標としては、頻度比、ダイス係数、余弦、補完類似度(CSM)、対数尤度比(LLR)、カイ2乗量(Chi2)、自己相互情報量(PMI)などが知られる。

特徴度エンジン

文章群を入力し各文章の特徴度を算出するエンジン(全体がいま一番気にしている言葉を抽出できる)。特徴度解析で、単語の特徴度を算出して集計し、テキスト中の特徴的な単語を可視化。特徴度は、話題の中でテーマを読むための指標で、平均頻度(単語の1回答あたりの出現頻度)が小さめで、人数が多いものを優先する指標。特徴語:特徴的なキーワード。

特徴度解析

任意の文章群から、各文章毎に特徴的なキーワードを抽出します。 アンケート分析における「特徴度」で説明すると、特徴度とは、話題の中でテーマを読むための指標であり、平均頻度(単語の1回答あたりの出現頻度)が小さめで、人数が多いものを優先する指標となります。

特徴文(特徴センテンス)

一つの文書は文の集合体で構成されており、それぞれの文には、文書の主張を伝える上で重要な役割をもつものもあれば、本題とは関連性の薄い文もあります。
テキストの内容を俯瞰的に捉える際には、単語レベルの解析では主題語と特徴語の抽出が大いに役立つのと同様に、文の単位でも主題に関わる文と、主題の中でも主張に関わる特徴的な文とに分類することで要点把握を簡易に行うことができます。 主題語を多く含む文を抽出することでその記述分野を象徴(代表)するような文を抽出したり、特徴語を多く含む文を抽出することで、その文書の主張(要点)に関わる特徴的な文(特徴文)を抽出します。

特徴文抽出

任意の文章群から、各文章毎に特徴的なキーワードを抽出します。 アンケート分析における「特徴度」で説明すると、特徴度とは、話題の中でテーマを読むための指標であり、平均頻度(単語の1回答あたりの出現頻度)が小さめで、人数が多いものを優先する指標となります。

特徴分抽出エンジン

文章の中で各文に重要度を算出するエンジン。テキスト形式の入力で、各文のスコアを出力。文章毎に特徴的なキーワードを抽出。句点「。」毎に文章を分割し、各文章が全体で伝えたい内容にどの程度関係性が強いかをスコアを付けて評価。大量の文章をすべて読み解かずに、全体を理解することが可能。

トピック語

専門語彙の類似概念。当該のテキスト集合において、特徴的な中・低頻度の語彙。専門語彙であったり、基本語彙でも特殊な話題、突発的な話題であることが多い。特徴の強さは、統計的に「特徴度」によって計られる。

トラッキング調査

同じ内容の調査を一定期間に定期的に繰り返して行う調査のこと。例えば新しく始めた販促キャンペーンが実際の売上に与える影響などをより適切に評価することができる。

トラフィック需要予測

過去のデータトラフィックや、利用の多かった曜日、時間帯、利用のあった顧客の端末の種類、ウェブ上で開催されるイベントの有無などのデータを利用して、一定以上のトラフィックが必要とされる確率を予測します。

トレンドワード

ある一定期間以上の間、話題になっているワード。

ナ行

ナーチャリング

見込み客を顧客にする(育成)。具体的な方法は様々であるが、商品情報を提供したり、商品の利点を発信したり、商品そのものとは必ずしも直結しないお役立ち情報を発信したりといった活動が含まれる。

7P

具体的なマーケティング戦術を考える時のポイント。Product(製品)、Price(価格)、Place(流通)、Promotion(プロモーション)、Personnel(人的サービスの質)、Process(サービス提供のプロセス)、Physical Evidence(物的証拠)。7Pを考えることで、収益を上げるために見直すべき点や、他社と差別化を図るために強化する点が見えやすくなる。

名寄せ

企業が営業活動を行ったり、システムの改善を行ったりすると、システム上に重複したデータが生まれます。「名寄せ」とは、データの重複をなくし、データを正確に保持するための技術です。

名寄せエンジン

リストの各項目の重複率算出するエンジン。

ニューラルネット

予測や判定に用いるモデルの一種で、ニューロンの結合ネットワークを構成し、過去データの学習によってニューロン間の情報伝達を最適化するモデル。

ハ行

ハードセル

商品の特徴や機能といった情報中心で訴求する伝え方、広告、販売手法のこと。

販売促進費

事業の売り上げを促進するための経費。

判別分析

多変量解析の一種。データの集合がすでにいくつかのグループに分類されているとき、新しく得られたデータがどのグループに分類されるのかを判断するための手法。Webページのカテゴリ分けなどに使える。

バウンスメール

電子メールの仕組みにおいて、送信したメールメッセージが何等かの理由で目的の送信先に正常に配信されなかった場合に、メールサーバからその旨を送信元に通知されるメールメッセージのこと。エラーメールやリターンメールとも称される。

バスケット分析

POSデータなどを使って、同時に購入されやすい商品の組み合わせを把握するための分析手法。

バブルチャート

bodaisクラスタリングでのバブルチャートとはクラスタ間の関係を見るため、各クラスタを2次元にプロットした図です。
円の大きさはそのクラスタのサンプル数を表しています。
クラスタ間の距離が近いほど、そのクラスタ同士が類似していることを示しています。
グラフの軸は、多次元データであるクラスタを2次元にマッピングした際の第1因子(横軸)、第2因子(縦軸)を表しています。

パターン認識

自然情報処理の1つ。画像・音声などの雑多な情報を含むデータの中から、一定の規則や意味を持つ対象を選別して取り出す処理。

パテントマップ

特許情報を数値化してビジュアル化・見える化したもの。 ある分野に力を入れている企業を一覧で見る。 ある分野では、どの企業が強いのかを知る。 ライバル企業の特許の出願状況や開発の方向性を知る。

パラメータ

プログラムの動作条件を与えるための情報。母集団の特性を表す値、母数。

パンくずリスト

ユーザーが今WEBサイト内のどの位置にいるのかを視覚的に分かりやすくするため、上位の階層となるWEBページを階層順にリストアップしてリンクを設置したリストのことを指します。通常はコンテンツの最上部に記載されます。

ヒートマップ

データを可視化するために、行列型の数字データの強弱を色で視覚化する方法です。WEB解析においてのヒートマップの仕組みは、マウスの動きを追跡し、そのマウスのログからヒートマップを作り出しています。人間の目とマウスの動きには80%以上の相関関係がある事が実証されており、マウスの動きをヒートマップで表現する事により、ユーザーの思考を可視化することができるのです。 WEB解析において、数字のデータでは発見できない課題もヒートマップなら、最も見られている(あるいはクリックされている)場所は濃く表示され、あまり見られていない場所は薄く表示されるため、WEBページとヒートマップを照らし合わせれば、誰でもユーザー心理を把握する事ができます。通常、経験とノウハウを必要とするWEBデータ解析が、初心者でも直観的にWEBの課題を発見する事ができるのです。

非階層的クラスター分析

非階層的クラスタ分析の代表例としては、k-means 法が挙げられる。あらかじめ指定したクラスタ数を設定して、各クラスタの中心点を決定し、それぞれのサンプル(顧客)を最も近い中心点のクラスタに分類する手法である。

ヒストグラム(histogram)

縦軸に度数、横軸に階級をとった統計グラフの1種。データの分析状況を視覚的に認識するために用いる。

必要十分

分量や程度あるいは条件を満たす要素などが、過不足なく、潤沢ではないとしても一応は間に合っており、このままで事足りているという状況の言い方。

非定型データ/非構造化データ

構造定義されておらず、主に関係モデルにうまく適合しないデータ。

評価

データ分析の方法論CRISP-DMにおける5番目の工程。 フェーズ1(ビジネスの理解)で明確に定義したビジネス目標を達成するに十分なモデルであるかをビジネスの観点から評価していきます。この評価に際し、具体的な数値を得るための実験を行うこともあります。

表記ゆれ

ある言語の文字表記において、ある単語が2通り以上の書き方をされることにより、表記にばらつきが生じることを指す。

秘匿計算(秘密計算)

データを暗号化したまま計算できる技術です。 一般的な暗号はデータの通信・保存を保護しますが、秘密計算はさらにデータの計算過程も保護することができます。

比例尺度

間隔尺度の性質に加えて、絶対原点が存在する尺度のこと。比尺度とも言う。身長や体重、時間、速度などは比例尺度である。比例尺度では、比例尺度間の比は何らかの意味を持つ(例:距離÷時間=速度)。

BI
(Business Intelligence/ビジネスインテリジェンス)

企業が情報システムなどで蓄積しているデータを、業務や経営の意思決定に役立てるために分析し、加工することを指す。BIの特徴は、経営者や現場の担当者が、みずから情報システムにあるデータを抽出・分析し、有益な情報に加工することで、意思決定を迅速化することにある。また、その有益な情報への加工には、しばしばデータの可視化が用いられるのも特徴的。

BIツール

大量に存在する数値データを分析するために使用するツール。ERPやDWHなどに保管されている膨大なデータの中から必要なデータを検索したり、特定の形式でレポートにまとめたり、多次元分析を行なうことにより、事業部門長や経営層の意思決定を支援したり、一般社員が資料を作成したり事業の進捗を把握するのを支援する。

BA
(ビジネスアナリティクス)

BIでの分析結果をもとに、さらに分析を加えて将来を予測し、次のアクションを決めることを目指す仕組みのことを指す。ポイントは、BIの目的が意思決定を迅速化するための支援であるのに対し、BAでは将来予測による意思決定そのものに重点が置かれていること。つまり、BAの理想形はデータから将来を予測して結果を最適化し、意思決定に至るまでのプロセスを自動化することにある。

ビジネスの理解

データ分析の方法論CRISP-DMにおける1番目の工程。
企業内の各種課題を明確にしたうえで、データマイニングプロジェクト全体をプランニングしていきます。

ビッグデータ

オンサイトでの解析支援を行っています。 アイズファクトリーがご提供するAI人材は次の3つのスキルセットをもったAI人材です。
・データサイエンティスト
・AIエンジニア
・データアナリスト

備品の適正在庫

過去の履歴から適正在庫を予測します。

病理診断

画像や心電図、内視鏡検査等で取得したデータを解析し、該当の患者の方が、り患しやすい病気や、病気になりやすい確率を予測します。

PLSA(確率的潜在意味解析法)

これまでは行または列のどちらかの要素でしか出来なかったクラスタリングを、同時にクラスタリングする知識発見手法の1つ。メリット:①高次元データに対応(次元圧縮により解釈しやすい)、②行と列を同時にクラスタリング、③ソフトクラスタリングできる(単語、文章が所属クラスターを1つに絞ることがなく解析の幅がひろがる)。クラスターを1つに絞る手法をハードクラスタリングという。

PoC(ピー・オー・シー、Proof of Concept)

概念実証の意味で、新しい概念や理論、原理、アイデアの実証を目的とした検証やデモンストレーションを指します。概念実証は、新たな概念やアイデアの実現可能性を示すために、簡単かつ不完全な実現化を行うこと。あるいは原理のデモンストレーションによって、ある概念や理論の実用化が可能であることを示すこと。 概念実証は一般に完全に機能するプロトタイプへと至る前段階と見なされる。

PPDM(プライバシー保護データマイニング)

プライバシーを保護しつつ、データから有用な情報の抽出を試みるための技術の総称。

PV(ページビュー)

ウェブサイト内の特定のページが開かれた回数を表し、ウェブサイトがどのくらい閲覧されているかを測るための最も一般的な指標の一つ。

ファクトベース

事実・データを正確に読み取り、それに基づいて意見を述べること、またその思考法。特にコンサルティング業界では基本となる考え方。ファクトベースは、ロジカルシンキング(論理的思考法)と並んでビジネス・研究に必須の思考。

ファシリテーション

集団による問題解決、アイデア創造、教育、学習等、あらゆる知識創造活動を支援し促進していく働きを意味します。

フィージビリティ

実現可能性。新たな試みが実現可能なのかどうかを示す。事業化の可能性、採算性など、プロジェクトの実現可能性を事前に調査して検証することをフィージビリティスタディと呼び、企画や事業開発の場面でよく使われる。

フィールドセールス

インサイドセールスによって構築された顧客関係と、蓄積された顧客/見込み客情報の活用により、営業訪問、商品・サービスの提案、クロージング活動を行う営業手法。

フェイス項目

性別や年齢など、回答者を特徴付ける基本的な属性を問う質問項目のこと。

俯瞰分析

ビッグデータの全体像や特徴を可視化することによって、効率・効果的に把握できるよう支援するための技術や手法。

複合語解析

文章内の単語の出現パターンを認識して、形態素同士を結合し意味のある単位でキーワードの抽出を行います。結果的により人間の感覚に沿った、より理解しやすい分析結果を得ることができます。

複合語・複合語エンジン

複合語とは語構成において2つ以上の内容形態素によって形成された語。合成語の下位分類の一つ。複合語エンジンは文章を複合語に分かち書きするエンジン。複合語解析技術で品詞(単語を文法上の性質によって分類したもの、動詞・形容詞・名詞などの10種類)の並びパターンに着目して、意味のある単位に単語を再構築。よって辞書にない単語を抽出できる。

フリーアンサー

言葉で自由に回答させる質問項目のこと。

フリークエンシー

広告への接触頻度を表す指標。ある広告に接触した人1人あたりの平均接触回数。

分散処理

分散処理とは、データ処理手法の一種であり、プログラムの個々の部分が同時並行的に複数のコンピュータ上で実行され、それらが互いに通信しあう形態である。

文章可視化

任意の文章群を入力すると、形態素解析ならびに複合語解析を行い、それぞれの要素(キーワード)のつながりをネットワーク図(Key Graph)で出力します。解析対象となった文章が、どのようなキーワードで構成され、どのようなつながりを持って構成されているか理解できます。

文章可視化エンジン

文章をキーワードのつながりで表示するエンジン。

プライシング

客室の稼働率を最大化するためには、需給状況によって割引率を変動させる必要があります。
ホテルの周辺エリアの旅行者数やホテル数などの情報と、自社物件の特徴や場所、アメニティ、予約履歴などの情報をデータ化して解析することで、それぞれの日の最適な割引率を決定することができます。

プラットフォーム

あるソフトウェアやハードウェアを動作させるために必要な、基盤となるハードウェアやOS、ミドルウェアなどのこと。また、それらの組み合わせや設定、環境などの総体を指すこともある。

プラットフォーム層

DXにおけるインターフェース層とサービス層の中間層。インターフェース層よりデータを取得しプラットフォーム層に取り込み、サービス層へ提供する。

プリセールス

システム構築やソフトウェア製品を販売・導入する際に、営業担当に同行し、ITの技術的な知識を用いて、営業担当をサポートする職業。

プロトタイプ

新技術や新商品などの問題点を洗い出すために製造された、プログラムや試験機、試作品のこと。デモンストレーション目的や新技術・新機構の検証、試験、量産前での問題点の洗い出しのために設計・仮組み・製造された原型機・原型回路・コンピュータプログラムのことを指す。

プロファイルチャート

bodaisクラスタリングでのプロファイルチャートとはクラスタごとの属性分布のことです。

ベイジアンネットワーク

起こるか起こらないかはっきりとは分からない事象同士の因果関係と発生確率をモデル化したもの。モデルを構築することで物事の因果関係を把握しやすくできる。

ベイズ線形回帰

線形回帰にベイズ確率の考え方を導入したもの。

ベン図

複数の集合の関係や集合の範囲を視覚的に図式化したもの。

ベンダー

製品を販売する会社。製品のメーカーや販売代理店のこと。

ペルソナ

商品やサービスを利用するターゲットとなる顧客モデル。自社の商品やサービスを買ってほしい顧客の特徴をわかりやすくまとめたもの。ターゲティングなどの顧客戦略に用いられる、プロフィールを細かく定めた典型的な顧客像。

保守点検効率化

過去の保守点検情報から、点検項目の優先順位と効果予測を算出し、削減できる点検項目を推奨します。

ホットリード

興味・関心の高い見込み客のこと。情報取集が本格的になっており、接触も多く、商談につながりやすい状態。

ホワイトペーパー

製品やサービスの機能解説や市場分析などを文書にまとめたものを指す。

bodais

bodais(ボダイス)は多岐にわたる異なるタイプのデータ解析と1,000以上の解析プロジェクト実績で蓄積した機械学習機能内蔵型の自動進化型データ解析プラットフォームです。特定のデータ解析目的での利用にはじまり組み合わせ利用も可能です。お客様自身で解析サービスやデータの多様な選択が行えます。

bodais FTPアップロード機能

bodaisでは、http接続ではアップロードできないような大きな容量のデータファイル(10万行を超えるファイル)のアップロードに対して、FTPクライアントを使用したファイルアップロード機能で対応しております。各bodaisユーザーは専用のディレクトリ領域を有しており、固有の「ユーザー名」「パスワード」でその領域に接続しファイルをアップロードすることが可能です。

bodaisクラスタリング

bodaisクラスタリングサービスは、お持ちのデータを、その属性に応じて分類(クラスタリング)するサービスです。本サービスには、「教師なし」及び「教師あり」と呼ばれる2つのサービスを含みます。「教師なし」は、分類のついていないデータに分類を付与するサービスです。「教師あり」は、既に分類のついているデータを用いて分類モデルを構築し、新しいデータに分類を付与(予測)するサービスです。

bodaisスコアリング

スコアリングサービスは、過去の実績をもとに、お持ちのリストをレスポンスの見込みの高い順にランキングするサービスです。
このサービスを用いて、
過去の実績をもとにモデルを作成する【モデル作成】
お持ちのリストに予測スコアを付与する【予測】
作成した予測の効果を検証する【検証】
実際の結果をもとにモデルの再構築を行う【リモデル】
が可能です。

bodaisプラットフォーム

bodaisプラットフォームは、データ解析専用に設計されたソフトウェア基盤です。アイズファクトリーが15年以上に渡って完結させてきた300を超えるデータ解析プロジェクトで蓄積したノウハウを、誰もが簡単に使えるサービスとしてご提供します。

bodais連携サービス

クラウドアプリケーションサービスで蓄積されたデータをbodais で解析し、それぞれの業務の未来を予想します。

ポートフォリオ

金融商品の組み合わせのことで、特に具体的な運用商品の詳細な組み合わせを指します。 「ポートフォリオを組む」ということは、どのような投資信託を購入しようか、株はどの銘柄で何株ほど持つか、などの検討をするという意味です。

POSデータ

Point of Sales の略で直訳すると「販売時点」となる。どの商品が・いつ・どこで・いくらで・いくつ売れたかを記録したデータのこと。購入者に関する情報も記録しておくことがある。POSデータを分析することで、在庫や発注を効率化することなどができる。

ポジネガエンジン

文章群に対して各文章のポジネガを判定するエンジン。ポジネガ解析で、各文章の背景にある感情がポジティブかネガティブ、または中立の判定を行う。単語の判定ではなく、文章毎に判定。最も簡単な方法は、テキストを形態素解析して品詞ごとに分割。単語ごとの感情(単語感情極性分類)を記録した辞書と突き合わせることで、ポジネガ判定を行う。但しこの方法だと必ずしも正しいポジネガ判定を行えないため、isFではtwitterの投稿文からのVOC(顧客の声)解析や、ブログ反響などの解析で活用することができる。

ポジネガ解析

任意の文章群を入力すると、各文章毎に背景にある感情が「ポジティブ」か「ネガティブ」、または「中立」の判定を行います。 単語での判定ではなく、文章毎に判定を行います。

マ行

マイケル・ポーター

アメリカの経営学者、競争戦略の第一人者。他社との競争において重要となる3つの戦略を提唱。
コストリーダーシップ戦略:他より低価格で商品やサービスを提供する
差別化戦略:独自のポジションに商品やサービスを置く
集中戦略:市場を狭く限定して経営資源を集中させる

マーケティングオートメーション(MA)

顧客開拓におけるマーケティング活動を可視化・自動化するツールのこと。新規顧客を開拓するには、それぞれの見込み客が持っている興味や関心、その行動に対して「最適な情報」を「最適なタイミング」「最適な方法」で提供するマーケティング活動が求められます。しかし、これを実現するには多くの人員が必要です。そこで、人的なマーケティングのオペレーション部分を効率化・自動化するために開発されたのが、「マーケティングオートメーション(MA)」です。 マーケティングオートメーション(MA)は、見込み顧客自身の固有情報や見込み客から収集した各種情報の一元管理、育成、さらにはホットリード(購買意欲の高い見込み客)の絞り込みまでの活動を自動的(効率的)に行う役割を果たします。

マージ

マージとは「併合する」、「合併する」という意味であり、情報工学の用語としてよく用いられる。 広義には複数のデータベースやファイル、プログラムなどを一つにまとめる行為を意味する。 狭義には以下で述べる二つの線形リストを一つにまとめるアルゴリズムのことである。

Mautic(マウティック)

世界初のオープンソースマーケティングオートメーションツールソフトウェア(Eメール、ソーシャルなど)。見込み客を、Mautic独自の指標(ポイント)で可視化して分析や管理する事ができる。見込み客の状況(ポイント)に応じて、自動でメールを送ることができ、送ったメールの開封状況も管理画面から見ることが可能。

マス広告

新聞広告、雑誌広告、テレビCM、ラジオCMの4つの媒体のことを指す。

マルチアンサー(MA)

複数の選択肢の中から回答を2つ以上選択させる質問項目のこと。

マルチコ処理

各変数カテゴリ間(同一の変数を除く)の相関係数またはVIF値が高いものを削除します。

名義尺度

性別や血液型などのようにデータを分類するために振り当てられた数字や名前のこと。

メタデータ・メタ情報

データについてのデータ。あるデータそのものではなく、そのデータを表す属性や関連する情報を記述したデータのこと。データを効率的に管理したり検索したりするためには、メタデータの適切な付与と維持が重要となる。

メンタルヘルス

人事データとストレス診断(アンケート)からケアすべき人材を判定します。

モジュール

システムを構成する要素となるもの。いくつかの部品的機能を集め、まとまりのある機能を持った部品。

モデルの構築

データ分析の方法論CRISP-DMにおける4番目の工程。
分類や予測を行うための機能を構築する。

モデル評価値ークラスタリング

クラスタリングのモデル評価値とは、作成したモデルをもとに予測分類を行った際に、より良い結果を出すことができるかを表した指標です。
1に近いほど「良い」分類ができているとみなすことができ、評価値が0.7以上であれば「良い」モデルである目安となります。

モデル評価値ースコアリング

モデル評価値とは、作成したモデルをもとに予測を行った際に、より良い結果を出すことができるかを表した指標です。
1に近いほど「良い」モデルであるとみなすことができ、評価値が0.7以上であれば「良い」モデルである目安となります。 正解がスコア上位に集まればモデル評価値が良くなり、ゲインチャートは上に膨らみを持った曲線となります。

モバイルファーストインデックス(MFI)

今までPCページのコンテンツをもとに検索順位を決定していたものを、スマートフォンページのコンテンツをもとに検索順位を決定する方針のこと。

予測実績比較ゲインチャート

検証詳細とゲインチャートを表示しています。
ゲインチャートでは予測と実績の比較を行い、全体としての適合度の検証を行う事を可能にしています。

予防診断

患者の年齢や家族構成、生活習慣、病歴などのデータを解析し、病気になりやすい人 の特徴を明らかにします。

ラ行

ライフサイクル

商品が市場に投入されてから姿を消すまでの流れを表すもの。 もともとは、人生の経過を円環に描いて説明したもので、商品を生物にたとえた表現。 ライフサイクルは、「導入期」→「成長期」→「成熟期」→「衰退期」という4つの段階をたどる。

ライブコマース

ネット上のライブ配信を通じ、化粧品や日用品などを消費者に直接売り込む仕組み。日本から中国本土へと配信し、越境ECを活用して直接売り込むといったことも行われる。

ラッソ回帰

ラッソ回帰は、変数選択と正則化の両方を実行し、生成する統計モデルの予測精度と解釈可能性を向上させる回帰分析手法。

ランダムサンプリング

ランダムサンプリングとは、母集団から、一部対象者を抽出し、標本だけでなく母集団について一定の誤差範囲で推定する方法である。

リアルタイム経営

解析する目的を明確に設定。その上で、社内に蓄積されたデータを基に組織横断で解析します。 まずは、組織別にモデルを構築し解析を行います。其の上で、企業モデルを構築して解析を行います。
しかし、社内のデータだけを分析対象にしても“過去”から抜け出すことができません。適切な外部データも使いながら、解析を行う事で正しい判断を行う事が可能になります。

リーチ

ある広告が掲載されている媒体の利用者数のうち、その広告に接触した人数の割合。接触者率ともいう。テレビCMの場合、視聴率と同義。

リーン(lean)

痩せていることや脂肪のないこと、また無駄がないことやひきしまっていること。リーンキャンバスは、ビジネスモデルを一枚の図にしたフレームワーク。リーンスタートアップは、小さくビジネスを創造して、問題があったらすぐにムダを省いて軌道修正しようという方法論。コストをそれほどかけずに最低限の製品や、最低限のサービス、最低限の機能を持った試作品を短期間で作り、顧客に提供することで顧客の反応を観察する。

リスティング広告

検索エンジンの検索結果にユーザーが検索したキーワードに連動して掲載される広告。検索連動型広告(検索広告)、PPC(Pay Per Click)とも呼ばれ、広告がクリックされると費用が発生する。

リッジ回帰

リッジ回帰とは過学習を防ぐため線形回帰に正則化項(ペナルティ項)としてL2ノルムを導入したモデルです。 ざっくり説明すると過学習を抑える手法の一つとも言えます。

リテラシー

特定分野の知識。知識や情報を有効活用できる能力。

量的変数

間隔尺度または比例尺度からなる変数。数量変数とも言う。

類似度

クラスター分析や数量化4類に用いる指標の一つで、クラスター間・個体間の類似性の度合いを表すもの。値が大きいほど類似性が高い。

ルート

階層型ファイル構造で一番上の層のディレクトリやフォルダのこと。

レーベンシュタイン距離

2つの文字列がどの程度異なっているかを示す距離の1種。編集距離とも呼ばれる。具体的には、1文字の挿入・削除・置換によって、一方の文字列をもう一方の文字列に変形するのに必要な手順の最小回数として定義される。

レコメンド、レコメンドエンジン

レコメンドは、ユーザーの好みを分析し、各ユーザーごとに興味のありそうな情報を選択して表示するサービスのこと。レコメンドエンジンは、過去ログからトレンドを学習して入力に対してレコメンドするエンジン。

レコメンド分析

顧客の購買履歴データを使って、ロイヤルカスタマーの顧客購入傾向分析を行い、類似顧客に対しての推奨商品を可視化します。

レスポンスチャート

レスポンスチャートとは、横軸にスコア降順位、縦軸にスコア降順位までの累積レスポンス率(累積レスポンス数÷アクション数)を描いた曲線です。目標とするレスポンス率を条件とした場合に、どれだけアクションできるかが分かります。

レッドオーシャン

競争の激しい既存市場。

ローデータ

回答者に回答してもらったままのデータのこと。記入漏れや誤記入がある可能性があるため、通常は分析前にデータ洗浄を行う。

ロジスティック回帰

ロジスティック回帰は、結果が 2 値の場合に、その結果の起きる確率を予測できる統計的回帰モデルである。特に以下の場合に有用。
・サンプルについて、単純な成功/失敗の予測ではなく、成功率を予測することができる。そのため、各サンプルに序列を付けることができる。
・量的変数だけではなく質的変数も分析できる。また多数の変数を分析に使用することができる。
・効果の小さい変数がモデルに入っていても、当該変数の回帰係数が小さくなるため、モデルとして頑強である。

ロングテール

インターネットを用いた物品販売の手法、または概念の一つで、販売機会の少ない商品でもアイテム数を幅広く取り揃えること、または対象となる顧客の総数を増やすことで、総体としての売上を大きくするもの。

ロングテールキーワード

ロングテール(長い尻尾)キーワードとは、「複数の単語を組み合わせたフレーズで検索されるキーワード」を指します。ロングテールキーワードは、検索ボリュームこそは多く望めませんが、購買に近い人の「質の高いアクセス」を獲得できる可能性が高いという特徴があります。

ワ行

話題語

トピック語に同じ。専門語彙の類似概念。当該のテキスト集合において、特徴的な中・低頻度の語彙。専門語彙であったり、基本語彙でも特殊な話題、突発的な話題であることが多い。特徴の強さは、統計的に「特徴度」によって計られる。