【英語】 DWH: Data Ware House

【読み】 データウェアハウス

用語解説

データウェアハウス(DWH)とは、データ分析や意思決定の高度化を目的とした、複数の基幹系システムから、データを収集・再構成した統合データベースのことである。BI(ビジネスインテリジェンス)の一部である。

■詳細説明
DWHとは
DWH(データウェアハウス)は、多くの情報に基づく意思決定を行う事を目的として、複数のシステムから必要なデータを抽出・統合し、分析可能な情報として時系列に保管する。その為、DWHに格納するデータは、分析を行うために何らかの形で整形する必要がある。ウェアハウスは「倉庫」という意味があり、「データの倉庫」と和訳される事が多い。
DWHはさまざまな企業、団体に導入されていて、データの集積と分析が必要となる場面や業務に役に立つ。たとえば、①POSデータにおける異常データや不正行為の監視、②POSデータの店舗ごとにおける効率的な在庫の管理、③地域、時期、商品カテゴリ、顧客セグメントに合わせた効果的なマーケティング戦略立案、④顧客の離反、休眠化の要因分析やアクティブ化する対策立案。

DWHとDBの違い
どちらも大量のデータを整理・保管するという意味では共通であるが、厳密には異なる意味をもつ。それぞれの目的として、まずDWHはデータ分析を目的としている。その為、アプリケーションでは利用しなくなったログなどのデータも格納されている。分析用に格納されたデータは滅多に消される事はない。DB(データベース)は、アプリケーションやシステムのデータを管理する目的で構築される。その為、定期的に更新・削除される。 次に処理速度を比較する。DBはデータを管理する事が目的であり、データの記録・閲覧に利用される事が多く、データ分析における処理速度は速くない。また、データ分析に利用する際にはなにかしらの加工が必要となる場合が多い。
一方でDWHは、データ分析を目的としている為、膨大なデータを高速に処理する為に様々な仕組みをもっている。例として、分散処理と呼ばれる仕組みがある。Googleが提供するBigQueryは、数TB(1テラバイト=1,024GB)、数PB(1ペタバイト=1,024TB)という途方もないデータ量であっても数秒、数十秒で処理することができる。

DWHとBIの違い
DWHは、複数システムのデータソースを一元で管理するのに対して、BIツールは、データウェアハウスに蓄積されたデータを分析、レポーティング(可視化)するためのツールである。BIツールを使用する事で、表やグラフといった視覚的にわかりやすい形式でデータを可視化する事ができ、データに対しての知見が少ない人に対してもデータから得た知見を上手く伝える手助けとなる。

DWHを使用するメリット
・データ収集の効率化
データ収集を効率化できることである。企業が保有する様々なソースのデータを集積し、データ分析用に加工した状態で保管することができる。様々なソースのデータを1箇所に集積する為、企業内の必要なデータを即座にデータ分析に使用する事が出来る。これにより、プロジェクトを迅速に進める事ができ、分析結果をビジネスに反映するまでの時間を短縮する事が出来る。

・データを時系列順に保管
時系列順でデータを保管することができる。その結果、過去のデータが消えることがなく、時系列ですべてのデータを管理できるため、時系列を考慮した正確なデータ分析が可能になる。DWHは、膨大なデータを保管・分析することが可能なため、過去のデータを時系列で保存しつつ、より合理的かつ有用性のある分析が実現できる。

・膨大なデータに基づいた意思決定が出来る
過去の膨大なデータは、経営戦略策定のために必要不可欠な要素である。
DWHは、意思決定を行う事を目的としている為、感覚的な判断や、情報ではなく、実データに基づいた迅速な意思決定を行う事ができる。

DWHを使用する上での注意点
・使用に際するコスト
BigQueryを代表とするDWHサービスは、データ操作を実施する際に課金が生じる。その為、クエリを実行する場合など、課金を意識したクエリ作成が必要となる。
導入するDWHの仕様に合わせた運用と、事前に分析者への注意事項の共有が必須となる。

・メモリ容量の意識
Amazonが提供する「Amazon Redshift」などは、使用できるメモリに制限がある。DWHはビッグデータを対象に分析を行う為、個人単位の使用するメモリが大きい。そのため分析者が多い時間帯などによっては処理が重くなることもある。組織としての分析者の規模に合わせて各DWHシステムの導入を検討する必要がある。

・DBで収集するデータとDWHで管理するデータの形式
各システムで収集するデータは、データ分析に活用する際に何かしらの加工が必要である。その為、各システムで取得したデータを分析しやすい形式でDWHに移行する際は、情報ロスを極力少なく、分析しやすい形式へデータを変換する必要がある。

・セキュリティの確保
企業内の様々な部署のデータを一元管理する為、大量の重要データが保管される。DWHにはオンプレミス型やクラウドを使ったデータ管理形式がある為、外部的なサイバー攻撃などの対策や、内部における持ち出し防止といったシステム設計が必要となる。

DWH 図1

関連キーワード

関連事例


運営会社へのお問い合わせは、下記ボタンよりお問い合わせください。

運営会社へのお問い合わせはこちら 

bodais

bodais

DX総合支援サイト

運営会社