データフュージョンとは、形式や収集条件の異なるデータを統合して、分析の可能な1つのデータに加工する技術を指します。

 

データフュージョンとは

データフュージョンとは、形式や収集条件の異なるデータを統合して、分析の可能な1つのデータに加工する技術を指します。
統計分析で使用するデータには、1つの情報媒体から取得されるシングルソースデータ、複数の情報媒体から取得されるマルチソースデータがあります。
マルチソースデータは情報媒体ごとにデータの形式が異なるため、そのままでは分析に用いることができません。データフュージョンにより形式を整え、シングルソースデータに統合する必要があります。

インターネットやIoT技術の発展により、様々なデータソースから膨大なデータが蓄積されるようになりましたが、多くの場合、それらは形式や発生間隔が異なるデータです。
これらをデータ分析に活用するために、データフュージョンが必要になります。

形式の異なる複数のデータを統合する場合、データ間で対応しない項目は欠損値となります。
データ間で共通する項目をもとにデータを統合し、共通項目をもとに欠損値を推定することでデータを統合することができます。データ間で共通する項目は共変量といいます。
自動運転技術ではデータフュージョンが活用されています。
カメラやGPS、速度センサーなど、複数のセンサーから取得されるデータを自動車の制御に使用しますが、データフュージョンを用いてこれらのデータを統合します。

データフュージョンのフロー

(1) 複数の媒体から入力を受け取ります(マルチソースデータ)。
(2) 時刻などの共変量をもとにデータを統合します。
(3) 形式の違いにより欠損しているデータを、共変量をもとに推定・補完します。

概念図

商品/デモ

作成中

関連情報

研究レポートISR007:データフュージョン