Insight Technology

Qlik Compose™ for Data Lakes

取り込みデータの管理と自動化でデータレイクの導入から成果を生み出すまでの時間を短縮

Qlik Compose™ for Data Lakesとは?

データ活用に対する多様化を求める中で、求められるのはデータの質や量だけではなく、扱えるデータの種類や形式にも多様性が求められるようになりました。
データレイクは、事前に定義されたスキーマによって整理された構造化データだけでなく、様々な非構造化データを事前定義することなく取り込めるという大きな優位性がある反面、取り込んだデータを全て管理するのは難しいということが運用面での懸念点でした。

Qlik Compose for Data Lakesは、各データのメタデータを管理することで必要な時に最適なデータを取り出すことを可能とします。また、メタデータの管理だけでなく、各過程からコーディングを排除し自動化することで、データレイクの導入から成果を生み出すまでの時間を短縮することができます。

データパイプラインの自動化

Qlik Compose for Data Lakesは、データパイプラインの各過程からコーディングを排除し自動化することで、データレイク内のエンタープライズデータを瞬時に変換し、ソースデータベースとターゲットデータベースの変更に簡単に適応させます。また、リアルタイム表示のためのオペレーショナルデータストア(ODS)と、すべてのデータの変更を追跡するためのヒストリカルデータストア(HDS)を継続的に自動で生成、管理します。

Qlik Compose™ for Data Lakesのデータフロー

Qlik Compose™ for Data Lakesのデータフロー
  • POINT01
    ランディングゾーン
    ソースからのデータは、Qlik Replicate™を使用してさまざまなデータソースの生データが継続的にインポートされます。この状態では、まだアナリストが利用できる形にはなっていません。
  • POINT02
    アセンブルゾーン
    データは標準化、再分割され、トランザクション的に整合性があり、変換可能な履歴データストアとしてマージされます。変更履歴を全て保持するため、データの変更を巻き戻し、特定、修正などに対応することができます。
  • POINT03
    プロビジョニングゾーン
    アセンブルゾーンで作成されたデータセットは、履歴データストア(HDS)、運用データストア(ODS)、または両方のスナップショットなどのデータセットとしてプロビジョニングゾーンに配置され、利用者はこれを参照します。
    データセットは自動で継続更新されるため、利用者は分析ワークフローのために、データが更新される度に元のデータソースにアクセスして、新しいデータセットを取得し直す必要はありません。

ビジネス上のメリット

より高速にデータレイクを運用するための準備
データを活用するための開発時間の短縮
Hadoopに対するスキルフルなエンジニアへの依存度を低減
標準SQLを利用したアクセスが可能
お勧め情報
問題解決
昨今のあまりにも激しく素早いビジネス変化の時代では、データ活用に取り組むことは、...
データベース仮想化
データ統合
ホワイトペーパー
データレイクは IT 企業にとってさまざまなデータを管理する効率的かつスケーラブ...
データ統合
ページトップへ