従来のデータ ウェアハウスではリアルタイム分析が不十分な理由
データドリブンな組織が成功するか失敗するかは、最も新鮮で最新の情報に基づいて意思決定を行う能力に基づいています。サプライ チェーンの最適化、金融取引における不正行為の検出、カスタマー エクスペリエンスのリアルタイムのパーソナライズなど、データの鮮度が最も重要です。
しかし、多くの組織にとって、この「データの即時性」という聖杯は依然としてとらえどころのないものです。彼らは引き続き従来のデータ ウェアハウスやその他のレガシー データ ストア (バッチ処理や履歴分析用に構築された強力なツール) に依存していますが、リアルタイム分析の要求に対処するための設備が整っていません。結果?新鮮ではなくなったデータに基づいて重要なビジネス上の意思決定が行われており、機会の逸失、最適とは言えない結果、競合他社との競争に追いつけないという事態につながっています。
データの鮮度がユースケースにとって極めて重要な状況にあり、依然としてデータ ウェアハウスを主要な分析ストアとして使用している場合は、リアルタイム インサイトのメリットを最大限に享受できていない可能性があります。実際、おそらく、大幅なデータ レイテンシと運用コストが発生し、長期的にはリアルタイム データ イニシアチブを持続できなくなります。
データ ウェアハウスはリアルタイム向けに設計されていません
データ ウェアハウスがリアルタイム分析に対応していない理由を理解するには、これらのレガシー システムと最新のリアルタイム分析データベースの間の主要なアーキテクチャの違いに注目する必要があります。
データ ウェアハウスは、バッチ処理と履歴分析用に最適化されています。彼らは、さまざまなソースからの大量のデータを集約し、データを変換してクリーニングし、レポート作成やビジネス インテリジェンスのために集中リポジトリにロードすることに優れています。このバッチ指向のアプローチは、月次販売レポートや四半期財務分析など、適時性が重要な要素ではないユースケースに適しています。
ただし、データ ウェアハウスの固有の設計により、大幅なデータ遅延が発生します。データは通常、時間、日、週、または月ごとに定期的にウェアハウスにロードされます。これは、データが分析に利用できるようになるまでに、場合によっては数時間、場合によっては数日も古くなっていることを意味します。一秒一秒を争うペースの速いビジネス環境では、この遅れが機会を掴むか完全に逃すかの分かれ目になる可能性があります。
さらに、データ ウェアハウスは、高速データ ストリームを処理したり、低遅延のクエリをサポートしたりするように設計されていません。データ量とユーザーの同時実行性が増加するにつれて、データ ウェアハウスはリアルタイムの意思決定に必要な 1 秒未満の応答時間を提供するのに苦労しています。データ ウェアハウスの基盤となるストレージとインデックス構造は、粒度の高いリアルタイム データの迅速な取り込みやクエリ向けではなく、大量のデータの読み込みと集約向けに最適化されています。
古いデータのコスト
リアルタイム分析をデータ ウェアハウスに依存すると、重大な結果が生じる可能性があります。次のシナリオを検討してください –
- 小売店のパーソナライゼーション: 電子商取引会社は、顧客の閲覧履歴や購入履歴に基づいて、リアルタイムの製品推奨を提供したいと考えています。データ ウェアハウスを使用すると、数時間または数日前のデータに基づいて推奨事項が作成されるため、顧客エクスペリエンスが最適化されず、販売機会が失われる可能性があります。
- 不正行為の検出: 金融機関は、不正取引をリアルタイムで検出して損失を最小限に抑えることを目指しています。データ ウェアハウス ベースのシステムでは、不正行為検出メカニズムがデータ レイテンシによって制限されるため、不正行為が気付かれずにすり抜けてしまう可能性があります。
- サプライ チェーンの最適化: 製造業者は、需要とサプライ チェーンの状況の変化に基づいて、生産と在庫のレベルをリアルタイムで調整したいと考えています。データ ウェアハウスに依存すると、市場変動への対応が遅れ、在庫切れや過剰在庫、収益機会の逸失につながります。
これらの各例では、古いデータのコストは、収益の損失や顧客の不満だけでなく、戦略的利点の逸失による機会費用としても測定できます。最新の情報に基づいて行動できない組織は、機敏な競合他社に常に後れを取ることになります。
さらに、データ ウェアハウス ベースのリアルタイム分析インフラストラクチャの維持に関連する運用コストは法外に高額になる可能性があります。追加の ETL プロセス、データ レプリケーション、複雑なデータ同期メカニズムが必要なため、管理上の負担が大きくなり、総所有コスト (TCO) が増加します。
リアルタイム分析データベース
リアルタイムのユースケースにおけるデータ ウェアハウスの制限を克服するために、組織は Apache Pinot のような特殊なリアルタイム分析データベースにますます注目しています。これらの専用ソリューションは、高速で移動するデータに対する低遅延、高同時実行の分析という固有の要件を処理できるように、ゼロから設計されています。
データ ウェアハウスとは異なり、Pinot のようなリアルタイム分析データベースは、継続的なデータの取り込みとリアルタイムのクエリのために最適化されています。データ ストリームの取り込みとインデックス作成をミリ秒単位で実行できるため、数十億のレコードでも 1 秒未満のクエリ応答時間を実現できます。これにより、組織は可能な限り最新のデータに基づいて意思決定を行うことができ、リアルタイム分析の真の可能性を引き出すことができます。
さらに、リアルタイム分析データベースは水平方向に拡張できるように設計されており、パフォーマンスを犠牲にすることなく増大するデータ量とユーザーの同時実行に対応します。このスケーラビリティは、数千人のユーザーが同時にシステムにクエリを実行する可能性がある、ミッションクリティカルなユーザー向けアプリケーションにとって非常に重要です。
しかし、リアルタイム分析データベースの利点は技術的な能力だけではありません。また、運用上およびコスト上の大きな利点も提供します –
- シンプルなデータ管理: Pinot のようなリアルタイム データベースは、データ ウェアハウジングに関連する複雑さの多くを抽象化し、管理オーバーヘッドを削減し、チームがより価値の高いアクティビティに集中できるようにします。
- TCO の削減: リアルタイム データベースは、コストのかかる ETL プロセス、データ レプリケーション、その他のデータ ウェアハウス固有のインフラストラクチャの必要性を排除することで、リアルタイム分析イニシアチブの TCO を大幅に削減できます。 1 秒あたりのクエリのコストなど、他の料金指標もあり、データ ウェアハウスを使用するベンダーよりもリアルタイム データベースを提供するベンダーの方が費用対効果がはるかに高くなる可能性があります。
- 機敏性の向上: リアルタイムでデータを迅速に取り込み、処理し、クエリできる機能により、組織は変化するビジネス状況や顧客のニーズによりよく対応できるようになり、競争力を高めることができます。
- シームレスなエコシステム統合: リアルタイム データベースは、一般的なデータの取り込み、処理、可視化ツールとシームレスに統合されることが多く、エンドツーエンドのリアルタイム分析ソリューションの構築が容易になります。
データ ウェアハウスではなくリアルタイム分析データベースを選択する場合
従来のデータ ウェアハウスの代わりに Apache Pinot などのリアルタイム分析データベースを使用する決定は、組織の特定のユースケースと要件を慎重に評価したことに基づいて行う必要があります。一般的な経験則として、データの鮮度がビジネスの成果にとって重要であり、高速のデータ ストリームを扱っている場合は、リアルタイム分析データベースがより良い選択となる可能性があります。
リアルタイム分析データベースが威力を発揮する一般的なシナリオをいくつか紹介します –
- ユーザー向け分析: ダッシュボード、レポート ツール、パーソナライゼーション エンジンなど、1 秒未満のクエリ応答時間と高い同時実行性を処理する機能を必要とするアプリケーション
- 運用分析: サプライ チェーンの最適化、不正行為の検出、予知保全など、即座のアクションを推進するためにリアルタイムの分析情報が必要なユースケース
- IoT とエッジ分析: 接続されたデバイスやセンサーからのデータを分析する。低レイテンシとソースの近くでデータを処理する機能が不可欠です。
- ストリーミング データ処理: 金融取引、クリックストリーム分析、リアルタイム広告の最適化など、高速データ ストリームの継続的な取り込みと分析を伴うシナリオ
対照的に、履歴レポート、ビジネス インテリジェンス、データ サイエンス ワークロードなど、データの鮮度がそれほど重要ではないユースケースでは、データ ウェアハウスが依然としてより良い選択肢となる可能性があります。
最終的に重要なのは、特定の要件を理解し、業務に適したツールを選択することです。データ ウェアハウスをリアルタイム分析のユースケースに強制的に適合させようとすると、必然的にパフォーマンスが最適化されず、コストが増加し、機会を逃すことになります。
次のステップ
ビジネスのペースが加速し続けるにつれ、リアルタイムのデータ洞察の必要性がかつてないほど高まっています。今の力、つまり思考のスピードでデータを行動に変える能力を活用できる組織が、デジタル時代で成功するでしょう。
このトピックをより深く掘り下げ、より明確にするために、私たちは電子書籍「適応するか追い越されるか:リアルタイム データの競争力」を作成しました。今すぐダウンロードして、ユーザー向けのリアルタイム分析ニーズすべてに対応する適切なツールとして、Apache Pinot のようなリアルタイム分析データベースを導入するよう組織内で主張してください。
モノのインターネットテクノロジー
- IBMWatsonがAIを使用して他のすべてのビジネスをどのように強化しているか
- モノのインターネットのセキュリティに対する人間の処方箋
- エンタープライズIoTでは、まだ最高のものはありません
- IIoTプロジェクトを支援するために、IICはリソースハブを立ち上げました
- サイバー戦争が発生した場合、誰がデフォルトであるかは誰もが知っています
- 5Gの商用展開に挑戦するのは、COVID-19ではなくセキュリティです。
- ZigbeeベースのLEDライトに引き裂く
- IoTとLPWA:接続された世界の完璧なパートナー
- IoTを活用したガス監視ソリューションで産業ニーズに対応
- エッジアプリケーションテクノロジーはすべての業界にメリットをもたらします
- 10社中9社がIoTサイバー攻撃を予想している、調査結果