データグラビティの活用:戦略的なクラウドアーキテクチャの決定
インフラストラクチャで働いている人なら、データの重力が実際に働いていることを感じたことがあるでしょう。あなたは、牧歌的で自然のままの柔軟な建築物を計画して建設し、しばし立ち止まってその姿に驚嘆します。次にデータを追加すると、データは増大します。突然、ワークロードがその周囲にクラスタリングされ、データが存在する場所にサービスがデプロイされ、アーキテクチャの決定がビジネスの優先順位ではなくストレージの場所によって静かに決定されるようになります。
最初は、それは微妙で、ここでは数ミリ秒の余分な遅延があり、そこには少額の下り料金がかかります。しかし、話を早送りすると、ワークロードの移動が戦略的な選択ではなく、大変な労力を必要とするシステムを管理していることになります。それが本当の危険なのです。移動できないわけではありませんが、コストがかかり、混乱が生じ、政治的に困難になるため、移動できないのです。
キッカー?引力は、あなたが立ち往生している環境が依然としてあなたにとって適切な環境であるかどうかを気にしません。
データグラビティとは何ですか?
ご存知のとおり、質量は質量を引き寄せます。テクノロジーにおいては、データセットが塊です。大きくなればなるほど、その吸引力は強くなります。コンピューティング、アプリケーション、分析、AI モデルがデータに移行して、レイテンシが短縮され、アクセスが簡素化されます。
この魅力は短期的には役立つ可能性があります。すべてを近くに置くと、少なくとも最初はデータの移動が減り、パフォーマンスが向上し、複雑さが最小限に抑えられます。しかし、時間が経つにつれて、それは制約になります。データセットと周囲のサービスが大きくなり、より複雑に絡み合うほど、大きな中断なしにそれらを再配置することが難しくなります。
こちらもご覧ください: データ ガバナンスの自動化:AI をデジタル ドアマンとして活用
クラウド戦略に対する現実世界の影響
1.移行の課題
ペタバイト規模の移行は「リフトアンドシフト」ではありません。これらは、カットオーバー ウィンドウ、デルタ同期戦略、データ検証、リスク管理が組み込まれた段階的な運用です。最善の計画を立てたとしても、次のような問題に直面する可能性があります。
- 外出を妨げるように設計されたと思われる下り料金
- プロバイダ側からの帯域幅調整
- カットオーバー中の運用ダウンタイムまたはサービスの低下
- 移行を途中で停止できるコンプライアンス監査
実用的なヒント: 持ち運びのしやすさについては、引っ越しが始まるまで待ってはいけません。オープン スタンダード、コンテナ化されたワークロード、独自のサービスへの依存を減らす抽象化を通じて、最初からアーキテクチャに組み込みます。
2.パフォーマンスペナルティ
近接性が重要であることはすでにご存知でしょう。しかし、マルチリージョンまたはマルチクラウドの設定では、時間の経過とともにデータとコンピューティングが驚くほど簡単に乖離してしまいます。
その場合、2 回支払うことになります。1 回目はレイテンシー (ユーザー エクスペリエンス、分析 SLA、バッチ処理時間に影響します)、もう 1 回目はリージョン間またはクロスクラウドの転送コストです。
実用的なヒント: 導入時だけでなく、データの場所に対するワークロードの配置を継続的に監視します。意図的に分離する理由がない限り、コンピューティングとストレージの同期を自動的に保つツールやポリシーを使用します。
3.デフォルトでのベンダーロックイン
ロックインが 1 つの大きな決断で起こることはほとんどありません。 API がここにあり、管理されたデータベースがそこにあり、ワークロードが単一プロバイダーのサービスと深く絡み合うまで、それはゆっくりと行われます。その時点では、「移行」は再配置というよりも書き換えに近くなります。
実用的なヒント: 技術的負債と同様に、アーキテクチャ内のプロバイダー固有の依存関係を追跡します。四半期ごとにレビューを行って、(独自の価値を提供するため)どれを許容するか、クリティカル パスになる前にどれを緩和し始めるかを決定します。
こちらもご覧ください: 場所、場所、場所もデータに関係します
データグラビティの軽減
引き寄せが罠にならないようにする方法は次のとおりです。
ハイブリッドとマルチクラウドをデフォルトとして採用
ハイブリッドを「後から」戦略として扱わないでください。それが出発点です。ワークロードは、プライマリ プロバイダーがたまたまキャパシティを持っている場所ではなく、最もパフォーマンスが高い場所に配置します。複数のプロバイダを利用して、交渉の活用と導入の柔軟性を維持します。
コンピューティングをエッジにプッシュする
レイテンシの影響を受けやすいワークロード (AI 推論、産業用テレメトリ、ビデオ ストリーミング) の場合、ソースまたはソース近くでデータを処理します。洗練されたデータまたは集約されたデータのみをコア インフラストラクチャにプッシュして、移動とコストを削減します。
データ ライフサイクル管理に積極的に取り組む
すべてのデータがプレミアム ストレージや即時アクセスに値するわけではありません。ホット/ウォーム/コールドの階層化が標準的な方法である必要があります。積極的にアーカイブしましょう。運用上、ビジネス上、法的価値、またはコンプライアンス上価値のないものは削除してください。テラバイトをカットするたびに、重力が減少します。
今後の展望
新興テクノロジーが計算を変え始めています。分散型ストレージ、AI 主導のオーケストレーション、プロバイダーに依存しないデータ ファブリックは、モビリティを再び現実的な選択肢にするのに役立ちます。しかし、それらは特効薬ではありません。意図的なアーキテクチャがなければ、これらのツールは、すでに動かない塊の周りにさらに複雑な層を追加するだけです。
データグラビティは避けられません。間違いは、それが財務的かつ戦略的な問題であるにもかかわらず、純粋に技術的な問題のように扱うことです。データがどこに置かれるかによって、レイテンシー以上のことが決まります。これにより、コスト構造、柔軟性、機会や脅威が現れたときにどれだけ迅速に方向転換できるかが決まります。
最初に使用するハイパースケーラーは、一部のワークロードにとっては正しい選択であるかもしれませんが、それがすべてのワークロードにとって永遠に正しい選択であるとは決して考えないでください。
今すぐ開始するアクション アイテム:
- データの場所とワークロードを一覧表示し、1 つのプロバイダに「重力的に束縛されている」ものを特定します。
- 移行コストが必要になる前にモデル化する — 脱出速度を金額、時間、リスクで把握する
- 移植性を考慮した構築 - オープン スタンダード、コンテナ化、独自の依存関係を最小限に抑える
- 四半期ごとに配置を確認し、可能な限りコンピューティングとストレージを調整する
- 現在は 1 つのプロバイダが優勢であっても、複数のプロバイダとの関係を維持する
クラウドでは、モビリティはあれば便利というわけではありません。これは、コストの高騰、パフォーマンスの低下、イノベーションの減速に対する保険です。移動を想定したようにアーキテクチャを構築すれば、本当に意味のある場合にのみ、自由に留まることができます。
クラウドコンピューティング
- 安全なデータ ストレージ ソリューション:正しい選択をするための 6 つのルール
- AWSモニタリングツールの説明
- AWS vs. Azure vs. Google:Cloud Wars 2020
- 銀行と金融におけるクラウドコンピューティングの役割
- AWSでの機械学習;それをすべて知っています
- Cloud Monitoring とは?メリットとベスト プラクティス
- 従来のMCADおよびECADの課題を克服する
- クラウドインフィニティへ、そしてそれを超えて
- AzureのKubernetes:成功のためのツールとヒント
- ウィークリーパケット:ゴールドメダルテック、クラウドショッピングリスト
- クラウドコンピューティングは組織にどのようなメリットをもたらしていますか?