工業製造
産業用モノのインターネット | 工業材料 | 機器のメンテナンスと修理 | 産業プログラミング |
home  MfgRobots >> 工業製造 >  >> Industrial Internet of Things >> クラウドコンピューティング

クラウドの停止:なぜ、どのように発生するのか?

IT がクラウド サービスに依存するほど、クラウドの停止によるダウンタイムと収益の損失に苦しむ可能性が高くなります。パブリック クラウドを使用する組織の 60% 以上が、2022 年にこれらのインシデントによる損失を報告しているため、企業が直面する可能性が低い異常事態ではありません。

しかし、サービス停止は、クラウドを永久に離れる十分な理由になるのでしょうか?それとも、時折のダウンタイムのリスクがあっても、このインフラストラクチャ タイプを使い続ける必要がありますか?

この記事では、クラウドの停止について知っておく必要があるすべてについて説明します .それらの主な原因を概説し、目を見張るような統計を調べ、クラウドのダウンタイムの影響を最小限に抑える方法を示し、近年発生した最も影響の大きい停止について調べます。

クラウド停止とは

クラウドの停止とは、エンド ユーザーがクラウド プロバイダーのサービスを利用できない期間です。ベンダーのインフラストラクチャが (バグ、停電などにより) ダウンし、プロバイダーが問題を解決するまで、クライアントはクラウドベースの資産にアクセスできなくなります。

影響に関しては、オンサイトのデータ センターのダウンとクラウドの停止に違いはありません。どちらの場合も IT 資産にアクセスできなくなりますが、クラウド コンピューティングへの無干渉アプローチには、いくつかの固有の考慮事項が追加されます。

ローカル ハードウェアと同様に、次の 2 種類の停止の可能性があります。

最近の調査によると、計画外の停止は、計画されたダウンタイム (オンプレミスとクラウドの両方) よりも 35% 高いコストがかかることが明らかになりました。価格の差が生じるのは、予期しないインシデントの特定と修正に時間がかかるためです。停止が長引けば長引くほど、被害は大きくなります。

オンサイト ハードウェアと比較して、クラウドベースのインフラストラクチャは、ダウンタイムが頻繁に発生しますが、深刻度は低くなります。 . 100% のアップタイムを提供するホスティング システムはないため、クライアントは、クラウド コンピューティングの利点と引き換えに、時折の停止を許容する準備ができています。この意欲は市場の成長にも表れています。クラウドは、2024 年には全世界の IT 支出の 14.2% を占めるようになります (2020 年の 9.1% から増加)。

クラウド停止の原因

クラウドの停止は、プロバイダーの制御範囲内外のさまざまな原因によって発生します。最も一般的なもののリストは次のとおりです:

クラウドがダウンするとどうなりますか?

最良のシナリオでは、クラウドの停止は数分しか続かず、少数のユーザーまたはサービスに影響を与えます。最悪の場合、サービス停止によりクライアントのビジネスが半日以上麻痺します。企業はすべてのクラウドベースの資産へのアクセスを失い、停止が終わるまで切断されたままになります。

脅威ではありますが、2021 年の深刻なサービス停止の「わずか」7% の原因は、サードパーティ プロバイダによるミスでした .重大な停止には、次の 1 つ (または複数) が含まれる必要があります:

差し迫った懸念事項は他にもありますが (下のドーナツ チャートに示すように)、1 分間のダウンタイムの平均コストは 5,600 ドルであることを覚えておいてください。 (この 1 分あたりの数字は、企業では 9,000 ドルになります)。準備ができていない場合 (つまり、データのバックアップや災害復旧などがない場合)、クラウドの停止によってサービスが停止し、収益に大きな打撃を与える可能性があります。

運用の小さなセグメントをクラウドに保持している企業は、停止の影響を受けにくくなります。たとえば、メールをクラウドでのみホストしている場合、1 日中停止しても大惨事にはなりません。インシデントが発生するのを待つか、機能を制限したアプリを実行することができます。これは、クラウドを使用して IoT プラットフォームを実行したり、支払い処理を実行したりする場合には機能しない戦略です。

場合によっては、クラウドの停止によってデータが永久に失われることがあります (失われるデータの量は、バックアップの頻度によって異なります)。また、厳格な業界のクライアントは、停止がデータ侵害や漏えいにつながる場合、法的罰金の責任を負います。そのため、クラウド ストレージに保持するものを決定する際には注意してください。

ユーザーができること

クラウド停止の影響を軽減するために企業が行っていることは次のとおりです。

最近の最大のクラウド停止

クラウドを使用する場合、クラウドの停止は避けられず、最も人気のあるプロバイダー (Azure、AWS、Google Cloud など) でさえ、ダウンタイムの影響を受けません。最近の歴史の中で最も重大なクラウド障害のいくつかを見てみましょう.

Azure の停止 (2021 年 10 月)

2021 年 10 月、Microsoft Azure は混乱に見舞われ、仮想マシン サービスが 6 時間停止しました .停止中、多くのユーザーは新しい VM をデプロイしたり、拡張機能を更新したりできませんでした。基本的なサービス管理操作 (開始、作成、削除など) もエラーにつながりました。

クラウドの停止の原因は、VM クエリがアーティファクトの必要なバージョン データを取得できなかったことです。復旧後のレポートでは、Microsoft が VM アーキテクチャの 1 つを移行したときに、ソフトウェア ベースのミスが発生したことが明らかになりました。

Google Cloud の停止(2021 年 11 月)

Google Cloud が約 2 時間ダウンしました 昨年の 11 月中旬に、次のような影響を受けました:

影響を受けた Web サイトでは、訪問者がアクセスしようとすると 404 エラーが表示されました。 Google は、クラウドの停止の原因は、負荷分散を担当するネットワーク構成の不具合であると報告しました。

AWS の停止 (2021 年 12 月)

AWS の主力施設の 1 つで、大規模な接続アクティビティの急増がネットワーク デバイスを圧倒し、さまざまなウェブサイトやアプリに影響を与えました。最も注目すべき「犠牲者」は次のとおりです。

データセンターの問題により、内部 AWS ネットワーク内で深刻な遅延が発生しました。お客様のアプリは波及効果を感じ、約 7 時間 トラフィックの遅延や完全なシャットダウンに見舞われました .

その後 2 回の IBM 停止 (2022 年 1 月)

IBM のインフラストラクチャの問題により、ダラス地域のクラウド サービスが 5 時間以上影響を受けました .社内チームが問題を解決しましたが、誤って仮想プライベート クラウドでさらに 1 時間に及ぶ問題が発生しました。二次的な問題は、米国、日本、カナダ、ドイツを含む世界中のユーザーに影響を与えました。

AWS/Slack の停止 (2022 年 2 月)

Slack は 2 月に AWS クラウド リソースの停止に見舞われ、5 時間 通信プラットフォームの通常の使用が妨げられました .報告された 11,000 人を超えるユーザーは、次のことができませんでした:

Slack のチームは、クラウドの停止の背後にある理由を決して共有せず、影響を受けたすべてのユーザーにアプリを再起動し、回復後にキャッシュをクリアするように要求しました.

iCloud の停止 (2022 年 3 月)

15 の主要な Apple サービスが 4 時間ダウンしました 3 月に次のようなクラウド障害が発生しました:

Apple の企業および小売システムもダウンしました。同社は後に、根本的な原因が同社のドメイン ネーム システム (DNS) に関連する問題であることを明らかにしました。

Google Cloud の停止(2022 年 3 月)

2022 年 3 月 8 日、Google Cloud のユーザーに 2 時間半のサービス エラーが発生しました . Spotify と Discord は、サービス停止の影響を受けました。

構成を処理するための Traffic Director コードの変更により、エラーが発生しました。復旧後のレポートによると、不適切なコードの変更により構成データ形式の移行が無視されたため、プラットフォームはユーザーのプログラミングをうっかり削除してしまいました。

アトラシアンの機能停止 (2022 年 4 月)

今年最大の Atlassian サービス停止は 4 月 5 日に始まり、4 月 18 日に終了しました (一部のユーザーは 4 月 8 日までにサービスの復旧を開始しました)。同社は、チームのコミュニケーションが不十分であり、インシデント対応計画が不十分だったために停止が発生したと説明しました.

このクラウド停止は ほぼ 2 週間続きましたが、 一部のユーザーについては、クライアント データが大幅に失われたという報告はありませんでした。ただし、Atlassian の主力製品である Trello と Jira の両方のユーザーがこの問題の影響を受けました。

Microsoft Azure の停止 (2022 年 6 月)

6 月 7 日、Azure のお客様は、米国東部 2 リージョン (主にバージニア) でホストされているリソースに接続できませんでした。停止は約 12 時間続きました ゾーン冗長インフラストラクチャに依存する消費者には影響しませんでした。侵害されたサービスには以下が含まれます:

原因は、ローカル データ センターの 1 つで発生した突然の電力変動で、これによりエア ハンドリング ユニット (AHU) がシャットダウンしました。

Cloudflare の停止 (2022 年 6 月)

6 月、Cloudflare での偶発的な停止により、1 時間半続く大規模な混乱が発生しました 、次のような人気のあるサイトを削除します:

サンフランシスコを拠点とするベンダーは、19 のデータ センターでネットワーク構成が変更されたため、予期しないダウンタイムが発生したと説明しました。

クラウド停止計画の価値を見落とさないでください

近年のクラウド停止の例は、明確なメッセージを伝えています。クラウドは IT のゲームチェンジャーですが、テクノロジーは絶対確実ではありません .エンドユーザーとアプリの可用性を重視する企業は、時折発生するダウンタイムに備える必要があります。そのため、バックアップとディザスター リカバリー (BDR) はクラウドベースのリソースを使用する上で不可欠な要素になります。


クラウドコンピューティング

  1. トランスファーモールディングとは何ですか?どのように機能しますか?
  2. パブリッククラウドのパフォーマンスをベンチマークする方法(および理由)
  3. クラウドセキュリティとは何ですか?なぜそれが必要なのですか?
  4. クラウドとそれがITの世界をどのように変えているか
  5. エージェントレスとエージェントベースのアーキテクチャ:なぜそれが重要なのか?
  6. 難読化されたVPNサーバーとは何ですか?どのように機能しますか
  7. Google Cloud Storageはどのように機能しますか?
  8. トランスミッションとは何ですか?それはどのように機能しますか?
  9. 真空監査を実行する理由と方法
  10. 産業用クラッチとは何ですか?
  11. クレーン検査:いつ、なぜ、そしてどのように?