TOP

2018年6月20日 | テクノロジー

米スターバックス、従業員の再教育のために23,000万台のiPadを導入へ

2018年6月20日に米スターバックスが、従業員の再教育ためにAppleの「iPad」を23,000万台も購入していたことが明らかとなりまし...

2018年6月20日 | テクノロジー

Apple、2018年モデルiPhone向けにディスプレイを発注開始!-売れ筋はiPhone X Plusか

2018年6月20日にAppleが、2018年モデルのiPhone向けにディスプレイの発注を開始したことが明らかとなりました。 &nb...

2018年6月19日 | テクノロジー

Twitter、Apple Watch向けに公式アプリ「Chirp for Twitter」をリリース!

2018年6月19日にTwitterが、Appleのウェアラブルデバイス「Apple Watch」向けに公式アプリ「Chirp for Tw...

2018年6月19日 | テクノロジー

iPhone SE 2の販売日は2019年になるかもしれない-3モデルの保護フィルムがリーク

2018年6月19日にAppleから販売が噂されている「iPhone SE」の後継機「iPhone SE 2(アイフォンエスイー2)」の販売...

2018年6月18日 | テクノロジー

Apple、オリジナル番組作成のため、大物司会者オプラ・ウィンフリー氏と数年契約を結ぶ

2018年6月18日にAppleが、「Apple TV」などのコンテンツ向け自社製番組のために、大物司会者を数年契約で締結したことが明らかと...

2018年6月18日 | テクノロジー

Apple、Macシリーズのハードウェアアップデートに大きな問題を抱えている

2018年6月18日にAppleが、Macシリーズにてハードウェアアップデートに大きな課題を生じていることが明らかとなりました。 &n...

2017年3月3日

Amazon、入力ミスによりAWSの大規模障害へ

米国時間2017年3月1日にAmazonは、同社のWebサービスである「Amazon Web Service (AWS)」が2月28日に数時間に渡って、米国東部(US-EAST-1)リージョンにおけるストレージシステム(Amazon S3)にて大規模なシステム障害があったことを発表致しました。

 

 

  • https://aws.amazon.com/jp/message/41926/

 

 

AWSのレポート

AWSは、今回のレポートにて以下のようにコメントしている。

 

 

 

 

 

Amazon S3チームは、S3の課金システムの動作が遅いという問題の原因の修復作業を行っておりました。

太平洋標準時間午前9時37分、権限を有するS3チームメンバーの1人が、S3の課金プロセスによって使用されている、S3サブシステム用のサーバの一部を切り離すために、確立された手順に従ってあるコマンドを実行しました。

このコマンドに引き渡す入力の1つが誤っており、想定していたよりも多くのサーバを切り離してしまった。

 

 

 

 

今回の入力ミスによって、US-EAST-1(米国東部:バージニア北部)リージョン(Amazonで最も古くから稼働している数多くのデータセンターを抱えるリージョン)における、すべてのストレージシステム(Amazon S3)が必要とする2つのサブシステムが停止しました。

 

 

 

 

この障害によりシステムの再起動が必要になり、再起動後も動作チェックなどを行ったことから復旧までに数時間かかってしまったようだ。

 

 

 

 

 

これに対しAWSは、「予想以上の時間がかかった」とレポートに記載しております。

 

 

 

 

障害の内容

障害復旧のために、2つのサブシステムを再起動が必要になっている間、S3はサービス要求を処理することができなかったようだ。

 

 

 

 

また、同じリージョンで、ストレージとしてS3と連携していた他のAWSも同様に影響を受けていたようだ。

 

 

 

 

なおAWSは、影響の受けなったサービスは以下のとおりとなる。

 

 

 

 

  1. Amazon S3コンソール
  2. Amazon Elastic Compute Cloud
  3. Amazon Elastic Block Store
  4. AWS Lambda

 

 

 

AWSの復旧時間

AWSによると、太平洋標準時間午後1時18分に完全にインデックスサブシステムを復旧し、プレイスメントサブシステムは午後1時54分に復旧したと報告している。

 

 

 

 

 

AWSは、再発防止策として誤った入力を防ぐ処置も含めてツール修正などの「複数の変更」を実施することを宣言している。

 

 

 

 

この他にも、インデックスサブシステムの操作を簡略化するために、操作を小分けにする対策も発表しており、すでにに着手しているようだ。

 

 

 

 

またAWSは、「AWS Service Health Dashboard」の管理コンソールに変更を加えて、AWSの複数リージョンをまたがって稼働する機能も追加するようだ。

 

 

 

 

なお2月28日の障害では、ダッシュボードにも影響が及んだため、AWSは問題に関する情報を顧客に随時伝える手段がないことから、Twitterを利用して連絡するしかなかったようだ。

 

 

 

 

出典元:AWS

 

 

0

スポンサーリンク

あなたにおすすめの記事

この記事が気に入ったら
いいね!しよう

最新情報をお届けします

こちらの記事もおすすめ

         

カテゴリ

タグ

お気軽にお書きください

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

日本語が含まれない投稿は無視されますのでご注意ください。(スパム対策)