AWSでシステム運用1年。経験して気が付いた勘所

AmazonWebServices(AWS)でEC2 ELB RDS S3 Route53などを組み合わせたWebシステムを運用しています

規模としては小規模ではありますが、EC2は20インスタンス弱 ELBはパブリック側に3つそれぞれサブドメイン割り当てていて、 RDSは2インスタンス(Single) という構成です。

AWSはパブリッククラウドではリーダー的存在で他社と比べると機能規模は桁違いと言われます。ただ私は同じアーキテクチャーで仮想マシンを動かすことに若干の不安があります。論理的には別でもハードウェアが同じだったり束ねられているハードウェアが異なっていたり、ストレージの可用性を担保する術は世界共通だったり、これが意味するものはAWS全体の機能停止ないし一部停止が全体に波及するということ先日は管理コンソールに接続できない事象がありました。

もちろん、AWSは良い面も多い柔軟で拡張性が高いのでサイジングは必要ない必要になった時必要なだけリソースを割り当てることができる。

これまでの1年間AWSにてシステム運用してEC2インスタンスが稼働する物理サーバ障害が2回。サービスは停止したが代替のインスタンスを10分程度で復旧させる事が出来たのでダウンタイムは少なかった。これオンプレの環境で運用していたら、どうだったのでしょうか？

もしかしたら、障害は発生しなかったかもしれませんいやいや障害発生し現地対応が必要だったかもしれません。こればっかりは分かりません。しかし確実に言えることは「AWS(クラウド)でも障害は発生し、その対処は自分達で行う必要がある」と言うことです。

それから作りにもよりますが、これまでオンプレの同等スペックで稼働していたサーバやDBが同じようなパフォーマンスが出ない事もある。そしてクラウドサービス特有の制約を常に意識した構成が必要になる。

と、言わせていただきました

つまらない投稿ですいません