Azure VMの冗長性の考え方について書く
1、プレミアムストレージ以上(単一のVM)
一番左側の単一のVMはVMwareの世界からみるとvSphereHA的なやつ
物理障害時に別ホストで起動
用語的には自動復旧というらしい 通常15分以内に復旧 HAだと5分ぐらいといってるけどまあ共用だしVMの数も多いしということかもしれない
ディスクの種類によってSLAが違うので注意
Standard HDD SLA 95%
Standard SSD SLA 99.5%
Premium/Ultra SSD 99.9%
2、可用性セット
これはDRSアフィニティルール的なやつで複数VMを別ホストで配置するようなやつ
VM の論理グループを可用性セットというらしい
ラックレベルでの障害対策で下記の2つを意識して配置される
・障害ドメイン
単一障害点、電源やSW等を共有するグループ
ラック単位で0、1、2という感じで分けられて配置されるってことか
かなり大規模じゃない限りホストわけてDRSのルールを入れてるお客さんいない気がするなぁ・・・
・更新ドメイン
メンテナンス時に同時に再起動されるホストグループ
異なるドメインに所属していれば仮想マシンは同時にメンテナンスされない
物理ホストのアップデート時に同時にアップデートされないことを保証するためにあるようだ
VMwareの世界だと基本は1ホストずつがベースでホストが大量にある場合メンテナンスモードで
同時にやったりするのでそれを自動でやるためにこういう風に管理されてるのね
障害ドメイン(FD)と更新ドメイン(UD)でわかりやすい図がMSコミュニティにあった
注意点としては可用性セットはVM作成時のみらしく
作成後に実装しようとすると不可能ではないが工夫が必要らしい
たとえば、ディスクのみバックアップからリストアしてVM新規作成するとか、ディスクを残したままVMを削除して新規作成とか・・・
VMwareだとこのあたりは関係なく後々DRS設定できるよね
3、可用性ゾーン
DCレベルでの障害対策、日本だと現状東日本のみ
これは勘違いしがちなのだがサブスクリプションでゾーン場所は一致してないらしい
例えばAユーザのゾーン1とBユーザのゾーン1は違う場所らしい
まじかー知らんかったな・・
また、ゾーン間で配置するとレイテンシの影響があるのでHANAやHPC等のシステムは
ゾーンを固めて配置するという考えが一般的らしい
これはVMwareの世界だと難しいがvSANストレッチクラスタ的なやつが一番近いかも!?
それか、となりの建屋とストレージレプリケーションしてるような感じ
VMwareの世界だとほんとほぼない気がする。。。
1 つのデータセンターで障害が発生してもアプリケーションとデータを保護することができます。 1 つのゾーンが侵害された場合、レプリケートされたアプリとデータが別のゾーンですぐに利用可能になります。
SRMやVRやストレージレベルでの非同期レプリケーションが主なのでこれはすごいな。。。
まあDC障害ってのがめったに起きないけど・・・
・近接配置グループ(PPG)
これはゾーンを固定したとしても将来的には同じゾーンでも複数DCにまたがる可能性があるため
可能な限り近くに配置して低レイテンシを実現するための設定のようだ
VM を単一リージョンに配置すると、インスタンス間の物理的な距離が短縮されます。 また、単一可用性ゾーンに配置した場合も、それらの物理的な位置は近くなります。 ただし、Azure の占有領域が拡大するにつれ、単一可用性ゾーンが複数の物理的なデータ センターにまたがる可能性があるため、ネットワーク待ち時間がアプリケーションに影響を与えることがあります。
各 VM をできるだけ近くに配置して、可能性のある最も短い待ち時間を実現するには、それらを近接通信配置グループ内にデプロイするようにしてください。
・PPGリファレンスアーキテクチャ
非推奨の構成もあるのでこのへんは注意か・・
・ピン留め
これはリソースを特定のDCへ固定することができるらしいのだが公式DOCにはほとんど記述がない・・・
・HAクラスタ
Azureでも共有ディスクの機能があるためオンプレでやっていたような
HA構成、VMwareでやるようなMSFCとかできるらしい
・Clusterpro NECさんのページ
・lifekeeper/datakeeper WSFC等 SIOSさんのページ
SAPHANAが参考になるかも
結構VMだけで深いな・・・
コメント