ad1

2020年9月15日火曜日

vSphere・vSAN 7.0 u1 機能強化・アップデート情報

vSphere を扱っている多くの方は「メジャーバージョンの GA 版はパスして Update1 で」という考えを持っている傾向が強いなと勝手に感じていますが、
2020年3月11日に発表、4月2日に GA された vSphere・vSAN 7.0 から半年経過し 2020年9月15日に 7.0 Update 1 (以下 7.0u1) が発表されました

7.0 GA 時にはvSAN に関しては  File Service など新機能以外にあまりアップデートがありませんでしたが、今回の 7.0u1 では vSphere・vSAN 共に大きな機能強化が発表されました。
本投稿ではそれぞれのアップデートの中で個人的に注目している機能強化をご紹介します。

※ 個人的に気になる機能のみをピックアップしているので各プロダクトの詳細情報は公式ブログも参照願います。
今回の内容です
  • vSphere 7.0 Update 1 の機能強化
    • Tanzu Basic の実装
    • vSphere Clustering Services (vCLS)
    • vSphere Life Cycle Manager の強化
    • vSphere スケーラビリティ
    • vSphere Ideas 連携
    • その他の vSphere 7.0 u1 のアップデート
  • vSAN 7.0 Update 1 の機能強化
    • Cloud Native / Container 向け機能強化
      • vSAN Data Persistence platform (DPp) と vSAN Direct Configuration
    • HCI Mesh (vSAN クラスタ間のデータストア共有)
    • Compression-Only 圧縮のみの容量削減モード
    • Shared Witness Appliance
    • 余剰領域の削減 (Slack Space 必要量の削減)
    • 容量管理の簡素化
    • 継続的な性能改善(vSAN 6.7u3 比で 30% 向上)
    • メンテナンスモード中の耐久性の強化
    • ホスト再起動時の高速化
    • vSAN File Service SMB の実装
    • その他の vSAN 7.0 u1 のアップデート
※ 今回書いていない機能も多数ありますので公式情報をぜひご覧ください。

vSphere 7.0 Update 1 の機能強化

7.0 GA で進化した機能がさらに強化されたのが今回のアップデートの目玉となります。
テーマが三つ。
  • Developer-Ready Infrastructure : 開発者向けのインフラストラクチャ
  • Scale Without Compromise : 妥協のない拡張性向上
  • Simplify Operations : 運用の簡素化

Tanzu Basic の実装

今まで vSphere with Kubernetes のライセンス購入に必須だった VCF への Addon は必須ではなくなり、vSphere Enterprise Plus に Addon が可能になりました。
それに伴い、フルマネージドされた VCF with Tanzu に対して Build Your Own な Kubernetes 環境を可能にする vSphere with Tanzu (Tanzu Basic) が実装されます。
  • VCF with Tanzu
    • VCF 4.0 + vSphere 7.0 で実装された VCF with Kubernetes は VCF with Tanzu に進化
    • 20 以上の k8s Cluster などスケールされる規模での利用
  • vSphere with Tanzu
    • vSphere 7.0u1 からは vSphere with Tanzu でよりシンプルに vSphere with Kubernetes を実装可能に(Tanzu Basic)
    • NSX は必須でなく vDS 7.0 で TKG をサポート (この場合は vSpehre Pod は利用できない)
    • 最大 25 Cluster まで
    • LB も HAProxy などを BYO で用意
※ 色々と Tanzu 関連の機能名称が変わっているので間違いがあるかもしれません。
詳細は別途検証してレポートしたいと思います。

vSphere Clustering Services (vCLS)

個人的にかなり注目の新機能です。
従来 DRS の様に vCenter がコントロールしていた機能は vCenter が停止すると機能も停止しましたが、それらを vCLS Control Plane として vSphere Cluster 上に Photon OS ベースの軽量エージェントを 3 VM クラスタで展開し、
DRS のコントロールを vCenter から切り離して vCLS Control Plane がコントロールする様になります。

DRS などのクラスタリング設定そのものは vCenter から実施しますが、その後の制御は 3 VM が別々のホストに展開され DRS の制御を冗長性を保ちながら運用されますので、vCenter が停止しても DRS は有効となります。



まずは vSphere 7.0u1 では DRS 機能が vCLS で実装され、既存のクラスタをバージョンアップした場合も vCLS はデフォルトで有効となる様です。

vSphere Life Cycle Manager の強化

7.0 GA で実装された vLCM は限られたハードウェアのサポート (Dell と HPE) のみでしたが、今回 Lenovo もサポートに加わり、さらに NSX-T の導入・管理機能が追加されました。
NSX-T の管理は vLCM 7.0u1 以降 + NSX-T 3.1 以降でサポートされ、NSX Manager を経由して vLCM Image Manager から以下の操作が可能になります。
  • NSX コンポーネントのインストール
  • NSX コンポーネントのアップグレード
  • NSX コンポーネントのアンインストール
  • クラスタへの ESXi ホストの追加・削除
  • vLCM が有効なクラスタへの既存ホストの移行
NSX-T の展開は結構面倒なところもあるので、導入後のパッチ適用も一元管理できるようになるのはメリットが大きいし、vSphere with k8s の様に NSX-T 前提のプラットフォームを展開する際にも使いやすくなると期待しています。
Dell、HPE に加えて Lenovo の vSAN Ready Node (ThinkAgile VX series)もサポートされます。


vSphere スケーラビリティ

様々な機能拡張がありますが、今回の大きな変更点は vSphere クラスタの最大ホスト数が 64 台から 96 台に大幅に拡大されました。
※ vSAN クラスタの最大ホスト数は現時点では 64 台のままで、96 台への対応は今後のロードマップとの事。


また、1 クラスタあたり 10,000 VM をサポートする様になりました。

vSphere Ideas 連携

VMware の各製品には Ideas Portal と呼ばれる機能強化リスエストを受け付けるサイト <https://vsphere.ideas.aha.io/>が用意されていますが、今回 vCenter 7.0u1 には vSphere Ideas Portal への Feedback 送信機能が実装されました。

これにより、だれでも気軽に機能強化リクエストやバグ報告を vCenter UI の中から簡単に行うことが出来るようになります。

その他の vSphere 7.0 u1 のアップデート

  • AMD EPYC 7xx2 CPU シリーズ向けセキュリティ機能拡張なども新しく追加されています。
    • AMD SEV (AMD Secure Encrypted Virtualization SEV)
    • AMD Secure Encrypted Virtualization-Encrypted State (SEV-ES)
  • VDDK SDK 7.0.1 Improvements
  • PVRDMA Support For Native Endpoint

vSAN 7.0 Update 1 の機能強化

vSAN 7.0u1 の発表と同時に Design Guide も The Core Tech Zone にて更新・公開されました。

Cloud Native / Container 向け機能強化

vSAN Data Persistence platform (DPp) と vSAN Direct Configuration

大幅に機能が拡張された Cloud Native / Container 向け機能強化は、
vSAN Data Persistence platform (DPp) と呼ばれる Shared Nothing Architecture (SNA) に対応する Storage Orchestration 機能が実装されました。

7.0u1 ではこの vSAN DPp を利用して vSAN Direct Configuration と呼ばれる Cloud Native / Container 向けのパーシステントボリューム機能が提供されます。
vSAN Direct Configuration では従来の vSAN の様に、キャッシュ層 SSD とキャパシティ層ドライブドライブを組み合わせてディスクグループを作る方式ではなく、ドライブ1本1本を VMFS-L でフォーマットし vSAN DPp がパーシステントボリュームとして Container にストレージ領域を提供します(従来の VM などでは利用不可)

※ vSAN DPp および vSAN Direct は vSAN Enterprise エディションで提供されます。


これら機能は現時点の情報では実装の詳細や操作感が分かり難い点があるのでリリース後に確認したいと思います。

HCI Mesh (vSAN クラスタ間のデータストア共有)

HCI Mesh は vSAN クラスタ間でストレージ領域を共有する機能です。
より柔軟なサイジングが可能となり、同一 vCenter - DataCenter 管理下の vSAN クラスタが対象です。
7.0u1 では vSAN クラスタ間でのデータ共有となりますが、今後のロードマップでは 通常の vSphere クラスタから別の vSAN クラスタから切り出した領域を利用できる様になるとのこと。


HCI Mesh の構成制限は、7.0u1 ではクライアントとなる vSAN クラスターは最大 5 つのリモート vSAN データストアをマウントし、
リモート vSAN データストアを提供するサーバークラスタは最大5つのクライアントクラスタにデータストアを提供します。
また、クライアントクラスターとサーバークラスターのホスト数の合計は 64 ホスト以下となる様です。

詳細 Tech Note も公開されました。

こちらも実機検証したらレポート纏めます。

Compression-Only 圧縮のみの容量削減モード

この機能を待っていた人は実は多いのではないかと思う機能の一つです。
従来は重複排除と圧縮がセットで有効化されましたが、vSAN 7.0u1 からは「圧縮のみモード」が可能になり、CPU 利用率を抑え、従来の重複排除・圧縮よりも高いスループットで適度な容量削減が可能になりました。

また、従来の重複排除・圧縮時にはディスクグループ全体で1つの塊として組み込まれるためドライブ追加やドライブ障害時にはディスクグループを一度解除する必要がありましたが、圧縮のみモードの時は通常の vSAN ディスクグループと同じく1本ごとのフォーマットとなるため障害時の影響範囲を最小限にし、柔軟な拡張性を提供します。

Shared Witness Appliance

2 Node vSAN などで利用していた Witness Appliance は従来 2 Node vSAN クラスタ毎に 1 Witness Appliance 必要でしたが、
1つの Witness Appliance で複数の 2Node vSAN Cluster を管理できるようになりました

拠点のシステムを 2Node vSAN で構築し、中央の DC で集中管理している様な場合に大幅に管理対象を減らすことが出来るので ROBO 環境のシステム運用に最適な機能だと思います。

余剰領域の削減 (Slack Space 必要量の削減)

従来 vSAN のデータストアの実効容量のサイジング時にはシステム・メンテナンス用の余剰として 25% ~ 30% の余裕(Slack Space)を持たせてサイジングしていていましたが、Node 数に応じて従来よりも大幅に効率的にサイジング出来るようになりました

予約領域として確保される目安は以下の通り
  • 12 node cluster = ~18%
  • 24 node cluster = ~14%
  • 48 node cluster = ~12%
恐らく先日更新された vSAN Ready Node Sizer にもこのサイジングが実装されるものと思われます。
予約領域にはホスト再構築時用の予約 : Host Rebuild Reserve (failures) と 運用上の予約領域 : Operations Reserve  (operational tasks) が含まれます。

  • 4 node cluster:  10% OR + 25% HRR = Approx 30% total reserved capacity
  • 6 node cluster:  10% OR + 17% HRR = Approx 27% total reserved capacity
  • 8 node cluster:  10% OR + 13% HRR = Approx 23% total reserved capacity
  • 12 node cluster:  10% OR + 8% HRR = Approx 18% total reserved capacity
  • 18 node cluster:  10% OR + 6% HRR = Approx 16% total reserved capacity
  • 24 node cluster:  10% OR + 4% HRR = Approx 14% total reserved capacity
  • 32 node cluster:  10% OR + 3% HRR = Approx 13% total reserved capacity
  • 48 node cluster:  10% OR + 2% HRR = Approx 12% total reserved capacity
  • 64 node cluster:  10% OR + 2% HRR = Approx 12% total reserved capacity
但し、注意点が1点あります。
vSAN 7.0u1 の省スペースな Slack Space に対応するためには、vSAN 7.0 以前の環境で作成された 1オブジェクト (1VMDK) のサイズが 255 GB を超える場合は、vSAN 7.0u1 アップグレード後にオブジェクトの再構築が行われる必要があります。
※ 従来 255GB を超えるオブジェクトは複数のコンポーネントに分割されていましたが、それらの場合に該当します。

詳細は公式ドキュメントの以下を参照ください
※ 2021/02/27 追記
CTO の一人である Cormac Hogan が自身のブログで詳細を解説しておりますので併せて参照願います。

容量管理の簡素化

vSpehre Client 上で表示される vSAN データストアの利用状況の View が進化して、上記ので示した確保している余剰領域( Host Rebuild Reserve / Operations Reserve)を明示的に表示する事が可能になりました。
チェックボックスで後どれくらい余裕があるのかを切り替えられるのが便利そうです。



継続的な性能改善(vSAN 6.7u3 比で 30% 向上)

私自身過去のバージョンから性能検証などを繰り返してきましたが同じハードウェアを利用していてもソフトウェアの改善でストレージ性能が劇的に向上するのが HCI の魅力と感じています(完成されていない、発展途上という見方もあります)。
vSAN 6.7u3 時点でそれ以前より大幅に改善され、7.0 GA でも処理能力が向上していましたが、今回さらに大幅な内部の IO プロセスの最適化が行われたようです。Optane NVMe など高性能 vSAN 環境でどの程度の伸びがあるか楽しみな強化です。
今回は以下の点で強化されているようです。
  • CPU 最適化
    • CPU 利用効率の向上でスケジューラ競合の削減
  • 並列処理の向上
    • コンポーネントマネージャーのスケール
    • 重複排除・圧縮エンジンの内部処理エレベーターからの分離
    • 圧縮 Only モードによるエレベーターの並列化
  • 再同期処理の高速化
    • デルタ書き込み処理によるメンテナンスモード終了の高速化
    • Sequential Write 処理の高速化
  • ネットワークの強化
    • 複数の受信スレッドによるネットワークの競合の削減
    • 受信スレッドの並列化による複数ディスクグループの利用や RAID 5/6 利用時の分散性能を強化

メンテナンスモード中の耐久性の強化

vSAN 7.0u1 クラスタでは "Ensure Accessibility (アクセシビリティの確保) " でメンテナンスモードに入っているホストに代わって、vSAN オブジェクトのレプリカのすべての増分更新データを別のホストに書き込むことができるようなります。
これによりメンテナンス中に低下したデータ冗長性を補う形となり、メンテナンスモードでシャットダウンされたホスト以外に障害が起きた際も、更新データをデータロストせずにメンテナンスモードから戻ったホストのオリジナルデータと合わせて迅速に復旧することが可能になります。

ホスト再起動時の高速化

vSAN クラスタのホストを再起動するとキャッシュ層ドライブからデータを読み込みメモリ上のメタデータを再構成する必要があり起動完了までに非常に時間がかかっていました。
これはメモリ上のキャッシュ層データのメタデータの再構成をしていたためですが、vSAN 7.0u1 では再起動処理の際にメモリ上のメタデータをドライブに退避し、再起動時に速やかに読み込む方式を実装しました。
vSAN を利用していない従来の ESXi と同等程度の再起動時間になるとの事で、クラスタのローリングアップグレード時など全体のメンテナンスウィンドウの削減に寄与しそうです。

vSAN File Service SMB の実装

7.0 GA で実装された NFS に加えて、SMB v2.1 and v3、Kerberos for NFS、Active Directory for SMB などの機能が追加されました。
また、File Service を有効にしたクラスタのホスト台数も 32 台までサポートが広がります。

詳細 Tech Note も公開されました。

これも大幅に機能が拡張されているので要検証で別途レポート纏めたいと思います。

その他の vSAN 7.0 u1 のアップデート

    • Stretched Cluster 向けの L3 跨ぎの vSAN ネットワークの UI 設定
      • vSAN Kernel の L3 ルーティング設定も vSphere Client UI から設定が個別にできるようになったため、Stretched Cluster や 今回実装された HCI Mesh でのクラスタ間通信の設定が楽になりました。
    • 転送中データの暗号化
      • 従来のデータ暗号化とは別に vSAN Kernel が行うホスト間のデータ転送を FIPS 140-2 相当の暗号化で実装されます(鍵管理にKMSサーバーを必要としないのも便利)
    • 廃棄ドライブの簡単なデータ抹消機能
      • PowerCLI (Wipe-Disk コマンドなど)や API を利用してクラスタから取り除くドライブのデータを安全に抹消する事が可能になります

    その他、様々な機能改善が盛りだくさんで、Cloud Native な新しいアーキテクチャに対応しつつ、従来のインフラ・プラットフォームとして着実に進化している様です。

    0 件のコメント:

    コメントを投稿

    過去30日でアクセスの多い投稿