vSan – Design des disk groups vSan – part 2

Le design des disk groups doit être minutieusement étudié avant la mise en place d’un cluster vSan, . Dans cet article, nous allons découvrir quelles sont les considérations à prendre en compte pour définir le cache et le stockage capacitif d’un cluster vSan. Nous donnerons un exemple de sizing et quelques explications sur le choix des composants.

disk groups vsan

Ci-dessus la représentation du design vSan d’un hôte ESXi composé de 2 disques locaux en RAID1 pour l’installation du système ESXi et 2 disk groups pour vSan. A noter que les disques locaux pour l’installation du système ESXi peuvent être remplacés par des cartes SSD ou une clé USB.

Considération pour le cache

En configuration hybride de vSan, l’algorithme de cache utilise 70% de la capacité des disques flash en lecture afin d’y stocker les blocs fréquemment lus et minimiser ainsi les temps d’accès aux disques mécaniques. Les 30% restant de la capacité sont utilisé en tampon d’écriture.

En configuration All Flash de vSan, l’algorithme de cache utilise 100% de la capacité des disques flash ‘Write Intensive’ en écriture et les lectures se font directement sur les disques flash capacitifs.

Les disques utilisés pour le cache supportent des écritures intensives et ont une durée de vie exprimée en TBW (Terabytes Written) par VMware ou en DWDP (Drive Writes Per Day) par les constructeurs. En vSan 6, la taille maximale d’un disque de cache utilisé dans les disk groups est de 600GB.

Le disque de cache en lecture:

Permet de réduire la latence lors d’opérations de lecture (read cache hit). Les blocs récemment demandés sont remontés directement depuis les disques de cache ou des disques capacitifs en version All Flash. Lors de l’utilisation d’une politique FTT, vSan divise à part égale les opérations de lecture des blocs en cache entre les disques de cache contenant les réplicas d’objet ou entre les disques capacitifs SSD en version All Flash. (non appliqué en streched cluster car ce mode gère la Read Data Locality).

Le disque de cache en écriture:

Permet d’utiliser des disques flash comme tampon d’écriture non volatile avant de descendre l’information sur les disques capacitifs. Lors d’une écriture en cache, vSan s’assure en fonction de la politique FTT appliquée, qu’au moins une copie de la donnée écrite est dupliquée sur les disques de cache des hôtes hébergeant le réplica des objets de la VM. En cas de panne d’un hôte, les VMs utilisent une copie des données préservées sur les disques de cache et capacitif des autres hôtes du cluster.

VMware recommande comme base de départ une taille de cache correspondant à 10% de la capacité de stockage consommé prévisionnelle au sein du cluster avant la mise en place de la politique FTT (NumberOfFailuresToTolerate).

Exemple de calcul de la capacité de cache nécessaire à un cluster vSan permettant d’accueillir 500 VM avec une évolution vers 700 VM :

Requirements Valeur estimée (Thin) Valeur avec évolution (thin)
Nombre d’hôte vSan 8 8
Capacité moyenne de stockage par VM (avec mémoire) 50GB 50GB
Nombre total de VM actuel 500 VM 500 VM
Prévision du nombre total de VM 700 VM
Prévision de la capacité totale consommée 50GB x 500 = 25 000GB 50GB x 700 = 35 000GB
% de flash recommandé 10% 10%
Capacité totale de stockage flash requise 25 000 x 0,1 = 2 500GB 35 000 x 0,1 = 3 500GB
Capacité flash requise par hôte vSan 2 500 / 8 = 312GB 3 500 / 8 = 437GB
Capacité totale brut SSD nécessaire par node >= 400GB >= 500GB
Capacité totale brut SSD nécessaire pour le cluster >= 8 x 400GB (3 200GB) >= 8 x 500GB (4 800GB)
50GB = Taille moyenne d’une VM. Valeur calculée d’après un export de la volumétrie totale consommée sur les LUN en thin d’une baie sans déduplication ni compression divisé par le nombre de VM.

Valeur estimée (Thin) = Volumétrie nécessaire pour les besoins actuels (500VM)

Valeur avec évolution (Thin) = Volumétrie nécessaire pour les besoins actuels avec une marge d’évolution (700 VM)

En version 6.2, vSan introduit la fonctionnalité Client Cache qui améliore les performances en lecture. Cette fonction exploite 0,4% la mémoire RAM locale de la machine virtuelle comme cache en lecture dans la limite 1GB par hôte ESXi.

Considération pour le stockage capacitif

Les disques mécaniques dans une configuration vSan hybride et les disques SSD dans une configuration vSan All-flash apportent de la capacité de stockage et permettent de répondre aux politiques de répartition de données (NumberOfDiskStripesPerObject).

Chaque disque capacitif est identifié par un UUID (Universal Unique Identifier) permettant à vSan de répondre aux exigences des politiques de tolérance de panne.

Exemple de calcul de la capacité utile d’un cluster vSan permettant d’accueillir une capacité de stockage de ~35To (sans dédup no compression):

Requirements Valeur
Nombre d’hôtes vSan 8
Nombre de disk groups par hôte 2
Nombre de disques capacitifs par disk group 6
Nombre de disques capacitifs total par hôte 12
Capacité d’un disque 1 200GB
Capacité d’un disk group 7 200GB
Capacité des disk groups par hôte 14 400GB
Capacité totale brute des disk groups 115 200GB
Politique FTT 1
Capacité totale brute des disk groups après FTT 57 600GB
Espace libre recommandé pour vSan en % 30% de 57 600GB
Espace libre recommandé en GB 17 280GB
Capacité utile 40 320GB
Chaque disk group doit si possible, être attaché à une carte contrôleur dédiée. Un disk group étant considéré comme un domaine de panne, le choix de 2 disk groups ou plus, un par carte contrôleur permet de pallier à la panne d’une des cartes et évite d’impacter l’ensemble du stockage d’un hôte. Il n’est pas toujours possible de dédier une carte par disk group, dans ce cas il convient d’équilibrer les disk groups entre les cartes controleurs RAID afin d’éviter les déséquilibres I/O.

De plus, cela permet d’atteindre de meilleures performances. Les critères de choix des cartes contrôleurs doivent être la taille de la file d’attente (Queue Depth) pour répondre aux traitements intensifs d’I/O et la fonctionnalité Pass-Through permettant de présenter directement les disques physiques à vSan. Le Pass-Through permet de déporter la gestion du RAID sur vSan et il n’est donc pas nécessaire d’ajouter une couche intermédiaire gérée par la carte contrôleur.

Le Pass-Through évite des actions manuelles supplémentaires lors du remplacement d’un disque défectueux comme la reconstruction d’un RAID 0 plutôt que de simplement rebrancher un nouveau disque et laisser vSan gérer le remplacement.

Vmware recommande de désactiver le cache des cartes contrôleurs car la gestion du cache est gérée par vSan. Si la carte ne le permet pas, le cache sera défini à 100% en lecture.

Vmware recommande aussi de désactiver les fonctionnalités telles que Smart Path sur les cartes HP.

Limitation des disk groups vSan:

  • Un maximum de 7 disques par disk group (hors disque de cache).
  • Un maximum de 1 disque flash par disk group.
  • Un maximum de 5 disk group par hôte participant à un cluster vSan.
  • Un maximum de 35 disques capactifis et 5 disques flash (SSD ou PCIe) par hôte.

Ne pas oublier que plus la taille des disques flash et capacitifs est grande, plus la quantité de données à reconstruire en cas de panne et le trafic généré par une reconstruction est élevé. Ceci peut impacter la performance des VMs avec une probabilité de panne pendant cette période.

Vmware recommande de laisser 30% de capacité de stockage libre sur un cluster vSan. La raison vient du fait que vSan rééquilibre automatiquement les données (objets ou composants d’objets) lorsqu’un disque atteint 80% d’espace utilisée. En cas de dépassement, vSan utilisera plus de cycles CPU et de bande passante pour maintenir un équilibre et permettre une distribution uniforme des composants et objets sur tous les disques du cluster. Cette situation peut être provoquée par une panne ou une maintenance lorsqu’un cluster est déjà bien chargé.

 

twitterlinkedin
Publié dans Stockage, Virtualisation, Vmware vSphere Tagués avec : , , , , , , ,

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

*