Introduction à la virtualisation du stockage

Au fur et à mesure que le service évolue, il devient de plus en plus difficile de gérer le stockage et ses nombreuses évolutions, tant au niveau de l’espace que des périphériques. La virtualisation du stockage en réseau permet d’avoir une vision homogène de ressources hétérogènes (baies de disques / NAS) dispersées sur un SAN. Elle apporte des fonctionnalités intéressantes de copie et de réplication indépendamment des périphériques de stockage utilisés et de leur constructeur.

Concept 

La meilleure définition de la virtualisation est probablement l’abstraction du stockage logique par rapport au stockage physique. La virtualisation du stockage est obtenue en isolant les données de leur localisation physique. La couche de virtualisation présente un espace de stockage logique et s’occupe de faire le lien avec l’emplacement actuel des données : l’address space remapping. L’outil de virtualisation est alors responsable de la gestion d’une table contenant l’ensemble des mappings appelée meta-data. Ainsi, les requêtes d’entrées / sorties sont redirigées en fonction de celle-ci. Les serveurs n’ont plus besoin de savoir où sont leurs données.

Fonctionnalités

La gestion des espaces de stockage est organisée autour de notions de pool. L’ensemble des périphériques de stockage sont agrégés comme un espace unique qui peut être distribué aux serveurs connectés au réseau SAN. Les volumes affectés peuvent être redimensionnés à la demande ou automatiquement à l’aide de fonctionnalités de thin-provisionning qui permettent d’allouer l’espace disque physique au besoin. Des fonctionnalités de réplication de données, de snapshots, clones et copie complètent les diverses solutions du marché.

Objectifs

Les objectifs et bénéfices sont nombreux. Un des intérêts majeur souvent à l’origine d’un projet de virtualisation du stockage est la capacité de ce type d’outil de migrer des données de manière transparente d’un périphérique à un autre. Quoi de plus pénalisant que la copie d’un volume important de données lors de migration d’une baie de disques vers une autre durant un renouvellement de matériel ? L’autre avantage est de disposer d’une vision et d’une gestion centralisée du stockage. Il est aussi possible d’améliorer le taux d’utilisation de l’espace de stockage grâce aux fonctions de pooling, de migration et de provisionning qui ne sont plus limités à un périphérique particulier mais s’applique à l’ensemble des ressources de stockage disponibles. Ceci permet aussi de limiter les coûts lors de l’acquisition de matériel de stockage qui sont encore malheureusement très liés aux licences (type et nombre de serveurs connectés à une baie de disque, réplication, snapshot, etc.).

Architecture in-band / out-band

L’implémentation peut être réalisée au niveau de l’hôte, du réseau ou encore du système de stockage.

L’architecture in-band consiste à intercaler un périphérique entre les serveurs et les données. Le principal avantage et inconvénient est que toutes les données transitent par le moteur de virtualisation. Il s’apparente généralement à une appliance / serveur dédié ou est directement intégré aux commutateurs SAN. Ainsi, il peut apparaître comme un goulet d’étranglement ou un SPOF (Single Point Of Failure). Cependant, on peut généralement lui octroyer une quantité importante de cache afin d’améliorer les performances d’accès aux baies de disques sous-jacentes et l’installer en cluster.

En mode out-band, les requêtes et les flux transitent directement entre les serveurs et les baies. Des agents sont installés directement sur les serveurs. Ce mode semble bien plus évolutif mais constitue un élément qui doit être maintenu avec le système d’exploitation, chose pas toujours aisée.

Quel avenir ? 

Cependant, les solutions existent sur le marché mais certains risques ralentissent l’adoption de ces technologies :

  • Ces solutions complexifient encore un peu davantage le système et donc son administration
  • Le support et l’interopérabilité avec les systèmes d’exploitation serveur et les périphériques de stockage peuvent être un facteur limitant voire bloquant
  • Le retour à une implémentation traditionnelle n’est pas toujours chose aisée
  • La performance
  • La flexibilité

La virtualisation du stockage affecte aussi la reprise d’activité. Dans beaucoup de cas, la réplication, et plus particulièrement la réplication à distance, est réalisée entre baies d’un même constructeur, voire des baies identiques. Les données répliquées sont strictement identiques à la baie principale. En virtualisant le stockage, les données peuvent être répliquées sur un matériel différent sur le site de reprise. C’est un avantage important car on peut imaginer réutiliser des baies de disques en fin de vie sur un site secondaire de réplication.

Voici quelques exemples de produits permettant de virtualiser le stockage :

Autres articles sur le même sujet

Laisser un commentaire