Stockage sans interruption, pour de bon

Lancée officiellement aujourd’hui, la nouvelle version 8.2 de Clustered Data ONTAP (cDOT 8.2) de NetApp a notamment fait du «sans-arrêt de service» ou NDO l’un de ses trois pilliers stratégiques (les deux autres étant l’efficacité et la scalabilité «sans coutures»). L’upgrade de contrôleur sans copie de données et sans aucune interruption de service est, à mon avis, un véritable différentiateur, et il me semblait intéressant de vous détailler pourquoi.

Un peu de contexte, tout d’abord. Dans un billet de blog, NetApp écrivait fin Mai que 88 % des early adopters de Clustered Data ONTAP interrogés par la société considéraient le fonctionnement «sans interruption» comme un principal facteur de différenciation pour une plate-forme de stockage. Les opérations sans arrêt de service (NDO) étaient même considérées comme un avantage pour leur business.
Notons que les clients interrogés n’étaient pas que des grands comptes, et étaient issus de tous types d’industries.

Et je ne suis pas étonné ! C’est exactement ce que je retrouve sur le terrain. Les DSI aujourd’hui le savent très bien : tout doit être disponible immédiatement, tout le temps. Il n’y a plus de plage horaire de «repos». Le système d’information et par extension, le stockage, sont constamment sollicités.
Bref aujourd’hui, dans le cycle de vie des données, il n’y a plus de place pour l’indisponibilité.

Une interruption peut coûter cher
Car un arrêt de service peut coûter cher. Les exemples mentionnés dans le billet cité plus haut sont éloquents : un fournisseur de service, avec des milliers de clients qui doit, à chaque interruption de service nécessaire, contacter chaque entreprise cliente individuellement pour coordonner une fenêtre de temps d’arrêt; un autre, dans le domaine de l’énergie, qui a perdu près d’un million de dollars pour seulement 15 minutes de temps d’arrêt…

Je vous l’accorde néanmoins, le «sans-arrêt» n’est pas une idée nouvelle. Qui n’a pas eu le besoin de migrer massivement ses données à un moment où un autre ? Qui n’a pas forcément anticipé l’évolution des besoins en stockage, et n’a pas, un jour où l’autre, dû ajouter des disques, des baies, voire carrément changer de baie ?
Le changement de disques ou de contrôleurs «à chaud» est depuis longtemps considéré comme une fonctionnalité importante.

Stockage vraiment sans-arrêt, une utopie ?
Jusqu’il y a peu, il n’y avait vraiment pas le choix. Etre véritablement sans interruption était une utopie. Lors d’un «swap», les temps d’arrêts sont en effet un mal nécessaire, qu’il faut savoir gérer. L’utilisateur n’y voit d’ailleurs souvent que du feu. Mais côté IT, c’est une opération délicate. Avant de retirer les contrôleurs, on est en effet souvent obligé de transférer les données sur des disques qui n’appartiennent pas à ces contrôleurs, pour pouvoir les changer.
Mais les technologies évoluent, comme le montre la nouvelle mouture 8.2 de cDOT.

Ce n’est donc plus impossible : aujourd’hui, la donnée reste en place, quoi qu’il arrive. C’est là toute la beauté du stockage «scale-out» , où tout est intégré.

Et cela ouvre réellement de nouvelles portes.

Le NDO de NetApp en détail
En cette journée de lancement, j’ai demandé à Jean-François Marie, Systems Engineer Manager chez NetApp, de nous en dire un peu plus sur ce NDO, et en quoi il se différencie de la concurrence. Voici sa réponse :

« En pratique, la continuité des opérations peut être impactée par plusieurs facteurs :

  • Une mise à jour logicielle ou firmware : Dans un sens il est toujours facile de faire une mise à jour à chaud, mais que se passe-t-il si la montée de version est un échec ? NetApp a résolu ce point depuis déjà longtemps : c’est le ‘rollback’ qui permet de revenir une version en arrière.
  • Ajout de disques : Cela semble simple mais pourtant toutes les offres du marché ne supporte pas cette fonction indispensable. Il faut aussi noter que le simple fait d’ajouter des disques n’est pas intéressant si il n’est pas possible d’agrandir les espaces dynamiquement. NetApp continue de proposer une extension de ses grappes RAID à chaud et ce sans reconstruction et donc sans aucun impact sur les utilisateurs.
  • Ajout de contrôleurs : c’est une caractéristique des systèmes de stockage dits high-end ou scale-out. Nous nous classons dans cette seconde catégorie. Maintenant tout le monde ne propose pas cette fonction sans arrêt de service. C’est une des caractéristiques principales du scale-out. Il faut évidemment voir les effets liés à cette fonction. En effet, sur certains systèmes, un ajout de composants de puissance implique une redistribution des données, ce qui n’est pas sans impact sur les temps de service aux utilisateurs.
  • Ajout de cache : cela se fait rarement à chaud, et est encore une caractéristique de fonctionnement des baies high-end. Dans le scale-out cela se fait par ajout de contrôleurs pour l’instant.
  • Retrait de tiroirs de disques : peu de systèmes proposent cela. Il est déjà possible de le faire à ce jour, moyennant une procédure maîtrisée, et cela va devenir une opération courante.
  • Retrait de contrôleurs et disques : aucun autre système que cDOT ne permet cela. Un système complet est vieillissant et doit être recyclé. Ce besoin est exprimé par tous nos clients, et souvent il est repoussé car il nécessite des arrêts de service, un projet de migration souvent complexe. Avec cDOT 8.2, cette opération est simplifiée. Après avoir déplacé les données au sein du cluster, SANS interruption de service aux utilisateurs, le système est décommissionné, en d’autres mots retiré du cluster, et peut-être remplacé par un nouveau.
  • Evolution de contrôleurs : voici encore une évolution technologique unique sur le marché. Il s’agit de pouvoir changer des composants de puissance (contrôleurs), sans arrêt de service : cela s’appelle le scale-up. Il peut arriver qu’une saturation soit remarquée sur un composant de traitement, et avec la plupart des solutions du marché il n’est pas possible de remplacer un contrôleur sans, soit un arrêt de service, dans le meilleur des cas, soit un remplacement du système complet. NetApp propose cette fonction depuis ses origines, mais jusqu’alors cela nécessitait un arrêt. Avec cDOT 8.2 tout ceci se fait en ligne et est complètement transparent pour les utilisateurs et sans déplacement de la donnée. La virtualisation du service à la donnée est la clé ici. Voici en quelques mots les étapes du processus : le service est assuré par un nœud A du cluster. Celui-ci est délocalisé sans recopie de données sur un autre nœud B, puis on attache dynamiquement les disques sur ce contrôleur. Le nœud A est arrêté, remplacé puis il récupère les propriétés des disques et éventuellement le service qui a été déplacé.

En clair, cDOT 8.2 élimine le besoin d’avoir des arrêts de maintenance planifiés, et propose une plate-forme qui fonctionne 24/7, pendant la phase de vie de plate-forme, mais aussi au gré de ses évolutions.

Pour résumer cDOT est la première solution de stockage unifiée complètement virtualisée, pour laquelle tous les composants physiques (contrôleurs, disques, cartes IO, etc.) ne sont que des unités de traitement et complètement orientée service à la donnée.

Bien sûr, la nouvelle plateforme cDOT 8.2 a tout un paquet d’autres nouveautés, mais il me semblait que celle-ci était vraiment dans l’air du temps. »

A propos de l'auteur

SCC

Laisser une réponse

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Recevez par mail les articles et actualités de Au coeur des InfrasJe m'inscris à la Newsletter