Sélectionner une page

Déduplication : on ne vous a peut-être pas tout dit

Solution miracle, la déduplication ? Avec ses réductions significatives de la taille des sauvegardes, jusqu’à 80 % parfois, la technologie a permis aux entreprises d’économiser énormément sur les infrastructures de sauvegarde sur disques, et d’ailleurs, d’adopter plus largement ce type de solution en lieu et place de sauvegarde traditionnelle sur bandes. En pratique, rappelons que la déduplication met en oeuvre un algorithme permettant de repérer les doublons dans les données sauvegardées, et de supprimer ces données dupliquées afin de récupérer de l’espace utilisable sur les disques.

La dédup’ est donc devenue incontournable : pas un éditeur, ni un constructeur ne l’a pas inclus à ses produits de sauvegarde. A tel point qu’elle a petit à petit été envisagée pour les données de production. De nombreuses offres de stockage primaire ont donc commencé à proposer la dédup en natif, en en faisant un «must», tout autant que les fonctionnalités de «thin provisionning», pour réduire la facture du stockage.

Cependant, on oublie souvent de dire que la déduplication ne gagne pas à tous les coups. Il existe même des cas de figure où elle est carrément déconseillée, ou peu efficace. Nos clients n’en ont pas toujours conscience et pourtant, l’impact financier peut être important.
Il me semblait donc intéressant de passer en revue les quelques idées reçues en la matière, en apportant quelques éléments de réponses concrètes.

1- Impact sur les performances

On en parle peu, mais dans certains cas la déduplication peut avoir un impact non négligeable sur les performances, engendrant des effets de latence, inadmissibles en matière de stockage de production ! Le post-processing, ou les multiples allers-retour de certains algorithmes peut en effet impacter les i/o sur les différents contrôleurs. Dans certains cas la dégradation de performances peut même atteindre jusqu’à 35 % ! Certains constructeurs conseillent parfois dans leurs meilleures pratiques de désactiver la déduplication….alors que le client a payé cher pour avoir cette fonctionnalité clé. C’est possible de pallier à ces pertes de performances : certains constructeurs ajoutent des composants (plus de mémoire, disques flash) dans les baies, et la manoeuvre fonctionne plutôt bien. Cependant, l’opération peut rendre le coût d’acquisition du stockage élevé. D’autres se basent sur des ASICs en natif pour totalement décharger les contrôleurs de ces tâches consommatrices de ressource, , et des algorithmes qui traitent les données à la volée, ce qui évite de faire des compromis au niveau des performances.

2- Impact sur l’espace disque

Imaginons qu’une grande quantité de données ait été dédupliquée -on dit aussi «déshydratée». Imaginez que 50 To de données ne prennent plus que 20 To de stockage après dédup. Le client, par souci d’économie et d’optimisation, a calculé au plus juste son espace de stockage disponible. Que se passe-t-il en cas de crash, lors de la restauration? Plus assez d’espace pour accueillir les données ! Cela parait évident et pourtant, souvent, le client n’a pas conscience du problème avant de faire sa restauration. Certaines baies peuvent s’adapter de manière élastique, pour fournir 100 % de l’espace de stockage lorsque c’est nécessaire, puis le réduire en fonction des données dédupliquées.

3- La déduplication ne fonctionne pas sur toutes les applications

La dédup’, cela ne marche très bien que pour un certain nombre d’applications en production, en fait, elle est impossible à généraliser à toutes les applications. On le sait, elle fait des miracles dans le domaine du VDI, des fichiers de virtualisation….Pour le reste, il est intéressant de se poser la question. Il existe des outils sur le marché, gratuits pour la plupart, qui permettent d’évaluer en amont quel taux de déduplication on peut atteindre avec telles ou telles applications ou données. Ce qui permet d’envisager sa stratégie plus finement, et plus intelligemment, avant d’investir dans une solution chère qui ne sera peut-être pas efficace.

Pensez-y avant d’investir dans un nouvel équipement de stockage.


Livre blanc :
Technologies « thin » HP Comparaison avec les solutions concurrentes

Pour le télécharger, remplissez le formulaire çi-dessous.

[contact-form-7 id= »1446″ title= »Livre Blanc Edison »]

A propos de l'auteur

Laisser une réponse

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Recevez par mail les articles et actualités de Au coeur des InfrasJe m'inscris à la Newsletter