Logo Zéphyrnet

Maîtriser les coûts des données cloud – DATAVERSITY

Date :

Les charges de travail de données cloud sont comme le café : elles se présentent sous de nombreuses formes et saveurs, chacune avec des prix différents. Tout comme votre consommation quotidienne de cappuccino finira par vous coûter des dizaines de fois par mois ce que vous dépenseriez pour préparer du Folgers chaque matin à la maison, la façon dont vous configurez les ressources de données basées sur le cloud et exécutez des requêtes sur celles-ci peut avoir des implications majeures sur votre stratégie globale. dépenses cloud.

Malheureusement, déterminer si vos dépenses ont du sens – tant pour le café que pour données cloud – peut être un défi. Personne ne vous dit automatiquement si vous achetez un café plus raffiné que ce que vous pouvez vous permettre, ou si vous payez plus pour une infrastructure de données cloud que ce dont vous avez besoin pour les charges de travail que vous exécutez.

Maintenant, je ne suis pas ici pour vous dire comment établir un budget café. Mais ce que je peux vous dire – parce que cela fait partie de mon travail quotidien – c'est comment gérer les coûts des données cloud. Comme je l'explique, tout se résume à comprendre le rôle que joue chacune de vos charges de travail de données dans votre entreprise, puis à leur allouer des ressources financières en conséquence.

Le défi de l’optimisation des coûts des données cloud

Des dépenses excessives en données cloud peuvent survenir en raison d'erreurs simples, comme oublier de supprimer un volume de stockage en bloc lorsque vous n'en avez plus besoin. Il s'agit d'un type d'erreur de dépenses relativement simple à corriger, car il est généralement facile de détecter les ressources de données qui ne sont connectées à aucune charge de travail.

Là où l'optimisation des coûts des données cloud devient plus difficile – et où réside la racine de nombreux dépenses excessives – c'est lorsqu'il s'agit de garantir que l'infrastructure de données que vous utilisez activement est idéale pour vos besoins.

En effet, il n'est pas toujours clair si l'objectif commercial des charges de travail de données justifie leurs coûts. Il existe de nombreuses façons de configurer les charges de travail de données, chacune ayant des implications financières différentes. Sans beaucoup de contexte, il est impossible de déterminer si vous utilisez la meilleure configuration en fonction de l'objectif de vos charges de travail de données.

Exemple de gestion des coûts des données

Par exemple, considérons un cas d’utilisation classique des données : l’interrogation de données transactionnelles. Pour ce type de charge de travail, il existe plusieurs façons d'héberger les données. Vous pourriez le mettre dans un entrepôt de données, par exemple, ou dans différents types de bases de données. Il existe également différentes approches pour interroger les données. Vous pouvez utiliser des outils de requête intégrés à votre plate-forme d'entreposage de données (si c'est là que vous stockez les données), ou vous pouvez utiliser des solutions externes. Vous pouvez également consacrer différents niveaux de ressources de calcul aux requêtes ; plus de calcul entraînera généralement des requêtes plus rapides.

Désormais, si votre charge de travail de données est essentielle à votre mission (par exemple, si elle fait partie d'un service d'analyse prédictive qui fournit des recommandations de produits à vos clients en temps réel, contribuant ainsi à la génération de revenus), vous pouvez probablement justifier d'y consacrer beaucoup d'argent. . Dans ce cas, vous choisirez probablement de stocker les données dans un entrepôt conçu pour optimiser les requêtes et vous y consacrerez de nombreuses ressources de calcul.

Mais que se passe-t-il si la charge de travail des données est moins critique ? Que se passe-t-il si, par exemple, cela fait partie d'un processus d'audit que votre entreprise effectue périodiquement, mais qui n'a pas besoin de fournir des résultats en temps réel ? Dans ce cas, il serait beaucoup plus difficile de justifier le paiement d’une infrastructure de données de premier ordre.

En bref, déterminer si vos données cloud sont optimisées en termes de coûts ne consiste pas simplement à rechercher des cas évidents de dépenses inutiles. Il s'agit également d'évaluer si l'argent que vous dépensez pour les charges de travail de données dans le cloud est judicieux compte tenu des résultats commerciaux qu'elles contribuent à produire.

Gagner en visibilité sur les dépenses en données

Pour procéder à cette évaluation, vous devez en savoir bien plus que ce que vous dépensez en ressources de données cloud ou comment vos dépenses varient au fil du temps. Vous devez également savoir quel objectif commercial les dépenses soutiennent, ainsi que quelles parties prenantes sont responsables de ces dépenses.

Une étape fondamentale pour obtenir cette visibilité consiste à baliser de manière significative toutes les infrastructures cloud liées aux données. Les bases de données, les ressources de stockage en bloc, les compartiments de stockage d'objets, etc. doivent être étiquetés avec des balises qui identifient les charges de travail dont elles font partie et qui est responsable de leur gestion.

Ces informations sont essentielles car vous pouvez les associer à des mesures de dépenses pour déterminer si les pics de dépenses sont justifiables ou non.

Par exemple, si vous remarquez une légère augmentation des coûts d'infrastructure associés aux requêtes de données, vous pouvez consulter les balises des requêtes pour identifier leur objectif. Peut-être qu'ils prennent en charge la détection des fraudes lors des achats, et que l'augmentation des coûts est due à une augmentation du volume des achats. Dans ce cas, vous pourriez conclure que le coût est légitime et passer à autre chose.

Mais si les balises indiquent à la place que les requêtes sont exécutées par votre service comptable pour préparer des rapports trimestriels, vous pouvez plutôt apporter des modifications qui réduisent les coûts des requêtes, comme les exécuter par lots ou déplacer les données vers une base de données moins coûteuse. . Les requêtes peuvent donc prendre plus de temps, mais cela est probablement acceptable compte tenu de la relation entre les requêtes et l'entreprise.

Maîtriser définitivement les coûts des données

À long terme, vous pouvez utiliser les informations que vous obtenez en identifiant les cas de dépenses excessives en matière de données pour améliorer l'approche globale de votre entreprise en matière de gestion des coûts des données cloud.

Par exemple, vous réaliserez peut-être que les dépenses excessives sont souvent dues à des situations dans lesquelles les parties prenantes augmentent les ressources de données dans le but d'augmenter les performances, sans en comprendre les implications en termes de coûts. Pour éviter que ce problème ne se reproduise, vous pouvez rendre les politiques de gestion des identités et des accès (IAM) cloud de votre organisation plus strictes afin que seuls certains employés soient autorisés à faire évoluer l'infrastructure de données. 

Conclusion : maîtriser les coûts des données

Les charges de travail de données cloud peuvent coûter cher ou peu – et parfois, il y a de bonnes raisons pour lesquelles elles coûtent cher. Pour faire la différence, vous avez besoin d'une visibilité approfondie sur le contexte commercial de vos charges de travail de données et de votre infrastructure cloud. Lorsque vous pouvez comparer les dépenses en données aux résultats de l'entreprise, vous pouvez systématiquement déterminer efficacement si le coût de chaque charge de travail est justifié par la valeur qu'elle crée pour votre entreprise.

spot_img

Dernières informations

spot_img