Zephyrnet Logo

Mantendo os custos de dados na nuvem sob controle – DATAVERSITY

Data:

As cargas de trabalho de dados na nuvem são como o café: elas vêm em vários formatos e sabores, cada um com preços diferentes. Assim como seu hábito diário de cappuccino acabará custando dezenas de vezes por mês o que você gastaria para preparar Folgers todas as manhãs em casa, a maneira como você configura recursos de dados baseados em nuvem e executa consultas neles pode ter implicações importantes para seu desempenho geral. gastos com nuvem.

Infelizmente, descobrir se seus gastos fazem sentido – tanto com café quanto com dados em nuvem – pode ser desafiador. Ninguém informa automaticamente quando você está comprando um café mais sofisticado do que pode pagar ou que está pagando mais pela infraestrutura de dados em nuvem do que o necessário para as cargas de trabalho que está executando.

Agora, não estou aqui para lhe dizer como fazer um orçamento para café. Mas o que posso lhe dizer – porque faz parte do trabalho que faço todos os dias – é como gerenciar os custos de dados na nuvem. Conforme explico, tudo se resume a entender qual o papel que cada uma de suas cargas de trabalho de dados desempenha em seus negócios e, em seguida, alocar recursos financeiros a elas de acordo.

O desafio da otimização de custos de dados em nuvem

Gastos excessivos com dados na nuvem podem ocorrer devido a erros simples, como esquecer de excluir um volume de armazenamento em bloco depois de não precisar mais dele. Este é um tipo de erro de gastos relativamente simples de corrigir porque normalmente é fácil detectar recursos de dados que não estão conectados a nenhuma carga de trabalho.

Onde a otimização de custos de dados em nuvem se torna mais desafiadora – e onde reside a raiz de muitos gastos excessivos – é quando se trata de garantir que a infraestrutura de dados que você está usando ativamente seja ideal para suas necessidades.

Isto porque nem sempre é claro se a finalidade comercial das cargas de trabalho de dados justifica os seus custos. Há muitas maneiras de configurar cargas de trabalho de dados, cada uma com implicações de custos diferentes. Sem muito contexto, é impossível determinar se você está usando a melhor configuração com base na finalidade das suas cargas de trabalho de dados.

Exemplo de gerenciamento de custos de dados

Por exemplo, considere um caso de uso de dados clássico: consultar dados transacionais. Para esse tipo de carga de trabalho, há diversas maneiras de hospedar os dados. Você poderia colocá-lo em um data warehouse, por exemplo, ou em vários tipos de bancos de dados. Existem também diferentes abordagens para consultar os dados. Você pode usar ferramentas de consulta integradas à sua plataforma de armazenamento de dados (se for onde você armazena os dados) ou pode usar soluções externas. Você também pode dedicar vários níveis de recursos de computação às consultas; mais computação normalmente resultará em consultas mais rápidas.

Agora, se a sua carga de trabalho de dados for de missão crítica – por exemplo, se fizer parte de um serviço de análise preditiva que fornece recomendações de produtos aos seus clientes em tempo real, contribuindo assim para a geração de receita – você provavelmente poderá justificar gastar muito dinheiro nisso. . Nesse caso, você provavelmente optaria por armazenar os dados em um warehouse projetado para otimizar consultas e dedicaria muitos recursos de computação a isso.

Mas e se a carga de trabalho de dados for menos crítica? E se, por exemplo, fizer parte de um processo de auditoria que sua empresa realiza periodicamente, mas que não precisa entregar resultados em tempo real? Nesse caso, seria muito mais difícil justificar o pagamento por infraestrutura de dados de alto nível.

Resumindo, determinar se os seus dados na nuvem têm custos otimizados não é simplesmente uma questão de procurar casos óbvios de gastos desnecessários. Trata-se também de avaliar se o dinheiro que você gasta em cargas de trabalho de dados na nuvem faz sentido, dados os resultados de negócios que elas ajudam a fornecer.

Ganhando visibilidade nos gastos com dados

Para fazer essa avaliação, você precisa saber muito mais do que está gastando em recursos de dados em nuvem ou como seus gastos variam ao longo do tempo. Você também precisa saber qual finalidade comercial os gastos apoiam, bem como quais partes interessadas são responsáveis ​​pelos gastos.

Um passo básico para alcançar essa visibilidade é marcar toda a infraestrutura de nuvem relacionada a dados de maneira significativa. Bancos de dados, recursos de armazenamento em bloco, buckets de armazenamento de objetos e assim por diante devem ser rotulados com tags que identifiquem de quais cargas de trabalho eles fazem parte e quem é responsável por gerenciá-los.

Essas informações são críticas porque você pode combiná-las com métricas de gastos para descobrir se os picos nos gastos são justificáveis ​​ou não.

Por exemplo, se você notar um aumento nos custos de infraestrutura associados às consultas de dados, poderá observar as tags das consultas para identificar qual é a finalidade das consultas. Talvez eles suportem a detecção de fraudes em compras, e o aumento do custo se deva ao aumento no volume de compras. Nesse caso, você poderia concluir que o custo é legítimo e seguir em frente.

Mas se as tags disserem que as consultas estão sendo executadas pelo seu departamento de contabilidade para preparar relatórios trimestrais, você poderá fazer alterações que reduzam os custos das consultas – como executá-las em lotes ou mover os dados para um banco de dados de custo mais baixo. . Como resultado, as consultas podem demorar mais, mas isso provavelmente será aceitável, dada a relação entre as consultas e o negócio.

Controlando permanentemente os custos de dados

No longo prazo, você pode usar os insights obtidos ao identificar casos de gastos excessivos com dados para melhorar a abordagem geral da sua empresa ao gerenciamento de custos de dados na nuvem.

Por exemplo, você pode perceber que gastos excessivos frequentemente se devem a situações em que as partes interessadas aumentam os recursos de dados em uma tentativa de aumentar o desempenho, sem compreender as implicações de custo. Para evitar que esse problema se repita, você pode tornar as políticas de gerenciamento de acesso e identidade na nuvem (IAM) da sua organização mais rigorosas, para que apenas determinados funcionários tenham permissão para aumentar a infraestrutura de dados. 

Conclusão: Obtendo os custos de dados sob controle

As cargas de trabalho de dados em nuvem podem custar muito ou pouco – e, às vezes, há bons motivos para custarem muito. Para saber a diferença, você precisa de visibilidade profunda do contexto comercial de suas cargas de trabalho de dados e infraestrutura de nuvem. Quando você compara os gastos com dados aos resultados de negócios, você pode sistematicamente fazer determinações eficazes sobre se o custo de cada carga de trabalho é justificado pelo valor que a carga de trabalho cria para o seu negócio.

local_img

Inteligência mais recente

local_img