Logo Zephyrnet

Tenere sotto controllo i costi dei dati cloud – DATAVERSITY

Data:

I carichi di lavoro dei dati cloud sono come il caffè: sono disponibili in molte forme e gusti, ciascuno con prezzi diversi. Proprio come l'abitudine quotidiana al cappuccino finirà per costarti dozzine di volte al mese quello che spenderesti per preparare Folgers ogni mattina a casa, il modo in cui configuri le risorse dati basate su cloud e esegui query su di esse può avere importanti implicazioni per il tuo rendimento complessivo. spesa nel cloud.

Sfortunatamente, capire se la tua spesa ha senso, sia per il caffè che per dati cloud – può essere impegnativo. Nessuno ti dice automaticamente quando stai acquistando un caffè più costoso di quanto ti puoi permettere o che stai pagando per l'infrastruttura dati cloud più di quanto ti serve per i carichi di lavoro che stai eseguendo.

Ora, non sono qui per dirti come stabilire un budget per il caffè. Ma quello che posso dirti, perché fa parte del lavoro che svolgo ogni giorno, è come gestire i costi dei dati cloud. Come spiego, tutto si riduce a capire quale ruolo svolge ciascuno dei carichi di lavoro dei dati nella tua azienda, quindi allocare loro le risorse finanziarie di conseguenza.

La sfida dell'ottimizzazione dei costi dei dati cloud

Una spesa eccessiva per i dati cloud può verificarsi a causa di semplici errori, come dimenticare di eliminare un volume di archiviazione a blocchi quando non ne hai più bisogno. Si tratta di un tipo di errore di spesa relativamente semplice da correggere perché in genere è facile rilevare risorse di dati che non sono connesse ad alcun carico di lavoro.

Il punto in cui l'ottimizzazione dei costi dei dati cloud diventa più impegnativo, e dove risiede la radice di molte spese eccessive, è quando si tratta di garantire che l'infrastruttura dati che stai utilizzando attivamente sia l'ideale per le tue esigenze.

Questo perché non è sempre chiaro se lo scopo aziendale dei carichi di lavoro dei dati ne giustifichi i costi. Esistono molti modi per configurare i carichi di lavoro dei dati, ciascuno con implicazioni di costo diverse. Senza una grande quantità di contesto, è impossibile determinare se stai utilizzando la configurazione migliore in base allo scopo dei carichi di lavoro dei dati.

Esempio di gestione dei costi dei dati

Ad esempio, considera un classico caso d'uso dei dati: interrogare i dati transazionali. Per questo tipo di carico di lavoro esistono diversi modi per ospitare i dati. Potresti metterlo in a data warehouse, ad esempio, o in vari tipi di database. Esistono anche diversi approcci per interrogare i dati. Potresti utilizzare strumenti di query integrati nella tua piattaforma di data warehousing (se è lì che archivi i dati) oppure potresti utilizzare soluzioni esterne. È inoltre possibile dedicare diversi livelli di risorse di calcolo alle query; una maggiore elaborazione in genere si tradurrà in query più veloci.

Ora, se il carico di lavoro dei tuoi dati è fondamentale, ad esempio se fa parte di un servizio di analisi predittiva che fornisce consigli sui prodotti ai tuoi clienti in tempo reale, contribuendo così alla generazione di entrate, probabilmente puoi giustificare la spesa di molti soldi su di esso . In tal caso, probabilmente sceglieresti di archiviare i dati in un warehouse progettato per ottimizzare le query e gli dedicheresti molte risorse di elaborazione.

Ma cosa succede se il carico di lavoro dei dati è meno critico? E se, ad esempio, fosse parte di un processo di audit che la tua azienda esegue periodicamente, ma che non deve fornire risultati in tempo reale? In questo caso sarebbe molto più difficile giustificare il pagamento per un’infrastruttura dati di alto livello.

In breve, determinare se i dati cloud sono ottimizzati in termini di costi non è semplicemente questione di cercare esempi ovvi di spese inutili. Si tratta anche di valutare se il denaro che stai spendendo per i carichi di lavoro di dati nel cloud ha senso considerati i risultati aziendali che contribuiscono a fornire.

Acquisire visibilità sulla spesa relativa ai dati

Per effettuare tale valutazione, devi sapere molto di più di quello che stai spendendo per le risorse di dati cloud o di come la tua spesa varia nel tempo. È inoltre necessario sapere quale scopo aziendale viene sostenuto dalla spesa, nonché quali parti interessate sono responsabili della spesa.

Un passo fondamentale verso il raggiungimento di questa visibilità è taggare tutta l’infrastruttura cloud relativa ai dati in modo significativo. Database, risorse di storage a blocchi, bucket di storage di oggetti e così via dovrebbero essere etichettati con tag che identifichino di quali carichi di lavoro fanno parte e chi è responsabile della loro gestione.

Queste informazioni sono fondamentali perché puoi abbinarle ai parametri di spesa per capire se i picchi di spesa sono giustificabili o meno.

Ad esempio, se noti un aumento dei costi dell'infrastruttura associati alle query sui dati, puoi esaminare i tag delle query per identificarne lo scopo. Forse supportano il rilevamento delle frodi per gli acquisti e l'aumento dei costi è dovuto a un aumento del volume degli acquisti. In tal caso, potresti concludere che il costo è legittimo e andare avanti.

Ma se i tag indicano invece che le query vengono eseguite dal reparto contabilità per preparare report trimestrali, potresti invece apportare modifiche che riducono i costi delle query, ad esempio eseguirle in batch o spostare i dati in un database a costo inferiore . Di conseguenza, le query potrebbero richiedere più tempo, ma è probabile che ciò sia accettabile data la relazione tra le query e l'azienda.

Contenere i costi dei dati in modo permanente

Nel lungo termine, puoi utilizzare le informazioni ottenute identificando i casi di spesa eccessiva per i dati per migliorare l'approccio generale della tua azienda alla gestione dei costi dei dati cloud.

Ad esempio, potresti renderti conto che le spese eccessive sono spesso dovute a situazioni in cui le parti interessate aumentano le risorse di dati nel tentativo di aumentare le prestazioni, senza comprendere le implicazioni sui costi. Per evitare che questo problema si ripeta, potresti rendere più rigorose le policy IAM (Cloud Identity and Access Management) della tua organizzazione, in modo che solo alcuni dipendenti abbiano il permesso di ampliare l'infrastruttura dati. 

Conclusione: tenere sotto controllo i costi dei dati

I carichi di lavoro dei dati cloud possono costare molto o poco e, a volte, ci sono buone ragioni per cui costano molto. Per riconoscere la differenza, è necessaria una visibilità approfondita del contesto aziendale dei carichi di lavoro dei dati e dell'infrastruttura cloud. Quando puoi paragonare la spesa per i dati ai risultati aziendali, puoi determinare sistematicamente in modo efficace se il costo di ciascun carico di lavoro è giustificato dal valore che il carico di lavoro crea per la tua azienda.

spot_img

L'ultima intelligenza

spot_img