Zephyrnet-logo

De kosten voor clouddata onder controle houden – DATAVERSITY

Datum:

Clouddataworkloads zijn als koffie: ze zijn er in vele vormen en smaken, elk met verschillende prijsniveaus. Net zoals uw dagelijkse cappuccino-gewoonte u uiteindelijk tientallen keren per maand zal kosten wat u zou uitgeven om elke ochtend thuis Folgers te brouwen, kan de manier waarop u cloudgebaseerde gegevensbronnen configureert en er query's op uitvoert grote gevolgen hebben voor uw algehele cloud-uitgaven.

Helaas moet u uitzoeken of uw uitgaven zinvol zijn – zowel voor koffie als voor koffie cloud data – kan een uitdaging zijn. Niemand vertelt u automatisch wanneer u luxere koffie koopt dan u zich kunt veroorloven, of dat u meer betaalt voor de clouddata-infrastructuur dan u nodig heeft voor de werklast die u uitvoert.

Nu ben ik hier niet om je te vertellen hoe je een koffiebudget kunt maken. Maar wat ik je kan vertellen – omdat het deel uitmaakt van het werk dat ik elke dag doe – is hoe je de kosten voor clouddata kunt beheren. Zoals ik uitleg, komt het er allemaal op neer dat je begrijpt welke rol elk van je dataworkloads speelt in je bedrijf, en dat je daar vervolgens de financiële middelen aan toewijst.

De uitdaging van kostenoptimalisatie voor cloudgegevens

Te hoge uitgaven aan cloudgegevens kunnen het gevolg zijn van eenvoudige fouten, zoals het vergeten een blokopslagvolume te verwijderen nadat u het niet langer nodig heeft. Dit is een relatief eenvoudig type bestedingsfout die u kunt corrigeren, omdat het doorgaans eenvoudig is om gegevensbronnen te detecteren die niet zijn verbonden met werklasten.

Waar het optimaliseren van de kosten voor clouddata een grotere uitdaging wordt – en waar de oorzaak ligt van veel te hoge uitgaven – is als het erom gaat ervoor te zorgen dat de data-infrastructuur die u actief gebruikt, ideaal is voor uw behoeften.

Dat komt omdat het niet altijd duidelijk is of het zakelijke doel van dataworkloads de kosten ervan rechtvaardigt. Er zijn veel manieren om gegevensworkloads te configureren, elk met verschillende kostenimplicaties. Zonder veel context is het onmogelijk om te bepalen of u de beste configuratie gebruikt op basis van het doel van uw gegevensworkloads.

Voorbeeld van gegevenskostenbeheer

Neem bijvoorbeeld een klassiek geval van gegevensgebruik: het opvragen van transactiegegevens. Voor dit type werkbelasting zijn er meerdere manieren om de gegevens te hosten. Je zou het in een datawarehouse, bijvoorbeeld, of in verschillende soorten databases. Er zijn ook verschillende benaderingen voor het opvragen van de gegevens. U kunt queryhulpmiddelen gebruiken die zijn ingebouwd in uw datawarehousingplatform (als u daar de gegevens opslaat), of u kunt externe oplossingen gebruiken. U kunt ook verschillende niveaus van computerresources aan de query's besteden; meer rekenkracht resulteert doorgaans in snellere query's.

Als uw datawerklast bedrijfskritisch is (bijvoorbeeld als het onderdeel is van een voorspellende analyseservice die in realtime productaanbevelingen aan uw klanten levert en daarmee bijdraagt ​​aan het genereren van inkomsten), kunt u waarschijnlijk rechtvaardigen dat u er veel geld aan uitgeeft . In dat geval zou u er waarschijnlijk voor kiezen om de gegevens op te slaan in een magazijn dat is ontworpen om zoekopdrachten te optimaliseren, en zou u er voldoende computerbronnen aan besteden.

Maar wat als de datawerklast minder kritisch is? Wat als het bijvoorbeeld deel uitmaakt van een auditproces dat uw bedrijf periodiek uitvoert, maar dat niet in realtime resultaten hoeft op te leveren? In dat geval zou het een stuk moeilijker zijn om de betaling voor hoogwaardige data-infrastructuur te rechtvaardigen.

Kortom: bepalen of uw cloudgegevens kostengeoptimaliseerd zijn, is niet simpelweg een kwestie van zoeken naar voor de hand liggende gevallen van onnodige uitgaven. Het gaat ook om de beoordeling of het geld dat u uitgeeft aan dataworkloads in de cloud zinvol is gezien de bedrijfsresultaten die ze helpen opleveren.

Inzicht verkrijgen in data-uitgaven

Om die inschatting te kunnen maken, moet u veel meer weten dan alleen wat u uitgeeft aan cloudgegevensbronnen, of hoe uw uitgaven in de loop van de tijd variëren. U moet ook weten welk bedrijfsdoel de uitgaven ondersteunen, en welke belanghebbenden verantwoordelijk zijn voor de uitgaven.

Een basisstap op weg naar het bereiken van deze zichtbaarheid is het op een betekenisvolle manier taggen van alle datagerelateerde cloudinfrastructuur. Databases, blokopslagbronnen, objectopslagbuckets, enzovoort moeten worden gelabeld met tags die identificeren van welke workloads ze deel uitmaken en wie verantwoordelijk is voor het beheer ervan.

Die informatie is van cruciaal belang omdat u deze kunt koppelen aan uitgavenstatistieken om erachter te komen of uitgavenpieken gerechtvaardigd zijn of niet.

Als u bijvoorbeeld een stijging merkt in de infrastructuurkosten die verband houden met gegevensquery's, kunt u naar tags voor de query's kijken om te bepalen wat het doel van de query's is. Misschien ondersteunen ze fraudedetectie bij aankopen, en zijn de hogere kosten te wijten aan een toename van het aankoopvolume. In dat geval zou u kunnen concluderen dat de kosten legitiem zijn en verder gaan.

Maar als de tags in plaats daarvan aangeven dat de query's door uw boekhoudafdeling worden uitgevoerd om kwartaalrapporten op te stellen, kunt u in plaats daarvan wijzigingen aanbrengen die de kosten van de query's verlagen, zoals het uitvoeren ervan in batches of het verplaatsen van de gegevens naar een goedkopere database. . De vragen kunnen daardoor langer duren, maar dat is waarschijnlijk acceptabel gezien de relatie tussen de vragen en het bedrijf.

Datakosten permanent in toom houden

Op de lange termijn kunt u de inzichten die u krijgt door het identificeren van gevallen van overtollige gegevensuitgaven gebruiken om de algehele aanpak van uw bedrijf ten aanzien van het beheer van cloudgegevenskosten te verbeteren.

U realiseert zich bijvoorbeeld misschien dat te hoge uitgaven vaak het gevolg zijn van situaties waarin belanghebbenden databronnen opschalen in een poging de prestaties te verbeteren, zonder inzicht in de kostenimplicaties. Om te voorkomen dat dit probleem zich opnieuw voordoet, kunt u het cloudidentiteits- en toegangsbeheerbeleid (IAM) van uw organisatie strenger maken, zodat alleen bepaalde werknemers toestemming hebben om de data-infrastructuur op te schalen. 

Conclusie: de datakosten onder controle krijgen

Clouddataworkloads kunnen veel of weinig kosten, en soms zijn er goede redenen waarom ze veel kosten. Om het verschil te weten, heeft u diep inzicht nodig in de zakelijke context van uw dataworkloads en cloudinfrastructuur. Wanneer u gegevensuitgaven kunt vergelijken met bedrijfsresultaten, kunt u systematisch effectief bepalen of de kosten van elke werklast gerechtvaardigd zijn door de waarde die de werklast voor uw bedrijf creëert.

spot_img

VC Café

VC Café

Laatste intelligentie

spot_img