Logo Zephyrnet

Kontroluj koszty danych w chmurze – DATAVERSITY

Data:

Obciążenia związane z danymi w chmurze są jak kawa: występują w wielu formach i smakach, a każdy z nich ma inną cenę. Tak jak Twój codzienny nawyk cappuccino będzie Cię kosztować dziesiątki razy w miesiącu tyle, ile wydałbyś na codzienne parzenie Folgers w domu, tak sposób, w jaki konfigurujesz zasoby danych w chmurze i uruchamiasz do nich zapytania, może mieć poważne konsekwencje dla ogólnego wydatki na chmurę.

Niestety, zastanawiając się, czy Twoje wydatki mają sens – zarówno na kawę, jak i dane w chmurze – może być wyzwaniem. Nikt automatycznie nie poinformuje Cię, kiedy kupujesz bardziej wyszukaną kawę, niż możesz sobie na to pozwolić, ani że płacisz za infrastrukturę danych w chmurze więcej, niż jest to potrzebne do wykonywanych zadań.

Nie jestem tu po to, żeby Ci mówić, jak zaplanować budżet na kawę. Ale mogę Ci powiedzieć – ponieważ jest to część mojej codziennej pracy – jak zarządzać kosztami danych w chmurze. Jak wyjaśniam, wszystko sprowadza się do zrozumienia roli, jaką pełnią poszczególne obciążenia danych w Twojej firmie, a następnie odpowiedniego przydzielenia im zasobów finansowych.

Wyzwanie optymalizacji kosztów danych w chmurze

Nadmierne wydatki na dane w chmurze mogą wynikać z prostych błędów, takich jak zapomnienie o usunięciu woluminu blokowego, gdy już go nie potrzebujesz. Jest to stosunkowo prosty typ błędu wydatków do skorygowania, ponieważ zazwyczaj łatwo jest wykryć zasoby danych, które nie są połączone z żadnymi obciążeniami.

Optymalizacja kosztów danych w chmurze staje się większym wyzwaniem – i gdzie leży źródło wielu nadmiernych wydatków – gdy chodzi o zapewnienie, że infrastruktura danych, z której aktywnie korzystasz, jest idealna do Twoich potrzeb.

Dzieje się tak dlatego, że nie zawsze jest jasne, czy cel biznesowy obciążeń danych uzasadnia ich koszty. Istnieje wiele sposobów konfigurowania obciążeń związanych z danymi, a każdy z nich ma inny wpływ na koszty. Bez dużego kontekstu nie można określić, czy używasz najlepszej konfiguracji na podstawie celu obciążeń danymi.

Przykład zarządzania kosztami danych

Rozważmy na przykład klasyczny przypadek użycia danych: wysyłanie zapytań o dane transakcyjne. W przypadku tego typu obciążeń istnieje wiele sposobów hostowania danych. Mógłbyś to umieścić w hurtownia danychlub w różnego rodzaju bazach danych. Istnieją również różne podejścia do odpytywania danych. Możesz użyć narzędzi do wysyłania zapytań wbudowanych w platformę hurtowni danych (jeśli to tam przechowujesz dane) lub możesz skorzystać z rozwiązań zewnętrznych. Można także przydzielać zapytaniom różne poziomy zasobów obliczeniowych; więcej obliczeń zazwyczaj skutkuje szybszymi zapytaniami.

Teraz, jeśli obciążenie danymi ma kluczowe znaczenie – na przykład, jeśli stanowią one część usługi analizy predykcyjnej, która dostarcza klientom rekomendacje produktów w czasie rzeczywistym, przyczyniając się w ten sposób do generowania przychodów – prawdopodobnie możesz uzasadnić wydawanie na to dużych pieniędzy . W takim przypadku prawdopodobnie zdecydujesz się na przechowywanie danych w magazynie zaprojektowanym do optymalizacji zapytań i poświęcisz na to mnóstwo zasobów obliczeniowych.

Ale co, jeśli obciążenie danymi jest mniej krytyczne? A co jeśli na przykład jest to część procesu audytu, który Twoja firma wykonuje okresowo, ale który nie musi dawać wyników w czasie rzeczywistym? W takim przypadku znacznie trudniej byłoby uzasadnić płacenie za najwyższej klasy infrastrukturę danych.

Krótko mówiąc, ustalenie, czy dane w chmurze są zoptymalizowane pod względem kosztów, nie polega po prostu na szukaniu oczywistych przypadków niepotrzebnych wydatków. Chodzi także o ocenę, czy pieniądze wydawane na obciążenia danymi w chmurze mają sens, biorąc pod uwagę wyniki biznesowe, które pomagają one osiągnąć.

Uzyskanie wglądu w wydatki na dane

Aby dokonać takiej oceny, musisz wiedzieć znacznie więcej niż tylko to, ile wydajesz na zasoby danych w chmurze lub jak te wydatki zmieniają się w czasie. Musisz także wiedzieć, jaki cel biznesowy wspierają wydatki, a także którzy interesariusze są za nie odpowiedzialni.

Podstawowym krokiem w kierunku osiągnięcia tej widoczności jest znaczące oznaczenie całej infrastruktury chmurowej związanej z danymi. Bazy danych, zasoby pamięci blokowej, zasobniki pamięci obiektowej itd. powinny być oznaczone tagami identyfikującymi, do jakich obciążeń wchodzą i kto jest odpowiedzialny za zarządzanie nimi.

Informacje te mają kluczowe znaczenie, ponieważ można je połączyć ze wskaźnikami wydatków, aby ustalić, czy skoki wydatków są uzasadnione, czy nie.

Na przykład, jeśli zauważysz wzrost kosztów infrastruktury związanych z zapytaniami o dane, możesz przyjrzeć się tagom zapytań, aby określić ich cel. Być może wspierają wykrywanie oszustw przy zakupach, a zwiększony koszt wynika ze wzrostu wolumenu zakupów. W takim przypadku można stwierdzić, że koszt jest uzasadniony i przejść dalej.

Jeśli jednak tagi zamiast tego mówią, że zapytania są uruchamiane przez Twój dział księgowy w celu przygotowania raportów kwartalnych, możesz zamiast tego wprowadzić zmiany, które obniżą koszty zapytań – na przykład uruchamianie ich partiami lub przenoszenie danych do tańszej bazy danych . W rezultacie zapytania mogą trwać dłużej, ale jest to prawdopodobnie akceptowalne, biorąc pod uwagę związek między zapytaniami a firmą.

Trwałe ograniczenie kosztów transmisji danych

W dłuższej perspektywie możesz wykorzystać wiedzę uzyskaną dzięki identyfikacji przypadków nadmiernych wydatków na dane, aby ulepszyć ogólne podejście firmy do zarządzania kosztami danych w chmurze.

Możesz na przykład zdać sobie sprawę, że nadmierne wydatki często wynikają z sytuacji, w których interesariusze zwiększają zasoby danych w celu zwiększenia wydajności, nie rozumiejąc konsekwencji kosztowych. Aby zapobiec powtarzaniu się tego problemu, możesz zaostrzyć zasady zarządzania tożsamością i dostępem (IAM) w chmurze w organizacji, tak aby tylko niektórzy pracownicy mieli uprawnienia do skalowania infrastruktury danych. 

Wniosek: opanowanie kosztów danych

Obciążenia związane z danymi w chmurze mogą kosztować dużo lub mało – a czasami istnieją uzasadnione powody, aby kosztować dużo. Aby poznać różnicę, potrzebujesz głębokiego wglądu w kontekst biznesowy obciążeń związanych z danymi i infrastruktury chmury. Kiedy możesz porównywać wydatki na dane z wynikami biznesowymi, możesz systematycznie dokonywać skutecznych ustaleń, czy koszt każdego obciążenia jest uzasadniony wartością, jaką obciążenie tworzy dla Twojej firmy.

spot_img

Najnowsza inteligencja

spot_img