ゼファーネットのロゴ

クラウドデータコストを抑える – DATAVERSITY

日付:

クラウド データ ワークロードはコーヒーのようなものです。さまざまな形式と味があり、それぞれに価格が異なります。毎日のカプチーノの習慣が最終的に、自宅で毎朝フォルジャーズを淹れるのに費やす費用の数十倍の費用が月にかかるのと同じように、クラウドベースのデータ リソースを構成し、それらに対してクエリを実行する方法は、全体的な影響に大きな影響を与える可能性があります。クラウド支出。

残念ながら、コーヒーとコーヒーの両方に、自分の出費が意味があるかどうかを判断する必要があります。 クラウドデータ – 難しいかもしれません。お金の余裕を超えて高級なコーヒーを買ったり、実行しているワークロードに必要以上にクラウド データ インフラストラクチャにお金を払ったりしていると、自動的に教えてくれる人は誰もいません。

さて、私はコーヒーの予算を立てる方法を説明するためにここにいるわけではありません。しかし、私が言えることは、これは私が毎日行っている仕事の一部であるため、クラウド データのコストを管理する方法です。私が説明するように、結局のところ、各データ ワークロードがビジネスでどのような役割を果たしているかを理解し、それに応じて財務リソースを割り当てることが重要です。

クラウドデータコスト最適化の課題

クラウド データの過剰支出は、ブロック ストレージ ボリュームが不要になった後に削除するのを忘れるなどの単純な間違いによって発生する可能性があります。これは、どのワークロードにも接続されていないデータ リソースを検出するのが通常は簡単であるため、修正が比較的簡単なタイプの支出エラーです。

クラウド データ コストの最適化がより困難になるのは、現在使用しているデータ インフラストラクチャがニーズに最適であるかどうかを確認するときです。また、多くの過剰支出の原因はどこにありますか。

データ ワークロードのビジネス目的がそのコストに見合ったものであるかどうかが必ずしも明らかではないからです。データ ワークロードを構成するにはさまざまな方法があり、それぞれに異なるコストの影響があります。十分なコンテキストがなければ、データ ワークロードの目的に基づいて最適な構成を使用しているかどうかを判断することはできません。

データコスト管理の例

たとえば、トランザクション データのクエリという古典的なデータ ユース ケースを考えてみましょう。このタイプのワークロードの場合、データをホストする方法は複数あります。に入れてもいいでしょう データウェアハウスたとえば、さまざまなタイプのデータベースにあります。データのクエリにはさまざまなアプローチもあります。データ ウェアハウジング プラットフォームに組み込まれているクエリ ツールを使用することも (そこにデータを保存する場合)、外部ソリューションを使用することもできます。さまざまなレベルのコンピューティング リソースをクエリに割り当てることもできます。通常、コンピューティングが増えるとクエリが高速化されます。

さて、データ ワークロードがミッション クリティカルである場合、たとえば、製品の推奨事項をリアルタイムで顧客に提供し、収益創出に貢献する予測分析サービスの一部である場合、おそらくそれに多額の費用を費やすことは正当化できるでしょう。 。その場合、クエリを最適化するように設計されたウェアハウスにデータを保存することを選択し、そこに多くのコンピューティング リソースを投入することになるでしょう。

しかし、データ ワークロードがそれほど重要ではない場合はどうなるでしょうか?たとえば、それが企業が定期的に実行する監査プロセスの一部であるものの、結果をリアルタイムで提供する必要がない場合はどうなるでしょうか?その場合、最上位のデータインフラストラクチャにお金を払うことを正当化するのははるかに困難になります。

つまり、クラウド データがコスト的に最適化されているかどうかを判断するには、単に不必要な支出の明らかな例を探すだけでは済みません。また、クラウドがもたらすビジネス成果を考慮すると、クラウド内のデータ ワークロードに費やす費用が合理的かどうかを評価することも重要です。

データ支出の可視化

その評価を行うには、クラウド データ リソースに費やしている金額や、時間の経過とともに支出がどのように変化するかだけではなく、さらに多くのことを知る必要があります。また、その支出がどのような事業目的をサポートしているのか、またどの利害関係者がその支出に責任を負っているのかを知る必要もあります。

この可視性を実現するための基本的なステップは、すべてのデータ関連のクラウド インフラストラクチャに意味のある方法でタグを付けることです。データベース、ブロック ストレージ リソース、オブジェクト ストレージ バケットなどには、それらがどのワークロードに含まれているか、およびそれらの管理の責任者を識別するタグを付ける必要があります。

この情報は、支出の指標と組み合わせることで、支出の急増が正当であるかどうかを判断できるため、非常に重要です。

たとえば、データ クエリに関連するインフラストラクチャ コストの上昇に気付いた場合は、クエリのタグを調べてクエリの目的を特定できます。おそらく、購入時の不正検出をサポートしており、コストの増加は購入量の増加によるものと考えられます。その場合、その費用は正当であると結論付けて、次に進むことができます。

ただし、四半期レポートを作成するために会計部門によってクエリが実行されていることがタグに示されている場合は、代わりにクエリをバッチで実行したり、データを低コストのデータベースに移動したりするなど、クエリのコストを削減する変更を加えることができます。 。その結果、クエリに時間がかかる可能性がありますが、クエリとビジネスの関係を考慮すると、許容できる可能性があります。

データコストを永続的に抑制

長期的には、過剰なデータ支出の事例を特定することで得られる洞察を利用して、クラウド データ コスト管理に対するビジネス全体のアプローチを改善できます。

たとえば、頻繁に過剰支出が発生するのは、関係者がコストへの影響を理解せずに、パフォーマンスを向上させるためにデータ リソースをスケールアップする状況が原因であることに気づくかもしれません。この問題の再発を防ぐには、組織のクラウド ID およびアクセス管理 (IAM) ポリシーをより厳格にして、特定の従業員のみにデータ インフラストラクチャをスケールアップする権限を与えることができます。 

結論: データコストを制御する

クラウド データ ワークロードの費用は高額になる場合もあれば、高額になる場合もあります。また、高額な費用がかかるには十分な理由がある場合もあります。違いを知るには、データ ワークロードとクラウド インフラストラクチャのビジネス コンテキストを詳細に可視化する必要があります。データ支出をビジネスの成果に喩えると、各ワークロードのコストが、そのワークロードがビジネスに生み出す価値に見合ったものであるかどうかを体系的に効果的に判断できます。

スポット画像

最新のインテリジェンス

スポット画像