AWS CodePipeline を使用して Amazon Kinesis Data Analytics アプリケーションのデプロイとバージョン更新を自動化する

Amazon Kinesis データ分析は、Apache Flink を使用してストリーミングデータをリアルタイムで変換および分析する最も簡単な方法です。顧客はすでに Kinesis Data Analytics を使用して、IoT センサー、変更データキャプチャ (CDC) イベント、ゲーム、ソーシャルメディアなどのデータソースから生成された動きの速いデータに対してリアルタイム分析を実行しています。 ApacheFlink は、ステートフルな計算のための一般的なオープンソースフレームワークおよび分散処理エンジンです。制限のないデータストリームと境界のあるデータストリーム.

Apache Flink アプリケーションの構築は通常、データエンジニアリングチームの責任ですが、展開の自動化とコード (IaC) としてのインフラストラクチャのプロビジョニングは、通常、プラットフォーム (または DevOps) チームが担当します。

以下は、データエンジニアリングの役割の一般的な責任です。

リアルタイム分析 Apache Flink アプリケーションのコードを作成する
アプリケーションの新しいバージョンをロールアウトするか、ロールバックします (たとえば、重大なバグの場合)。

以下は、プラットフォームロールの一般的な責任です。

IaC のコードを書く
クラウドで必要なリソースをプロビジョニングし、それらのアクセスを管理します

この投稿では、Kinesis Data Analytics アプリケーションのデプロイとバージョン更新を自動化し、プラットフォームチームとエンジニアリングチームの両方が効果的にコラボレーションし、最終的なソリューションを共同所有できるようにする方法を示します。 AWS コードパイプライン AWSクラウド開発キット（AWS CDK）。

ソリューションの概要

Kinesis Data Analytics アプリケーションの自動デプロイとバージョン更新を示すために、この記事では次のリアルタイムデータ分析アーキテクチャの例を使用します。

ワークフローには次の手順が含まれます。

An AWSラムダ関数 (データソースとして機能) は、オンデマンドでイベントをプッシュするイベントプロデューサーです。 Amazon Kinesisデータストリーム呼び出されたとき。
Kinesis データストリームは、リアルタイムのイベントを受信して保存します。
Kinesis Data Analytics アプリケーションは、データストリームからイベントを読み取り、リアルタイム分析を実行します。

汎用アーキテクチャ

次の汎用アーキテクチャを参照して、この例を好みの CI/CD ツール (Jenkins など) に適合させることができます。全体的な展開プロセスは、次の XNUMX つの高レベルの部分に分かれています。

インフラストラクチャ CI/CD – この部分はオレンジ色でハイライトされています。インフラストラクチャ CI/CD パイプラインは、すべてのリアルタイムストリーミングアーキテクチャコンポーネントをデプロイする役割を担います。これには、Kinesis Data Analytics アプリケーションや、通常、 AWS CloudFormation.
アプリケーションスタック – この部分は灰色で強調表示されます。アプリケーションスタックは、AWS CloudFormation を使用してインフラストラクチャ CI/CD コンポーネントによってデプロイされます。
アプリケーション CI/CD – この部分は緑色で強調表示されます。アプリケーション CI/CD パイプラインは、Kinesis Data Analytics アプリケーションを次の XNUMX つのステップで更新します。
1. パイプラインは、Kinesis Data Analytics アプリケーションの Java または Python ソースコードをビルドし、アプリケーションをバイナリファイルとして生成します。
2. パイプラインは、最新のバイナリファイルを Amazon シンプルストレージサービス (Amazon S3) Kinesis Data Analytics アプリケーションバイナリファイルが S3 から参照されるため、ビルドが成功した後のアーティファクトバケット。
3. S3 バケットファイル put イベントは Lambda 関数をトリガーし、最新のバイナリをデプロイして Kinesis Data Analytics アプリケーションのバージョンを更新します。

次の図は、このワークフローを示しています。

CodePipeline を使用した CI/CD アーキテクチャ

この投稿では、CodePipeline を使用して汎用アーキテクチャを実装します。次の図は、更新されたアーキテクチャを示しています。

最終的な解決策には、次の手順が含まれます。

プラットフォーム (DevOps) チームとデータエンジニアリングチームは、ソースコードをそれぞれのコードリポジトリにプッシュします。
CodePipeline は、インフラストラクチャ全体を XNUMX つのスタックとしてデプロイします。
1. インフラパイプラインスタック – インフラストラクチャ全体を展開するためのパイプラインが含まれています。
2. アプリケーションパイプラインスタック – Kinesis Data Analytics アプリケーションバイナリを構築およびデプロイするためのパイプラインが含まれています。この投稿では、Java ソースを使用してビルドします。 JavaBuildPipeline AWS CDK コンストラクト。あなたが使用することができます PythonBuildPipeline AWS CDK コンストラクト Python ソースをビルドします。
3. アプリケーションスタック – Lambda (データソース)、Kinesis Data Streams (ストレージ)、Kinesis Data Analytics (Apache Flink アプリケーション) などのリアルタイムデータ分析パイプラインリソースが含まれています。

AWS CDK を使用してリソースをデプロイする

以下 GitHubリポジトリデータパイプラインに必要なすべてのリソースを作成するための AWS CDK コードが含まれています。これにより、手作業によるエラーの可能性がなくなり、効率が向上し、長期にわたって構成の一貫性が確保されます。リソースをデプロイするには、次の手順を実行します。

次のコマンドを使用して、GitHub リポジトリをローカルコンピューターに複製します。

git clone https://github.com/aws-samples/automate-deployment-and-version-update-of-kda-application

ダウンロード最新の Node.js をインストールします。
次のコマンドを実行して、AWS CDK の最新バージョンをインストールします。

npm install -g aws-cdk

ラン cdk bootstrap AWS アカウントで AWS CDK 環境を初期化します。次のコマンドを実行する前に、AWS アカウント ID とリージョンを置き換えてください。

cdk bootstrap aws://123456789012/us-east-1

ブートストラッププロセスの詳細については、次を参照してください。ブートストラッピング.

パート 1: データエンジニアリングチームとプラットフォームチームがソースコードをコードリポジトリにプッシュする

次の図に示すように、データエンジニアリングチームとプラットフォームチームは、それぞれのコードリポジトリで作業を開始します。

この投稿では、複製されたリポジトリのルートフォルダーの下にある XNUMX つの GitHub リポジトリの代わりに、XNUMX つのフォルダーを使用します。

キネシス分析アプリケーション – このフォルダには、Kinesis Data Analytics アプリケーションのサンプルソースコードが含まれています。これは、データエンジニアリングチームによって開発された Kinesis Data Analytics アプリケーションのソースコードを表しています。
インフラストラクチャ-cdk – このフォルダには、必要なすべてのリソースと CodePipeline をプロビジョニングするために使用される最終的なソリューションのサンプル AWS CDK ソースコードが含まれています。このコードを Kinesis Data Analytics アプリケーションのデプロイに再利用できます。

アプリケーション開発チームは通常、アプリケーションのソースコードを git リポジトリに保存します。デモンストレーションの目的で、CodePipeline を Github リポジトリに接続する代わりに、Github からダウンロードした zip ファイルとしてソースコードを使用します。ソースリポジトリを CodePipeline に直接接続することもできます。接続方法の詳細については、を参照してください。 GitHub への接続を作成する.

パート 2: プラットフォームチームがアプリケーションパイプラインをデプロイする

次の図は、ワークフローの次のステップを示しています。

このステップでは、Java ソースコードをビルドするための最初のパイプラインをデプロイします。 kinesis-analytics-application. 次の手順を実行してデプロイします ApplicationPipelineStack:

OS に応じて、ターミナル、bash、またはコマンドウィンドウを開きます。
現在のパスをフォルダーに切り替える infrastructure-cdk.
ラン npm install すべての依存関係をダウンロードします。
ラン cdk deploy ApplicationPipelineStack アプリケーションパイプラインをデプロイします。

このプロセスには約時間がかかります 5 minutes 前の図で緑色で強調表示されている次のリソースを完成させ、AWS アカウントにデプロイします。

のステージを含む CodePipeline AWS コードビルドおよび AWS コードデプロイ
バイナリを保存する S3 バケット
手動承認後に Kinesis Data Analytics アプリケーション JAR を更新する Lambda 関数

アプリケーションパイプラインの自動ビルドをトリガーする

後に cdk deploy コマンドが成功したら、次の手順を完了して、パイプラインを自動的に実行します。

ダウンロードソースコード .zip ファイル.
AWS CloudFormationコンソールで、 スタック ナビゲーションペインに表示されます。
スタックを選択します ApplicationPipelineStack.
ソフトウェア設定ページで、下図のように出力タブで、キーのリンクを選択します ArtifactBucketLink.

S3 アーティファクトバケットにリダイレクトされます。

選択する アップロード.
ダウンロードしたソースコードの .zip ファイルをアップロードします。

最初のパイプラインの実行 (次の図では Auto Build として示されています) は自動的に開始され、約 5 minutes 手動承認段階に到達します。パイプラインはアーティファクトバケットからソースコードを自動的にダウンロードし、Java プロジェクトをビルドします。 kinesis-analytics-application Maven を使用して、出力バイナリ JAR ファイルをディレクトリの下のアーティファクトバケットにパブリッシュします。 jars.

アプリケーションパイプラインの実行を表示する

アプリケーションパイプラインの実行を表示するには、次の手順を実行します。

AWS CloudFormation コンソールで、スタックに移動します ApplicationPipelineStack.
ソフトウェア設定ページで、下図のように出力タブで、キーのリンクを選択します ApplicationCodePipelineLink.

パイプラインの詳細ページにリダイレクトされます。各ステージの各アクションの状態や遷移の状態など、パイプラインの詳細ビューを確認できます。

手動承認段階のビルドはまだ承認しないでください。これは後で行います。

パート 3: プラットフォームチームがインフラストラクチャパイプラインをデプロイする

アプリケーションパイプラインの実行により、次の名前の JAR ファイルが発行されます。 kinesis-analytics-application-final.jar アーティファクトバケットに。次に、Kinesis Data Analytics アーキテクチャをデプロイします。サンプルフローをデプロイするには、次の手順を実行します。

OS に応じて、ターミナル、bash、またはコマンドウィンドウを開きます。
現在のパスをフォルダーに切り替える infrastructure-cdk.
ラン cdk deploy InfraPipelineStack インフラストラクチャパイプラインをデプロイします。

このプロセスには約時間がかかります 5 minutes 次の図で緑色で強調表示されているように、CodeBuild と CodeDeploy のステージを含むパイプラインを完成させ、AWS アカウントにデプロイします。

時 cdk deploy が完了すると、インフラストラクチャパイプラインの実行が自動的に開始され (次の図では Auto Build 1 として示されています)、約 10 minutes アーティファクトバケットからソースコードをダウンロードするには、AWS CDK プロジェクトをビルドします。 infrastructure-stack、およびデプロイ ApplicationStack AWS アカウントに自動的に送信されます。インフラストラクチャパイプラインの実行が完了すると、次のリソースがアカウントにデプロイされます (次の図では緑色で示されています)。

という名前の CloudFormation テンプレート app-ApplicationStack
データソースとして機能する Lambda 関数
ストリームストレージとして機能する Kinesis データストリーム
最初のバージョンの Kinesis Data Analytics アプリケーション kinesis-analytics-application-final.jar

インフラストラクチャパイプラインの実行を表示する

アプリケーションパイプラインの実行を表示するには、次の手順を実行します。

AWS CloudFormation コンソールで、スタックに移動します InfraPipelineStack.
ソフトウェア設定ページで、下図のように出力タブで、キーのリンクを選択します InfraCodePipelineLink.

ステップ 4: データエンジニアリングチームがアプリケーションをデプロイする

これで、データエンジニアリングチームが独立して作業し、Kinesis Data Analytics アプリケーションの新しいバージョンをロールアウトするためのすべてがアカウントに配置されました。アプリケーションパイプラインからそれぞれのアプリケーションビルドを承認して、新しいバージョンのアプリケーションをデプロイできます。次の図は、完全なワークフローを示しています。

ソースコードの変更が検出されると、ビルドプロセスが自動的に開始されます。ソースコードの .zip ファイルを S3 アーティファクトバケットに再アップロードすることで、バージョンの更新をテストできます。実際のユースケースでは、プルリクエストまたは変更のマージによってメインブランチを更新すると、このアクションによって新しいパイプラインの実行が自動的にトリガーされます。

現在のアプリケーションバージョンを表示する

Kinesis Data Analytics アプリケーションの現在のバージョンを表示するには、次の手順を実行します。

AWS CloudFormation コンソールで、スタックに移動します InfraPipelineStack.
ソフトウェア設定ページで、下図のように出力タブで、キーのリンクを選択します KDAApplicationLink.

Kinesis Data Analytics アプリケーションの詳細ページにリダイレクトされます。アプリケーションの現在のバージョンは、以下を参照して確認できます。 バージョン ID.

アプリケーションの展開を承認する

Kinesis Data Analytics アプリケーションのデプロイ (またはバージョンの更新) を承認するには、次の手順を実行します。

AWS CloudFormation コンソールで、スタックに移動します ApplicationPipelineStack.
ソフトウェア設定ページで、下図のように出力タブで、キーのリンクを選択します ApplicationCodePipelineLink.
選択する レビュー パイプラインの承認段階から。
プロンプトが表示されたら、を選択します。承認 Kinesis Data Analytics アプリケーションのデプロイまたはバージョン更新の承認を提供する (オプションでコメントを追加する)。
前述の手順を繰り返して、現在のアプリケーションバージョンを表示します。

で定義されているアプリケーションのバージョンが表示されます。 バージョン ID 次のスクリーンショットに示すように、XNUMX ずつ増加します。

Kinesis Data Analytics アプリケーションの新しいバージョンをデプロイすると、ダウンタイムが約 5 minutes バージョンの更新を担当する Lambda 関数が API 呼び出しを行うためアプリケーションの更新、バージョンの更新後にアプリケーションを再起動します。ただし、アプリケーションは、再起動後に中断したところからストリーム処理を再開します。

クリーンアップ

リソースを削除してコストの発生を防ぐには、次の手順を実行します。

AWS CloudFormation コンソールで、スタックを選択します InfraPipelineStack 選択して削除.
スタックを選択します app-ApplicationStack 選択して削除.
スタックを選択 ApplicationPipelineStack 選択して削除.
Amazon S3 コンソールで、名前がで始まるバケットを選択します。 javaappCodePipeline 選択して空の.
完全に削除と入力して、選択を確認します。
バケットをもう一度選択して、削除.
プロンプトが表示されたらバケット名を入力して、アクションを確認します。
これらの手順を繰り返して、名前がで始まるバケットを削除します infrapipelinestack-pipelineartifactsbucket.

まとめ

この投稿では、CodePipeline と AWS CDK を使用して、Kinesis Data Analytics アプリケーションのデプロイとバージョン更新を自動化する方法を示しました。

詳細については、を参照してください。 CDK パイプラインを使用した継続的な統合と配信 (CI/CD) および CodePipeline チュートリアル.

著者について

アナンドシャー AWS のビッグデータプロトタイピングソリューションアーキテクトです。彼は AWS の顧客とそのエンジニアリングチームと協力して、AWS 分析サービスと専用データベースを使用してプロトタイプを構築しています。 Anand は、可能な技術の芸術を使用して、顧客が最も困難な問題を解決するのを支援します。彼は余暇にビーチを楽しんでいます。

SEO を活用したコンテンツと PR 配信。今日増幅されます。
Platoblockchain。 Web3メタバースインテリジェンス。知識の増幅。こちらからアクセスしてください。
情報源： https://aws.amazon.com/blogs/big-data/automate-deployment-and-version-updates-for-amazon-kinesis-data-analytics-applications-with-aws-codepipeline/

生成的データインテリジェンス

AWS CodePipeline を使用して Amazon Kinesis Data Analytics アプリケーションのデプロイとバージョン更新を自動化する

ソリューションの概要

汎用アーキテクチャ

CodePipeline を使用した CI/CD アーキテクチャ

AWS CDK を使用してリソースをデプロイする

パート 1: データエンジニアリングチームとプラットフォームチームがソースコードをコードリポジトリにプッシュする

パート 2: プラットフォームチームがアプリケーションパイプラインをデプロイする

アプリケーションパイプラインの自動ビルドをトリガーする

アプリケーションパイプラインの実行を表示する

パート 3: プラットフォームチームがインフラストラクチャパイプラインをデプロイする

インフラストラクチャパイプラインの実行を表示する

ステップ 4: データエンジニアリングチームがアプリケーションをデプロイする

現在のアプリケーションバージョンを表示する

アプリケーションの展開を承認する

クリーンアップ

まとめ

著者について

良質なラボグロウンダイヤモンドリングの品質

中国とインドは歴史ある文明であり、お互いの重要な隣人である：中国特使徐飛紅

最新のインテリジェンス

ハイデラバード国際情報技術研究所が半導体分野でマイルストーンを達成

OpenAI、Web検索エンジンGPT-5の噂を軽視

Indiegogo による Orchid Craftworks クラウドファンディングの機会プロジェクトのピッチ

Opstart による Euklis クラウドファンディングの機会プロジェクトのピッチ

投資失敗でホロライド社が破産：「開拓は苦痛を伴う」

統合モデムにより数百万の IoT デバイスが危険にさらされる

AWS CodePipeline を使用して Amazon Kinesis Data Analytics アプリケーションのデプロイとバージョン更新を自動化する

ソリューションの概要

汎用アーキテクチャ

CodePipeline を使用した CI/CD アーキテクチャ

AWS CDK を使用してリソースをデプロイする

パート 1: データ エンジニアリング チームとプラットフォーム チームがソース コードをコード リポジトリにプッシュする

パート 2: プラットフォーム チームがアプリケーション パイプラインをデプロイする

アプリケーション パイプラインの自動ビルドをトリガーする

アプリケーション パイプラインの実行を表示する

パート 3: プラットフォーム チームがインフラストラクチャ パイプラインをデプロイする

インフラストラクチャ パイプラインの実行を表示する

ステップ 4: データ エンジニアリング チームがアプリケーションをデプロイする

現在のアプリケーション バージョンを表示する

アプリケーションの展開を承認する

クリーンアップ

まとめ

著者について

最新のインテリジェンス

パート 1: データエンジニアリングチームとプラットフォームチームがソースコードをコードリポジトリにプッシュする

パート 2: プラットフォームチームがアプリケーションパイプラインをデプロイする

アプリケーションパイプラインの自動ビルドをトリガーする

アプリケーションパイプラインの実行を表示する

パート 3: プラットフォームチームがインフラストラクチャパイプラインをデプロイする

インフラストラクチャパイプラインの実行を表示する

ステップ 4: データエンジニアリングチームがアプリケーションをデプロイする

現在のアプリケーションバージョンを表示する