MENU

AWSエンジニア入門:AWS Lake Formationとは

AWS Lake Formationは安全なデータレイクを比較的簡単にセットアップできるサービスのことです。
データの変換や重複排除などを自動化できます。
この記事ではAWS Lake Formationとはなにか、使用することで企業にどんなメリットがあるのかなどをご紹介します。

AWS Lake Formationとは

AWS Lake Formationとは、安全なデータレイクを数日でセットアップできるサービスのことです。
AWS Lake Formationを使用すれば、データの移動や保管、クリーニングなどを素早く行えます。
ターゲットのS3とデータベースを指定すれば、データレイクに最適化したデータファイルに変換してくれます。
さらにデータの変換や重複排除などを自動で行ってくれる機能があり、アクセスコントロールやアクセス状況を簡単に確認できます。

AWS Lake Formationの価格

AWS Lake Formationを利用するには追加料金が必要ありません。
AWS Lake Formationの利用価格は、AWS Glue、Amazon S3、 Amazon EMRなど他のサービスの価格に基づいて適用されます。
Amazon S3に保存されるデータレイク構築や管理するのに役立ちます。
またAmazon Cloudtrail、AWS IAM、Amazon CloudWatch、Amazon Athenaなど他のAWSのサービスと統合も可能です。

エンジニアがAWS Lake Formationを使用するメリット

エンジニアがAWS Lake Formationを使用するメリットは主に3つあります。

セキュリティ管理を簡素化できる

AWS Lake Formationはデータに対してS3の暗号化機能が使われています。
この暗号化機能によって、KMSで管理されるキーによるサーバー側暗号を提供できます。
さらにS3ではリージョン間のレプリケーション時に転送されるデータを暗号化してくれます。
またセキュリティ、ガバナンス、監査のポリシーを1ヵ所で定義するため、それらのポリシーをアプリケーション全体に適用可能です。

データにセルフサービスアクセスを提供できる

AWS Lake Formationではデータ所有者をカスタム属性として追加し、指定することが可能です。
また所有者は適切な使用を定義するビジネスメタデータで、技術的なメタデータを強化することもできます。
またセキュリティとアクセス制御を利用すれば、機密性を強化するラベルを付けられます。
さらにデータセットとアクセスのリクエスト提供を容易にしてくれます。
さまざまな分析ユースケース用のセルフサービスアクセスを提供してくれるのが特徴です。
また同じデータカタログを複数のアカウントやグループ、サービスで利用することが可能です。

データレイクの構築が簡単にできる

これまでデータレイクの構築は非常に煩雑なものでした。
しかしAWS Lake Formationを利用すれば比較的簡単にデータレイク構築ができます。
またデータレイクの構築だけでなく保護や管理もできるので、ぜひ導入を検討してみてはいかがでしょうか。