Logo Zephyrnet

Tăng tốc sử dụng dữ liệu bảo mật Amazon Redshift với Satori – Phần 1 | Dịch vụ web của Amazon

Ngày:

Bài đăng này được đồng viết bởi Lisa Levy, Chuyên gia nội dung tại Satori.

Dân chủ hóa dữ liệu cho phép người dùng khám phá và truy cập dữ liệu nhanh hơn, cải thiện các quyết định dựa trên dữ liệu sáng suốt và sử dụng dữ liệu để tạo ra tác động kinh doanh. Nó cũng tăng cường sự hợp tác giữa các nhóm và tổ chức, phá vỡ các kho dữ liệu và cho phép các nhóm đa chức năng làm việc cùng nhau hiệu quả hơn.

Rào cản đáng kể đối với việc dân chủ hóa dữ liệu là đảm bảo rằng dữ liệu vẫn an toàn và tuân thủ. Khả năng tìm kiếm, định vị và che giấu dữ liệu nhạy cảm là rất quan trọng đối với quá trình dân chủ hóa dữ liệu. Amazon RedShift cung cấp nhiều tính năng như kiểm soát truy cập dựa trên vai trò (RBAC), bảo mật cấp hàng (RLS), bảo mật cấp cột (CLS) và che giấu dữ liệu động để tạo điều kiện thuận lợi cho việc sử dụng dữ liệu một cách an toàn.

Trong loạt bài gồm hai phần này, chúng ta khám phá cách Satori, đối tác Amazon Redshift Ready, có thể giúp người dùng Amazon Redshift tự động hóa quyền truy cập an toàn vào dữ liệu và cung cấp cho người dùng dữ liệu của họ quyền truy cập dữ liệu tự phục vụ. Satori tích hợp nguyên bản với cả cụm được cung cấp Amazon Redshift và Amazon Redshift không có máy chủ để dễ dàng thiết lập kho dữ liệu Amazon Redshift của bạn trong cổng Satori an toàn.

Trong phần 1, chúng tôi cung cấp các bước chi tiết về cách tích hợp Satori với kho dữ liệu Amazon Redshift của bạn và kiểm soát cách truy cập dữ liệu bằng chính sách bảo mật.

Trong phần 2, chúng ta sẽ khám phá cách thiết lập quyền truy cập dữ liệu tự phục vụ bằng Satori vào dữ liệu được lưu trữ trong Amazon Redshift.

Nền tảng bảo mật dữ liệu của Satori

Satori là một nền tảng bảo mật dữ liệu cho phép người dùng truy cập tự phục vụ dễ dàng với tính năng bảo mật tích hợp. Satori tăng tốc việc triển khai các biện pháp kiểm soát bảo mật dữ liệu trên kho dữ liệu như Amazon Redshift, tích hợp đơn giản và không yêu cầu bất kỳ thay đổi nào đối với dữ liệu, lược đồ Amazon Redshift hoặc cách người dùng của bạn tương tác với dữ liệu.

Việc tích hợp Satori với Amazon Redshift giúp tăng tốc khả năng sử dụng dữ liệu của tổ chức để tạo ra giá trị kinh doanh. Thời gian tạo ra giá trị nhanh hơn này đạt được bằng cách cho phép các công ty quản lý việc truy cập dữ liệu một cách hiệu quả và năng suất hơn.

Bằng cách sử dụng Satori với Kiến trúc dữ liệu hiện đại trên AWS, bạn có thể tìm và có quyền truy cập vào dữ liệu bằng cổng dữ liệu được cá nhân hóa và các công ty có thể đặt ra các chính sách như quyền truy cập dữ liệu kịp thời và kiểm soát quyền truy cập chi tiết. Ngoài ra, tất cả quyền truy cập dữ liệu đều được kiểm tra. Satori hoạt động liền mạch với các đối tượng Redshift gốc, các bảng bên ngoài có thể được truy vấn thông qua Quang phổ dịch chuyển đỏ Amazon, cũng đối tượng cơ sở dữ liệu dùng chung thông qua chia sẻ dữ liệu Redshift.

Satori ẩn danh dữ liệu một cách nhanh chóng, dựa trên yêu cầu của bạn, theo người dùng, vai trò và bộ dữ liệu. Việc tạo mặt nạ được áp dụng bất kể cơ sở dữ liệu cơ bản và không yêu cầu viết mã hay thực hiện thay đổi đối với cơ sở dữ liệu, kho dữ liệu và hồ dữ liệu của bạn. Satori liên tục giám sát việc truy cập dữ liệu, xác định vị trí của từng tập dữ liệu và phân loại dữ liệu trong từng cột. Kết quả là một kho dữ liệu tự điền, cũng phân loại dữ liệu cho bạn và cho phép bạn thêm các phân loại tùy chỉnh của riêng mình.

Ngộ hòa nhập với nhà cung cấp danh tính để làm phong phú bối cảnh nhận dạng của nó và cung cấp các phân tích tốt hơn cũng như các chính sách kiểm soát truy cập chính xác hơn. Satori tương tác với các nhà cung cấp danh tính thông qua API hoặc bằng giao thức SAML. Satori cũng tích hợp với kinh doanh thông minh (BI) các công cụ như Amazon QuickSight, Tableau, Power BI, v.v. để giám sát và thực thi các chính sách bảo mật và quyền riêng tư cho người tiêu dùng dữ liệu sử dụng công cụ BI để truy cập dữ liệu.

Trong bài đăng này, chúng tôi khám phá cách các tổ chức có thể tăng tốc việc sử dụng dữ liệu an toàn trong Amazon Redshift với Satori, bao gồm các lợi ích của việc tích hợp và các bước cần thiết để bắt đầu. Chúng ta sẽ xem qua một ví dụ về tích hợp Satori với cụm Redshift và xem cách các chính sách bảo mật được áp dụng linh hoạt khi được truy vấn thông qua DBeaver.

Điều kiện tiên quyết

Bạn nên có các điều kiện tiên quyết sau:

  • Một tài khoản AWS.
  • Cụm Redshift và điểm cuối Redshift Severless để lưu trữ và quản lý dữ liệu. Bạn có thể tạo và quản lý cụm của mình thông qua Bảng điều khiển quản lý AWS, Giao diện dòng lệnh AWS (AWS CLI) hoặc API Redshift.
  • Tài khoản Satori và trình kết nối Satori cho Amazon Redshift.
  • Một nhóm bảo mật Redshift. Bạn sẽ cần định cấu hình nhóm bảo mật Redshift của mình để cho phép lưu lượng truy cập vào từ trình kết nối Satori cho Amazon Redshift. Lưu ý rằng Satori có thể được triển khai dưới dạng bộ điều khiển truy cập dữ liệu phần mềm dưới dạng dịch vụ (SaaS) hoặc trong VPC của bạn.

Chuẩn bị dữ liệu

Để thiết lập ví dụ của chúng tôi, hãy hoàn thành các bước sau:

  1. Trên bảng điều khiển Amazon Redshift, điều hướng đến Trình chỉnh sửa truy vấn v2.

Nếu bạn quen thuộc với Sổ tay SQL, Bạn có thể tải xuống sổ ghi chép SQL này cho phần trình diễn và nhập nó để nhanh chóng bắt đầu.

  1. Trong Cụm được cung cấp Amazon Redshift, hãy sử dụng mã sau đây để tạo bảng, điền dữ liệu vào bảng và tạo vai trò cũng như người dùng:
-- 1- Create Schema
create schema if not exists customer_schema; -- 2- Create customer and credit_cards table
CREATE TABLE customer_schema.credit_cards (
customer_id INT,
name TEXT,
is_fraud BOOLEAN,
credit_card TEXT
); create table customer_schema.customer (
id INT,
first_name TEXT,
last_name TEXT,
email TEXT,
gender TEXT,
ssn TEXT
); -- 3- Populate the tables with sample data
INSERT INTO customer_schema.credit_cards
VALUES
(100,'John Smith','n', '4532109867542837'),
(101,'Jane Doe','y', '4716065243786267'),
(102,'Mahendra Singh','n', '5243111024532276'),
(103,'Adaku Zerhouni','n', '6011011238764578'),
(104,'Miguel Salazar','n', '6011290347689234'),
(105,'Jack Docket','n', '3736165700234635'); INSERT INTO customer_schema.customer VALUES
(1,'Yorke','Khomishin','ykhomishin0@wikipedia.org','Male','866-95-2246'),
(2,'Tedd','Donwell','tdonwell1@i2i.jp','Male','726-62-3033'),
(3,'Lucien','Keppe','lkeppe2@pinterest.com','Male','865-28-6322'),
(4,'Hester','Arnefield','harnefield3@senate.gov','Female','133-72-9078'),
(5,'Abigale','Bertouloume','abertouloume4@amazon.de','Female','780-69-6814'),
(6,'Larissa','Bremen','lbremen5@vk.com','Female','121-78-7749'); -- 4- GRANT SELECT permissions on the table
GRANT SELECT ON customer_schema.credit_cards TO PUBLIC;
GRANT SELECT ON customer_schema.customer TO PUBLIC; -- 5- create roles
CREATE ROLE customer_service_role;
CREATE ROLE auditor_role;
CREATE ROLE developer_role;
CREATE ROLE datasteward_role; -- 6- create four users
CREATE USER Jack WITH PASSWORD '1234Test!';
CREATE USER Kim WITH PASSWORD '1234Test!';
CREATE USER Mike WITH PASSWORD '1234Test!';
CREATE USER Sarah WITH PASSWORD '1234Test!'; -- 7- Grant roles to above users
GRANT ROLE customer_service_role TO Jack;
GRANT ROLE auditor_role TO Kim;
GRANT ROLE developer_role TO Mike;
GRANT ROLE datasteward_role TO Sarah;

  1. Nhận không gian tên cho cụm được cung cấp Redshift và điểm cuối Redshift Serverless

Kết nối với cụm được cung cấp thông qua Trình soạn thảo truy vấn V2 và chạy SQL sau:

select current_namespace; -- (Save as <producer_namespace>)

Lặp lại bước trên cho điểm cuối Redshift Serverless và nhận không gian tên:

select current_namespace; -- (Save as <consumer_namespace>

  1. Kết nối với cụm được cung cấp Redshift và tạo chia sẻ dữ liệu đi (nhà sản xuất) bằng SQL sau
-- Creating a datashare CREATE DATASHARE cust_share SET PUBLICACCESSIBLE TRUE; -- Adding schema to datashare ALTER DATASHARE cust_share ADD SCHEMA customer_schema; -- Adding customer table to datshares. We can add all the tables also if required ALTER DATASHARE cust_share ADD TABLE customer_schema.credit_cards; GRANT USAGE ON DATASHARE cust_share TO NAMESPACE '<consumer_namespace>'; -- (replace with consumer namespace created in prerequisites 4)

  1. Kết nối với điểm cuối Redshift Serverless và thực hiện các câu lệnh bên dưới để thiết lập chia sẻ dữ liệu gửi đến.
CREATE DATABASE cust_db FROM DATASHARE cust_share OF NAMESPACE '< producer_namespace >'; -- (replace with producer namespace created in prerequisites 4)

  1. Tùy chọn, tạo bảng credit_cards dưới dạng bảng bên ngoài bằng cách sử dụng bảng này tập tin mẫu trong Amazon S3 và thêm bảng vào Danh mục dữ liệu keo AWS thông qua Trình thu thập keo. Sau khi bảng có sẵn trong Danh mục dữ liệu Glue, bạn có thể tạo lược đồ bên ngoài trong điểm cuối Amazon Redshift Serverless của mình bằng cách sử dụng SQL bên dưới
CREATE external SCHEMA satori_external FROM data catalog DATABASE 'satoriblog' IAM_ROLE default CREATE external DATABASE if not exists; Verify that the external table credit_cards is available from your Redshift Serverless endpoint select * from satori_external.credit_cards ;

Kết nối với Amazon Redshift

Nếu bạn chưa có tài khoản Satori, bạn có thể tạo tài khoản lái thử or nhận Satori từ AWS Marketplace. Sau đó hoàn tất các bước sau để kết nối với Amazon Redshift:

  1. Đăng nhập vào Satori.
  2. Chọn Kho dữ liệu trong ngăn điều hướng, chọn Thêm kho dữ liệu, và lựa chọn Amazon RedShift.

Kho dữ liệuSetup001

  1. Thêm mã định danh cụm của bạn từ bảng điều khiển Amazon Redshift. Satori sẽ tự động phát hiện Khu vực nơi cụm của bạn nằm trong tài khoản AWS của bạn.
  2. Satori sẽ tạo tên máy chủ Satori cho cụm của bạn mà bạn sẽ sử dụng để kết nối với cụm Redshift của mình
  3. Trong phần trình diễn này, chúng tôi sẽ thêm một cụm được cung cấp Redshift và điểm cuối Redshift Serverless để tạo hai kho dữ liệu trong Satori

Kho dữ liệu được cung cấp003

Kho dữ liệu Serverless002

  1. Cho phép truy cập vào đối với các địa chỉ IP Satori được liệt kê trong nhóm bảo mật cụm Redshift của bạn.

Để biết thêm chi tiết về cách kết nối Satori với cụm Redshift của bạn, hãy tham khảo Thêm kho dữ liệu AWS Redshift vào Satori.

  1. Theo Cài đặt xác thực, hãy nhập thông tin đăng nhập gốc hoặc siêu người dùng của bạn cho mỗi kho dữ liệu.

Xác thựcCài đặt004

  1. Để các tab còn lại với cài đặt mặc định và chọn Lưu.

Bây giờ kho dữ liệu của bạn đã sẵn sàng để truy cập thông qua Satori.

Tạo tập dữ liệu

Hoàn thành các bước sau để tạo tập dữ liệu:

  1. Chọn Bộ dữ liệu trong ngăn điều hướng và chọn Thêm tập dữ liệu mới.
  2. Chọn kho dữ liệu của bạn và nhập chi tiết về tập dữ liệu của bạn.

Bộ dữ liệu khách hàng005

Tập dữ liệu có thể là tập hợp các đối tượng cơ sở dữ liệu mà bạn phân loại thành tập dữ liệu. Đối với cụm được cung cấp Redshift, chúng tôi đã tạo một tập dữ liệu khách hàng chứa thông tin chi tiết về cơ sở dữ liệu và lược đồ. Bạn cũng có thể tùy ý chọn tập trung vào một bảng cụ thể trong lược đồ hoặc thậm chí loại trừ các lược đồ hoặc bảng nhất định khỏi tập dữ liệu.

Đối với Redshift Serverless, chúng tôi đã tạo một tập dữ liệu với tất cả các vị trí kho dữ liệu để bao gồm bảng dùng chung và bảng Bên ngoài

ServerlessDataset006

  1. Chọn Lưu.
  1. Đối với mỗi tập dữ liệu, hãy điều hướng đến Quy tắc truy cập của người dùng và tạo chính sách truy cập của người dùng tập dữ liệu cho các vai trò chúng tôi đã tạo.

Người dùngAccessRoles007

  1. Kích hoạt tính năng Trao cho Satori quyền kiểm soát quyền truy cập vào tập dữ liệu.
  2. Theo tùy chọn, bạn có thể thêm cấu hình thời gian hết hạn và thu hồi vào chính sách truy cập để giới hạn thời gian cấp quyền truy cập cho cụm Redshift.

Tạo chính sách bảo mật cho tập dữ liệu

Satori cung cấp nhiều mẫu hồ sơ mặt nạ mà bạn có thể sử dụng làm đường cơ sở và tùy chỉnh trước khi thêm chúng vào chính sách bảo mật của mình. Hoàn thành các bước sau để tạo chính sách bảo mật của bạn:

  1. Chọn Hồ sơ che giấu trong ngăn điều hướng và sử dụng Chính sách hạn chế mẫu để tạo chính sách che giấu.

MaskingProfiles008

  1. Cung cấp tên mô tả cho chính sách.
  2. Bạn có thể tùy chỉnh thêm chính sách để thêm các trường tùy chỉnh và chính sách ẩn tương ứng của chúng. Ví dụ sau đây hiển thị trường bổ sung Số Thẻ Tín Dụng đã được thêm vào hành động để che giấu mọi thứ trừ bốn ký tự cuối cùng.

  1. Chọn Chính sách bảo mật trong ngăn điều hướng và tạo chính sách bảo mật có tên Chính sách bảo mật dữ liệu khách hàng.

  1. Liên kết chính sách với hồ sơ mặt nạ được tạo ở bước trước.

  1. Liên kết chính sách bảo mật đã tạo với tập dữ liệu bằng cách chỉnh sửa tập dữ liệu và điều hướng đến Chính sách bảo mật tab.

Bây giờ, các điều khiển tích hợp, chính sách và quyền truy cập đã được đặt, hãy truy vấn dữ liệu thông qua DBeaver.

Truy vấn dữ liệu an toàn

Để truy vấn dữ liệu của bạn, hãy kết nối với cụm Redshift và điểm cuối Redshift Serverless bằng tên máy chủ Satori tương ứng đã có được trước đó.

Khi truy vấn dữ liệu trong cụm được cung cấp Redshift, bạn sẽ thấy các chính sách bảo mật được áp dụng cho tập kết quả khi chạy.

Khi truy vấn dữ liệu trong điểm cuối Redshift Serverless, bạn sẽ thấy các chính sách bảo mật được áp dụng cho bảng credit_cards được chia sẻ từ cụm được cung cấp Redshift.

Bạn sẽ nhận được kết quả tương tự khi áp dụng các chính sách nếu truy vấn bảng bên ngoài trong Amazon S3 từ điểm cuối Redshift Serverless

Tổng kết

Trong bài đăng này, chúng tôi đã mô tả cách Satori có thể giúp bạn truy cập dữ liệu an toàn từ cụm Redshift mà không yêu cầu bất kỳ thay đổi nào đối với dữ liệu, lược đồ Redshift hoặc cách người dùng của bạn tương tác với dữ liệu. Trong phần 2, chúng ta sẽ khám phá cách thiết lập quyền truy cập dữ liệu tự phục vụ vào dữ liệu được lưu trữ trong Amazon Redshift với các vai trò khác nhau mà chúng tôi đã tạo trong quá trình thiết lập ban đầu.

Satori có sẵn trên Thị trường AWS. Để tìm hiểu thêm, hãy bắt đầu một dùng thử miễn phí or yêu cầu một cuộc họp demo.


Giới thiệu về tác giả

Jagadish Kumar là Kiến trúc sư giải pháp chuyên gia phân tích cấp cao tại AWS tập trung vào Amazon Redshift. Anh ấy rất đam mê Kiến trúc dữ liệu và giúp khách hàng xây dựng các giải pháp phân tích trên quy mô lớn trên AWS.

LisaLevyLisa Levy là Chuyên gia nội dung tại Satori. Cô xuất bản nội dung giàu thông tin để mô tả một cách hiệu quả cách nền tảng bảo mật dữ liệu của Satori nâng cao năng suất của tổ chức.

tại chỗ_img

Tin tức mới nhất

tại chỗ_img