Logo Zephyrnet

Chạy phân tích chồng chéo đối tượng trong Phòng sạch AWS | Dịch vụ web của Amazon

Ngày:

Các nhà quảng cáo, nhà xuất bản và nhà cung cấp công nghệ quảng cáo đang tích cực tìm kiếm những cách hiệu quả để cộng tác với đối tác của họ nhằm tạo ra thông tin chuyên sâu về tập dữ liệu chung của họ. Một lý do phổ biến để tham gia cộng tác dữ liệu là để chạy phân tích chồng chéo đối tượng, đây là một phân tích phổ biến sẽ chạy khi lập kế hoạch truyền thông và đánh giá các mối quan hệ đối tác mới.

Trong bài đăng này, chúng tôi khám phá phân tích chồng chéo đối tượng là gì, thảo luận về các phương pháp kỹ thuật hiện tại cũng như thách thức của chúng, đồng thời minh họa cách bạn có thể chạy phân tích chồng chéo đối tượng một cách an toàn bằng cách sử dụng Phòng sạch AWS.

Phân tích chồng chéo đối tượng

Chồng chéo đối tượng là tỷ lệ phần trăm người dùng trong đối tượng của bạn cũng có mặt trong một tập dữ liệu khác (được tính bằng số lượng người dùng có mặt trong cả đối tượng của bạn và một tập dữ liệu khác chia cho tổng số người dùng trong đối tượng của bạn). Trong quy trình lập kế hoạch truyền thông kỹ thuật số, việc chồng chéo đối tượng thường được tiến hành để so sánh tập dữ liệu của bên thứ nhất của nhà quảng cáo với tập dữ liệu của đối tác truyền thông (nhà xuất bản). Phân tích giúp xác định số lượng khán giả của nhà quảng cáo có thể được tiếp cận bởi một đối tác truyền thông nhất định. Bằng cách đánh giá mức độ trùng lặp, nhà quảng cáo có thể xác định liệu đối tác truyền thông có cung cấp phạm vi tiếp cận duy nhất hay đối tượng của đối tác truyền thông chủ yếu trùng lặp với đối tượng hiện tại của nhà quảng cáo.

Cách tiếp cận và thách thức hiện tại

Các nhà quảng cáo, nhà xuất bản, nhà cung cấp dữ liệu bên thứ ba và các đơn vị khác thường chia sẻ dữ liệu của họ khi chạy thử nghiệm đối tượng trùng lặp hoặc đối sánh. Các phương pháp chia sẻ dữ liệu phổ biến, chẳng hạn như sử dụng pixel và truyền SFTP, có thể tiềm ẩn rủi ro vì chúng liên quan đến việc di chuyển thông tin nhạy cảm của khách hàng. Việc chia sẻ dữ liệu này với bên khác có thể tốn thời gian và làm tăng nguy cơ vi phạm dữ liệu hoặc truy cập trái phép. Nếu bên nhận xử lý sai dữ liệu, có thể vi phạm các quy định về quyền riêng tư, dẫn đến rủi ro pháp lý. Ngoài ra, bất kỳ hành vi lạm dụng hoặc tiết lộ dữ liệu khách hàng nào đều có thể làm xói mòn lòng tin của người tiêu dùng, dẫn đến tổn hại về danh tiếng và khả năng tổn thất kinh doanh.

Tổng quan về giải pháp

Phòng sạch AWS có thể giúp bạn và đối tác của bạn cộng tác và phân tích tập dữ liệu chung một cách dễ dàng và an toàn mà không cần sao chép dữ liệu cơ bản của nhau. Với Phòng sạch AWS, bạn có thể tạo phòng sạch dữ liệu trong vài phút và cộng tác với các đối tác của mình để tạo ra những hiểu biết độc đáo. Phòng sạch AWS cho phép bạn chạy phân tích chồng chéo đối tượng và tạo ra thông tin chi tiết có giá trị đồng thời tránh rủi ro liên quan đến các phương pháp hiện tại khác.

Sau đây là các khái niệm chính và điều kiện tiên quyết để sử dụng Phòng sạch AWS:

  • Mỗi bên tham gia phân tích (thành viên cộng tác) cần có tài khoản AWS.
  • Một thành viên mời thành viên còn lại tham gia cộng tác Phòng sạch AWS. Việc thành viên nào tạo lời mời không quan trọng. Người tạo cộng tác sử dụng ID tài khoản AWS của người được mời làm thông tin đầu vào để gửi lời mời.
  • Chỉ một thành viên có thể truy vấn trong cộng tác và chỉ một thành viên có thể nhận được kết quả từ cộng tác. Khả năng của mỗi thành viên được xác định khi sự hợp tác được tạo ra.
  • Mỗi thành viên cộng tác lưu trữ các tập dữ liệu ở vị trí tương ứng Dịch vụ lưu trữ đơn giản của Amazon (Amazon S3) và lập danh mục chúng (tạo lược đồ với tên cột và kiểu dữ liệu) trong Keo AWS Danh mục dữ liệu. Bạn cũng có thể tạo định nghĩa Danh mục dữ liệu bằng cách sử dụng amazon Athena tạo cơ sở dữ liệu và tạo các câu lệnh bảng.
  • Cộng tác viên cần có bộ chứa S3 và bảng Danh mục dữ liệu trong cùng Khu vực AWS.
  • Cộng tác viên có thể sử dụng bảng điều khiển, API hoặc AWS SDK của Phòng sạch AWS để thiết lập cộng tác.
  • AWS Clean Rooms cho phép bạn sử dụng bất kỳ cột nào làm khóa tham gia, chẳng hạn như MAID băm, email, địa chỉ IP và RampID.
  • Mỗi thành viên cộng tác liên kết dữ liệu của riêng họ với sự cộng tác.

Hãy xem xét một tình huống trong đó nhà quảng cáo cộng tác với nhà xuất bản để xác định đối tượng chồng chéo. Trong ví dụ này, nhà xuất bản tạo cộng tác, mời nhà quảng cáo và chỉ định nhà quảng cáo là thành viên có thể truy vấn và nhận kết quả.

Điều kiện tiên quyết

Để mời người khác cộng tác, bạn cần có ID tài khoản AWS của họ. Trong trường hợp sử dụng của chúng tôi, nhà xuất bản cần ID tài khoản AWS của nhà quảng cáo.

Tạo sự hợp tác

Trong trường hợp sử dụng của chúng tôi, nhà xuất bản tạo cộng tác bằng bảng điều khiển AWS Clean Rooms và mời nhà quảng cáo.

Để tạo sự cộng tác, hãy hoàn thành các bước sau:

  1. Trên Phòng sạch AWS, bảng điều khiển, chọn Hợp tác trong khung điều hướng.
  2. Chọn Tạo cộng tác.
  3. Trong Họ tên, nhập tên cho sự cộng tác.
  4. Trong tạp chí Các thành viên phần, hãy nhập ID tài khoản AWS của tài khoản bạn muốn mời (trong trường hợp này là nhà quảng cáo).
  5. Trong tạp chí khả năng thành viên phần, hãy chọn thành viên có thể truy vấn và nhận kết quả (trong trường hợp này là nhà quảng cáo).
  6. Trong Ghi nhật ký truy vấn, hãy quyết định xem bạn có muốn bật tính năng ghi nhật ký truy vấn hay không. Các truy vấn được ghi vào amazoncloudwatch.
  7. Trong Điện toán mật mã, hãy quyết định xem bạn có muốn bật hỗ trợ cho tính toán mật mã hay không (mã hóa trước dữ liệu của bạn trước khi liên kết dữ liệu đó). Sau đó, AWS Clean Rooms sẽ chạy các truy vấn trên dữ liệu được mã hóa.
  8. Chọn Sau.Tạo sự hợp tác
  9. trên Định cấu hình thành viên trang, hãy chọn xem bạn muốn tạo tư cách thành viên và cộng tác ngay bây giờ hay tạo cộng tác nhưng kích hoạt tư cách thành viên của bạn sau.
  10. Trong Mặc định cài đặt kết quả truy vấn, chọn xem bạn có muốn giữ cài đặt mặc định để nhận kết quả hay không.
  11. Trong Lưu trữ nhật ký trong Nhật ký Amazon CloudWatch, chỉ định cài đặt nhật ký của bạn.
  12. Chỉ định bất kỳ thẻ nào và ai đang trả tiền cho các truy vấn.
  13. Chọn Sau.
  14. Xem lại cấu hình và chọn tạo cộng tác và thành viên ngay bây giờ hoặc chỉ cộng tác.

Nhà xuất bản gửi lời mời đến nhà quảng cáo. Nhà quảng cáo xem xét cài đặt cộng tác và tạo tư cách thành viên.

Tạo bảng được định cấu hình và đặt quy tắc phân tích

Nhà xuất bản tạo một bảng được định cấu hình từ bảng AWS Glue (biểu thị định nghĩa siêu dữ liệu của dữ liệu S3, bao gồm cả vị trí để AWS Clean Rooms có thể đọc được khi truy vấn được chạy).

Hoàn thành các bước sau:

  1. Trên bảng điều khiển Phòng sạch AWS, chọn bảng cấu hình trong khung điều hướng.
  2. Chọn Định cấu hình bảng mới.
  3. Trong tạp chí Chọn bảng AWS Glue phần, chọn cơ sở dữ liệu và bảng của bạn.
  4. Trong tạp chí Cột được phép cộng tác phần, hãy chọn cột nào trong bảng hiện có để cho phép truy vấn trong cộng tác.
  5. Trong tạp chí Chi tiết bảng được cấu hình phần, nhập tên và mô tả tùy chọn cho bảng được định cấu hình.
  6. Chọn Định cấu hình bảng mới.Tạo bảng được định cấu hình và đặt quy tắc phân tích
  7. Chọn loại quy tắc phân tích phù hợp với loại truy vấn bạn muốn cho phép trên bảng. Để cho phép phân tích tổng hợp, chẳng hạn như tìm quy mô của đối tượng chồng chéo, hãy chọn loại quy tắc phân tích tổng hợp.
  8. Trong tạp chí Chức năng tổng hợp phần, chọn ĐẾM KHÁC BIỆT dưới dạng hàm tổng hợp.
  9. Trong tạp chí Tham gia điều khiển phần này, hãy chọn xem cộng tác viên của bạn có được yêu cầu tham gia bảng với bạn hay không. Vì đây là trường hợp sử dụng chồng chéo đối tượng nên hãy chọn Không, chỉ có thể truy vấn chồng chéo.
  10. Chọn các toán tử để cho phép khớp (đối với ví dụ này, hãy chọn OR).
  11. Trong tạp chí Điều khiển kích thước phần, hãy chọn xem bạn có muốn cung cấp bất kỳ cột nào làm thứ nguyên hay không.
  12. Trong tạp chí Hàm vô hướng hãy chọn xem bạn có muốn giới hạn các hàm vô hướng được phép hay không.
  13. Chọn Sau.Chức năng tổng hợp
  14. Trong tạp chí Ràng buộc tổng hợp phần này, hãy chọn ràng buộc tổng hợp tối thiểu cho bảng đã định cấu hình.

Điều này cho phép bạn lọc ra các hàng không đáp ứng một ngưỡng người dùng tối thiểu nhất định (ví dụ: nếu ngưỡng được đặt thành 10 thì các hàng có tổng số ít hơn 10 người dùng sẽ bị lọc ra).

  1. Chọn Sau.Chỉ định điều khiển kết quả truy vấn
  2. Xem lại cài đặt và tạo bảng.

Liên kết bảng với sự cộng tác

Phòng sạch AWS yêu cầu quyền truy cập để đọc bảng nhằm chạy truy vấn do nhà quảng cáo gửi. Hoàn thành các bước sau để liên kết bảng:

  1. Trên bảng điều khiển AWS Clean Rooms, hãy điều hướng đến phần cộng tác của bạn.
  2. Chọn bảng liên kết.
  3. Trong Tên bảng được cấu hình, chọn tên bảng được cấu hình của bạn.
  4. Trong tạp chí Chi tiết liên kết bảng phần, nhập tên và mô tả tùy chọn cho bảng.
  5. Trong tạp chí Quyền truy cập dịch vụ phần này, bạn có thể chọn sử dụng các cài đặt mặc định để tạo một Quản lý truy cập và nhận dạng AWS (IAM) tự động cho vai trò dịch vụ của Phòng sạch AWS hoặc bạn có thể sử dụng vai trò hiện có. Cần có quyền IAM để tạo hoặc sửa đổi vai trò và chuyển vai trò đó cho Phòng sạch AWS.
  6. Chọn bảng liên kết.Liên kết bảng với sự cộng tác

Nhà quảng cáo cũng hoàn thành các bước được nêu chi tiết trong các phần trước để tạo bảng được định cấu hình và liên kết bảng đó với hoạt động cộng tác.

Chạy truy vấn trong trình soạn thảo truy vấn

Bây giờ nhà quảng cáo có thể điều hướng đến Truy vấn tab dành cho các bảng cộng tác và đánh giá để truy vấn cũng như các quy tắc phân tích của chúng. Bạn có thể chỉ định

nhóm S3 nơi đầu ra của truy vấn chồng chéo sẽ được chuyển tới.

Giờ đây, nhà quảng cáo có thể viết và chạy truy vấn chồng chéo. Bạn có thể sử dụng email đã băm làm khóa tham gia cho truy vấn (bạn có tùy chọn sử dụng bất kỳ cột nào làm khóa tham gia và cũng có thể sử dụng nhiều cột cho nhiều khóa tham gia). Bạn cũng có thể sử dụng tùy chọn không có mã của Trình tạo phân tích để nhờ Phòng sạch AWS thay mặt bạn tạo SQL. Đối với trường hợp sử dụng của chúng tôi, chúng tôi chạy các truy vấn sau:

#Query 1 – count of overlapping users between advertiser and publisher datasets

SELECT COUNT(DISTINCT advertiser.hashed_email)
FROM consumer as advertiser
INNER JOIN impressions as publisher
ON advertiser.hashed_email = publisher.hashed_email

#Query 2 – count of users in advertiser dataset

SELECT COUNT(DISTINCT advertiser.hashed_email)
FROM consumer as advertiser

Chạy truy vấn trong trình soạn thảo truy vấn

Kết quả truy vấn được gửi đến bộ chứa S3 của nhà quảng cáo, như minh họa trong ảnh chụp màn hình sau.

Kết quả truy vấn được gửi đến nhóm S3 của nhà quảng cáo

Làm sạch

Cách tốt nhất là xóa các tài nguyên không còn được sử dụng nữa. Nhà quảng cáo và nhà xuất bản nên dọn sạch các tài nguyên tương ứng của họ:

  • Nhà quảng cáo – Nhà quảng cáo xóa các liên kết bảng và thành viên cộng tác đã định cấu hình của họ. Tuy nhiên, họ không phải xóa bảng đã định cấu hình của mình vì bảng này có thể sử dụng lại được trong các lần cộng tác.
  • Nhà xuất bản – Nhà xuất bản xóa các liên kết bảng đã định cấu hình và sự cộng tác của họ. Họ không phải xóa bảng đã định cấu hình của mình vì bảng này có thể tái sử dụng trong các lần cộng tác.

Kết luận

Trong bài đăng này, chúng tôi đã trình bày cách thiết lập cộng tác chồng chéo đối tượng bằng cách sử dụng Phòng sạch AWS để lập kế hoạch truyền thông và đánh giá quan hệ đối tác bằng cách sử dụng email băm làm khóa liên kết giữa các tập dữ liệu. Các nhà quảng cáo đang ngày càng chuyển sang Phòng sạch AWS để tiến hành phân tích sự chồng chéo về đối tượng với các đối tác truyền thông của họ, hỗ trợ các quyết định đầu tư vào truyền thông của họ. Hơn nữa, sự trùng lặp về đối tượng giúp bạn đẩy nhanh quá trình đánh giá mối quan hệ đối tác của mình bằng cách xác định mức độ trùng lặp mà bạn chia sẻ với các đối tác tiềm năng.

Để tìm hiểu thêm về Phòng sạch AWS, hãy xem video Bắt đầu với Phòng sạch AWSvà tham khảo các tài nguyên bổ sung sau:


Về các tác giả

Ảnh chụp đầu của Eric SacculloEric Saccullo là Giám đốc phát triển kinh doanh cấp cao cho Phòng sạch AWS tại Amazon Web Services. Ông tập trung vào việc giúp khách hàng cộng tác với đối tác của họ theo những cách nâng cao quyền riêng tư để có được thông tin chi tiết và cải thiện kết quả kinh doanh.

Cú đánh đầu của Shamir TannaShamir Tanna là Giám đốc sản phẩm kỹ thuật cấp cao tại Amazon Web Services.

Cú đánh đầu của Ryan MaleckyRyan Malecky là Kiến trúc sư giải pháp cấp cao tại Amazon Web Services. Anh tập trung vào việc giúp khách hàng hiểu rõ hơn về dữ liệu của họ, đặc biệt là với Phòng sạch AWS.

tại chỗ_img

Tin tức mới nhất

tại chỗ_img