Logo Zephyrnet

Các phương pháp hay nhất để xây dựng ứng dụng bảo mật với Amazon Transcribe | Dịch vụ web của Amazon

Ngày:

Phiên âm Amazon là dịch vụ AWS cho phép khách hàng chuyển đổi giọng nói thành văn bản ở chế độ hàng loạt hoặc truyền phát. Nó sử dụng tính năng nhận dạng giọng nói tự động (ASR) được hỗ trợ bởi máy học, nhận dạng ngôn ngữ tự động và công nghệ xử lý hậu kỳ. Amazon Transcribe có thể được sử dụng để ghi lại các cuộc gọi chăm sóc khách hàng, cuộc gọi hội nghị nhiều bên và tin nhắn thư thoại cũng như tạo phụ đề cho video được ghi và video trực tiếp, chỉ kể một vài ví dụ. Trong bài đăng blog này, bạn sẽ tìm hiểu cách hỗ trợ các ứng dụng của mình bằng khả năng của Amazon Transcribe theo cách đáp ứng các yêu cầu bảo mật của bạn.

Một số khách hàng ủy thác cho Amazon Transcribe dữ liệu bí mật và độc quyền của doanh nghiệp họ. Trong các trường hợp khác, nội dung âm thanh do Amazon Transcribe xử lý có thể chứa dữ liệu nhạy cảm cần được bảo vệ để tuân thủ luật pháp và quy định của địa phương. Ví dụ về những thông tin đó là thông tin nhận dạng cá nhân (PII), thông tin sức khỏe cá nhân (PHI) và dữ liệu ngành thẻ thanh toán (PCI). Trong các phần sau của blog, chúng tôi đề cập đến các cơ chế khác nhau mà Amazon Transcribe phải có để bảo vệ dữ liệu khách hàng cả trong quá trình truyền và khi lưu trữ. Chúng tôi chia sẻ bảy biện pháp bảo mật tốt nhất sau đây để xây dựng ứng dụng với Amazon Transcribe đáp ứng các yêu cầu về bảo mật và tuân thủ của bạn:

  1. Sử dụng tính năng bảo vệ dữ liệu với Amazon Transcribe
  2. Giao tiếp qua đường dẫn mạng riêng
  3. Biên tập lại dữ liệu nhạy cảm nếu cần
  4. Sử dụng vai trò IAM cho các ứng dụng và dịch vụ AWS yêu cầu quyền truy cập Amazon Transcribe
  5. Sử dụng kiểm soát truy cập dựa trên thẻ
  6. Sử dụng các công cụ giám sát AWS
  7. Kích hoạt cấu hình AWS

Các phương pháp hay nhất sau đây là những nguyên tắc chung và không phải là giải pháp bảo mật hoàn chỉnh. Vì những phương pháp thực hành tốt nhất này có thể không phù hợp hoặc không đủ cho môi trường của bạn nên hãy sử dụng chúng như những cân nhắc hữu ích thay vì chỉ định.

Cách thực hành tốt nhất 1 – Sử dụng tính năng bảo vệ dữ liệu với Amazon Transcribe

Amazon Transcribe tuân thủ các Mô hình chia sẻ trách nhiệm AWS, phân biệt trách nhiệm của AWS về bảo mật đám mây với trách nhiệm của khách hàng về bảo mật trên đám mây.

AWS chịu trách nhiệm bảo vệ cơ sở hạ tầng toàn cầu chạy trên toàn bộ Đám mây AWS. Với tư cách là khách hàng, bạn có trách nhiệm duy trì quyền kiểm soát nội dung của mình được lưu trữ trên cơ sở hạ tầng này. Nội dung này bao gồm các tác vụ quản lý và cấu hình bảo mật cho các dịch vụ AWS mà bạn sử dụng. Để biết thêm thông tin về quyền riêng tư dữ liệu, hãy xem Hỏi đáp về quyền riêng tư dữ liệu.

Bảo vệ dữ liệu trong quá trình chuyển tiếp

Mã hóa dữ liệu được sử dụng để đảm bảo rằng hoạt động giao tiếp dữ liệu giữa ứng dụng của bạn và Amazon Transcribe luôn được giữ bí mật. Việc sử dụng các thuật toán mã hóa mạnh sẽ bảo vệ dữ liệu trong khi nó được truyền đi.

Amazon Transcribe có thể hoạt động ở một trong hai chế độ:

  • Truyền trực tuyến bản chép lời cho phép sao chép luồng phương tiện trong thời gian thực
  • Công việc phiên âm hàng loạt cho phép sao chép các tệp âm thanh bằng các công việc không đồng bộ.

Ở chế độ phiên âm trực tuyến, các ứng dụng khách sẽ mở kết nối phát trực tuyến hai chiều qua HTTP/2 hoặc WebSockets. Một ứng dụng gửi luồng âm thanh tới Amazon Transcribe và dịch vụ sẽ phản hồi bằng luồng văn bản trong thời gian thực. Cả kết nối phát trực tuyến HTTP/2 và WebSockets đều được thiết lập qua Bảo mật lớp vận chuyển (TLS), đây là một giao thức mã hóa được chấp nhận rộng rãi. TLS cung cấp khả năng xác thực và mã hóa dữ liệu khi truyền bằng chứng chỉ AWS. Chúng tôi khuyên bạn nên sử dụng TLS 1.2 trở lên.

Ở chế độ sao chép hàng loạt, trước tiên, tệp âm thanh cần được đặt ở định dạng Dịch vụ lưu trữ đơn giản của Amazon (Amazon S3) Gầu múc. Sau đó, công việc sao chép hàng loạt tham chiếu URI S3 của tệp này sẽ được tạo trong Amazon Transcribe. Cả Amazon Transcribe ở chế độ hàng loạt và Amazon S3 đều sử dụng HTTP/1.1 qua TLS để bảo vệ dữ liệu trong quá trình truyền.

Tất cả các yêu cầu tới Amazon Transcribe qua HTTP và WebSockets phải được xác thực bằng cách sử dụng AWS Signature phiên bản 4. Bạn cũng nên sử dụng Chữ ký phiên bản 4 để xác thực các yêu cầu HTTP tới Amazon S3, mặc dù xác thực bằng phiên bản cũ hơn Chữ ký phiên bản 2 cũng có thể thực hiện được ở một số Khu vực AWS. Ứng dụng phải có thông tin xác thực hợp lệ để ký các yêu cầu API tới dịch vụ AWS.

Bảo vệ dữ liệu ở trạng thái nghỉ ngơi

Amazon Transcribe ở chế độ hàng loạt sử dụng bộ chứa S3 để lưu trữ cả tệp âm thanh đầu vào và tệp chép lời đầu ra. Khách hàng sử dụng bộ chứa S3 để lưu trữ tệp âm thanh đầu vào và chúng tôi khuyên bạn nên bật mã hóa trên bộ chứa này. Amazon Transcribe hỗ trợ các phương thức mã hóa S3 sau:

Cả hai phương pháp đều mã hóa dữ liệu khách hàng khi dữ liệu được ghi vào đĩa và giải mã dữ liệu đó khi bạn truy cập bằng một trong những bộ mã hóa khối mạnh nhất hiện có: GCM Tiêu chuẩn mã hóa nâng cao 256-bit (AES-256). Khi sử dụng SSE-S3, các khóa mã hóa được quản lý và được luân chuyển thường xuyên bởi dịch vụ Amazon S3. Để tăng cường bảo mật và tuân thủ, SSE-KMS cung cấp cho khách hàng quyền kiểm soát các khóa mã hóa thông qua Dịch vụ quản lý khóa AWS (AWS KMS). AWS KMS cung cấp các biện pháp kiểm soát truy cập bổ sung vì bạn phải có quyền sử dụng khóa KMS thích hợp để mã hóa và giải mã các đối tượng trong bộ chứa S3 được định cấu hình bằng SSE-KMS. Ngoài ra, SSE-KMS còn cung cấp cho khách hàng khả năng theo dõi kiểm tra để lưu giữ hồ sơ về ai đã sử dụng khóa KMS của bạn và khi nào.

Bản ghi đầu ra có thể được lưu trữ trong cùng một bộ chứa S3 hoặc trong bộ chứa S3 khác do khách hàng sở hữu. Trong trường hợp này, các tùy chọn mã hóa SSE-S3 và SSE-KMS tương tự sẽ được áp dụng. Một tùy chọn khác cho đầu ra của Amazon Transcribe ở chế độ hàng loạt là sử dụng bộ chứa S3 do dịch vụ quản lý. Sau đó, dữ liệu đầu ra sẽ được đưa vào vùng lưu trữ SXNUMX an toàn do dịch vụ Amazon Transcribe quản lý và bạn được cung cấp một URI tạm thời có thể dùng để tải xuống bản ghi của mình.

Amazon Transcribe sử dụng mã hóa Cửa hàng khối đàn hồi Amazon (Amazon EBS) khối lượng để lưu trữ tạm thời dữ liệu khách hàng trong quá trình xử lý phương tiện. Dữ liệu khách hàng được làm sạch cho cả trường hợp hoàn thành và lỗi.

Cách thực hành tốt nhất 2 – Giao tiếp qua đường dẫn mạng riêng

Nhiều khách hàng dựa vào mã hóa trong quá trình truyền tải để liên lạc an toàn với Amazon Transcribe qua Internet. Tuy nhiên, đối với một số ứng dụng, mã hóa dữ liệu khi truyền có thể không đủ để đáp ứng các yêu cầu bảo mật. Trong một số trường hợp, dữ liệu được yêu cầu không được truyền qua các mạng công cộng như internet. Ngoài ra, có thể có yêu cầu triển khai ứng dụng trong môi trường riêng tư không được kết nối với internet. Để đáp ứng các yêu cầu này, hãy sử dụng giao diện điểm cuối VPC được hỗ trợ bởi Liên kết riêng AWS.

Sơ đồ kiến ​​trúc sau đây thể hiện một trường hợp sử dụng trong đó một ứng dụng được triển khai trên Amazon EC2. Phiên bản EC2 đang chạy ứng dụng không có quyền truy cập Internet và đang liên lạc với Amazon Transcribe và Amazon S3 thông qua các điểm cuối giao diện VPC.

Một phiên bản EC2 bên trong VPC đang giao tiếp với các dịch vụ Amazon Transcribe và Amazon S3 trong cùng khu vực thông qua các điểm cuối giao diện VPC.

Trong một số trường hợp, ứng dụng đang liên lạc với Amazon Transcribe có thể được triển khai trong trung tâm dữ liệu tại chỗ. Có thể có các yêu cầu tuân thủ hoặc bảo mật bổ sung bắt buộc dữ liệu được trao đổi với Amazon Transcribe không được truyền qua các mạng công cộng như internet. Trong trường hợp này, kết nối riêng thông qua Kết nối trực tiếp AWS có thể được sử dụng. Sơ đồ sau đây minh họa kiến ​​trúc cho phép ứng dụng tại chỗ giao tiếp với Amazon Transcribe mà không cần kết nối Internet.

Trung tâm dữ liệu doanh nghiệp có máy chủ ứng dụng được kết nối với đám mây AWS thông qua AWS Direct Connect. Máy chủ ứng dụng tại chỗ đang liên lạc với các dịch vụ Amazon Transcribe và Amazon S3 thông qua AWS Direct Connect, sau đó kết nối các điểm cuối VPC.

Cách thực hành tốt nhất 3 – Biên tập lại dữ liệu nhạy cảm nếu cần

Một số trường hợp sử dụng và môi trường quy định có thể yêu cầu xóa dữ liệu nhạy cảm khỏi bản ghi và tệp âm thanh. Amazon Transcribe hỗ trợ xác định và biên tập thông tin nhận dạng cá nhân (PII) như tên, địa chỉ, số An sinh xã hội, v.v. Khả năng này có thể được sử dụng để giúp khách hàng đạt được sự tuân thủ của ngành thẻ thanh toán (PCI) bằng cách điều chỉnh lại PII như số thẻ tín dụng hoặc thẻ ghi nợ, ngày hết hạn và mã xác minh thẻ gồm ba chữ số (CVV). Các bản ghi có thông tin được biên tập lại sẽ được thay thế PII bằng phần giữ chỗ trong dấu ngoặc vuông cho biết loại PII đã được biên tập lại. Bản ghi trực tuyến hỗ trợ khả năng bổ sung để chỉ xác định PII và gắn nhãn cho nó mà không cần chỉnh sửa. Các loại PII được Amazon Transcribe xử lý lại khác nhau giữa các bản ghi theo lô và bản ghi trực tuyến. tham khảo Sắp xếp lại PII trong công việc hàng loạt của bạnSắp xếp lại hoặc xác định PII trong luồng thời gian thực để biết thêm chi tiết.

Chuyên ngành Amazon Transcribe Phân tích cuộc gọi API có khả năng tích hợp để loại bỏ PII trong cả bản ghi văn bản và tệp âm thanh. API này sử dụng các mô hình xử lý ngôn ngữ tự nhiên và chuyển giọng nói thành văn bản (NLP) chuyên dụng được đào tạo đặc biệt để hiểu các cuộc gọi bán hàng và dịch vụ khách hàng. Đối với các trường hợp sử dụng khác, bạn có thể sử dụng giải pháp này để loại bỏ PII khỏi tệp âm thanh bằng Amazon Transcribe.

Các phương pháp hay nhất về bảo mật Amazon Transcribe bổ sung

Cách thực hành tốt nhất 4 – Sử dụng Vai trò IAM dành cho các ứng dụng và dịch vụ AWS yêu cầu quyền truy cập Amazon Transcribe. Khi sử dụng một vai trò, bạn không phải phân phối thông tin xác thực dài hạn, chẳng hạn như mật khẩu hoặc khóa truy cập, cho phiên bản EC2 hoặc dịch vụ AWS. Vai trò IAM có thể cung cấp các quyền tạm thời mà ứng dụng có thể sử dụng khi đưa ra yêu cầu đối với tài nguyên AWS.

Cách thực hành tốt nhất 5 – Sử dụng kiểm soát truy cập dựa trên thẻ. Bạn có thể sử dụng thẻ để kiểm soát quyền truy cập trong tài khoản AWS của mình. Trong Amazon Transcribe, thẻ có thể được thêm vào tác vụ phiên âm, từ vựng tùy chỉnh, bộ lọc từ vựng tùy chỉnh và mô hình ngôn ngữ tùy chỉnh.

Cách thực hành tốt nhất 6 – Sử dụng các công cụ giám sát AWS. Giám sát là một phần quan trọng trong việc duy trì độ tin cậy, bảo mật, tính khả dụng và hiệu suất của Amazon Transcribe và các giải pháp AWS của bạn. Bạn có thể giám sát Amazon Transcribe bằng AWS CloudTrailamazoncloudwatch.

Cách thực hành tốt nhất 7 – Kích hoạt tính năng Cấu hình AWS. AWS Config cho phép bạn đánh giá, kiểm tra và đánh giá cấu hình tài nguyên AWS của bạn. Khi sử dụng AWS Config, bạn có thể xem xét các thay đổi về cấu hình và mối quan hệ giữa các tài nguyên AWS, điều tra lịch sử cấu hình tài nguyên chi tiết và xác định mức độ tuân thủ tổng thể của bạn đối với các cấu hình được chỉ định trong nguyên tắc nội bộ của bạn. Điều này có thể giúp bạn đơn giản hóa việc kiểm tra tuân thủ, phân tích bảo mật, quản lý thay đổi và khắc phục sự cố vận hành.

Xác thực tuân thủ cho Amazon Transcribe

Các ứng dụng bạn xây dựng trên AWS có thể phải tuân theo các chương trình tuân thủ, chẳng hạn như SOC, PCI, FedRAMP và HIPAA. AWS sử dụng kiểm toán viên bên thứ ba để đánh giá mức độ tuân thủ của các dịch vụ của mình đối với các chương trình khác nhau. Vật phẩm AWS cho phép bạn tải xuống báo cáo kiểm toán của bên thứ ba.

Để tìm hiểu xem dịch vụ AWS có nằm trong phạm vi của các chương trình tuân thủ cụ thể hay không, hãy tham khảo Dịch vụ AWS trong phạm vi theo chương trình tuân thủ. Để biết thêm thông tin và tài nguyên mà AWS cung cấp nhằm giúp khách hàng tuân thủ, hãy tham khảo Xác thực tuân thủ cho Amazon TranscribeTài nguyên tuân thủ AWS.

Kết luận

Trong bài đăng này, bạn đã tìm hiểu về nhiều cơ chế bảo mật, biện pháp thực hành tốt nhất và mẫu kiến ​​trúc có sẵn để bạn xây dựng các ứng dụng bảo mật với Amazon Transcribe. Bạn có thể bảo vệ dữ liệu nhạy cảm của mình cả khi truyền và khi lưu trữ bằng mã hóa mạnh mẽ. Việc biên tập PII có thể được sử dụng để cho phép xóa thông tin cá nhân khỏi bản ghi của bạn nếu bạn không muốn xử lý và lưu trữ thông tin đó. Điểm cuối VPC và Direct Connect cho phép bạn thiết lập kết nối riêng tư giữa ứng dụng của bạn và dịch vụ Amazon Transcribe. Chúng tôi cũng cung cấp các tài liệu tham khảo giúp bạn xác thực tính tuân thủ của ứng dụng bằng cách sử dụng Amazon Transcribe với các chương trình như SOC, PCI, FedRAMP và HIPAA.

Ở các bước tiếp theo, hãy kiểm tra Bắt đầu với Amazon Transcribe để nhanh chóng bắt đầu sử dụng dịch vụ. tham khảo Tài liệu Amazon Transcribe để tìm hiểu sâu hơn về chi tiết dịch vụ. Và làm theo Amazon Transcribe trên Blog học máy của AWS để cập nhật các khả năng và trường hợp sử dụng mới cho Amazon Transcribe.


Lưu ý

Hình ảnh chân dung của Alex Bulatkin, Kiến trúc sư giải pháp tại AWS

Alex Bulatkin là Kiến trúc sư giải pháp tại AWS. Anh thích giúp đỡ các nhà cung cấp dịch vụ truyền thông xây dựng các giải pháp đổi mới trong AWS nhằm định hình lại ngành viễn thông. Anh ấy đam mê làm việc với khách hàng để đưa sức mạnh của dịch vụ AI AWS vào ứng dụng của họ. Alex sống ở khu vực đô thị Denver và thích đi bộ đường dài, trượt tuyết và trượt ván trên tuyết.

tại chỗ_img

Tin tức mới nhất

tại chỗ_img