Tại sao bạn cần biết về tổ tiên AI của mình

COMMENTARY

Trí tuệ nhân tạo (AI) đang nhanh chóng thay đổi gần như mọi khía cạnh trong cuộc sống hàng ngày của chúng ta, từ cách chúng ta làm việc đến cách chúng ta tiếp thu thông tin cho đến cách chúng ta xác định người lãnh đạo của mình. Giống như bất kỳ công nghệ nào, AI là vô đạo đức nhưng có thể được sử dụng để thúc đẩy xã hội hoặc mang lại tác hại.

Dữ liệu là gen cung cấp năng lượng cho các ứng dụng AI. Đó là DNA và RNA được gói gọn trong một. Như người ta thường nói khi xây dựng hệ thống phần mềm: “rác vào/ra rác”. Công nghệ AI chỉ chính xác, an toàn và hoạt động như nguồn dữ liệu mà nó dựa vào. Chìa khóa để đảm bảo AI thực hiện lời hứa và tránh những cơn ác mộng của nó nằm ở khả năng loại bỏ rác và ngăn chặn nó sinh sôi nảy nở và nhân rộng trên hàng triệu ứng dụng AI.

Đây được gọi là xuất xứ dữ liệu và chúng tôi không thể đợi thêm một ngày nào nữa để thực hiện các biện pháp kiểm soát nhằm ngăn chặn tương lai AI của chúng tôi trở thành một đống rác khổng lồ.

Dữ liệu xấu dẫn đến các mô hình AI có thể truyền bá các lỗ hổng an ninh mạng, thông tin sai lệch và các cuộc tấn công khác trên toàn cầu chỉ trong vài giây. hôm nay trí tuệ nhân tạo Các mô hình (GenAI) cực kỳ phức tạp, nhưng về cốt lõi, các mô hình GenAI chỉ đơn giản là dự đoán khối dữ liệu tiếp theo tốt nhất để xuất ra, dựa trên một tập hợp dữ liệu hiện có trước đó.

Phép đo độ chính xác

Mô hình loại ChatGPT đánh giá tập hợp các từ tạo nên câu hỏi ban đầu được hỏi và tất cả các từ trong câu trả lời của mô hình cho đến nay để tính toán từ tốt nhất tiếp theo để xuất ra. Nó thực hiện việc này nhiều lần cho đến khi nó quyết định rằng nó đã đưa ra đủ phản hồi. Giả sử bạn đánh giá khả năng của mô hình trong việc xâu chuỗi các từ lại với nhau để tạo thành các câu đúng ngữ pháp, đúng ngữ pháp, đúng chủ đề và thường liên quan đến cuộc trò chuyện. Trong trường hợp đó, các mô hình ngày nay cực kỳ tốt - một phép đo độ chính xác.

Lặn sâu hơn vào liệu văn bản do AI tạo ra có luôn truyền tải thông tin “chính xác” hay không và chỉ ra một cách thích hợp mức độ tin cậy của thông tin được truyền tải. Điều này tiết lộ các vấn đề xuất phát từ các mô hình dự đoán trung bình rất tốt, nhưng không tốt lắm trong các trường hợp cận biên - thể hiện vấn đề về độ bền. Nó có thể trở nên phức tạp khi dữ liệu đầu ra kém từ các mô hình AI được lưu trữ trực tuyến và được sử dụng làm dữ liệu đào tạo trong tương lai cho các mô hình này và các mô hình khác.

Kết quả đầu ra kém có thể tái tạo ở quy mô mà chúng tôi chưa từng thấy, gây ra vòng lặp diệt vong AI.

Nếu một kẻ xấu muốn hỗ trợ quá trình này, họ có thể cố tình khuyến khích sản xuất, lưu trữ và truyền bá thêm dữ liệu xấu - dẫn đến nhiều thông tin sai lệch hơn nữa xuất phát từ chatbot hoặc điều gì đó bất chính và đáng sợ như các mô hình lái tự động trên ô tô quyết định rằng họ cần phải làm vậy. nhanh chóng điều khiển một chiếc ô tô sang bên phải bất chấp các vật thể cản đường nếu họ “nhìn thấy” một hình ảnh được chế tạo đặc biệt trước mặt họ (tất nhiên là theo giả thuyết).

Sau nhiều thập kỷ, ngành phát triển phần mềm - do Cơ quan An ninh Cơ sở hạ tầng An ninh mạng dẫn đầu - cuối cùng cũng đang triển khai một thiết kế an toàn khuôn khổ. Bảo mật theo thiết kế yêu cầu an ninh mạng là nền tảng của quá trình phát triển phần mềm và một trong những nguyên lý cốt lõi của nó là yêu cầu lập danh mục mọi thành phần phát triển phần mềm - một hóa đơn nguyên vật liệu phần mềm (SBOM) - để tăng cường an ninh và khả năng phục hồi. Cuối cùng, bảo mật đang thay thế tốc độ như là yếu tố tiếp cận thị trường quan trọng nhất.

Bảo mật thiết kế AI

AI cần một cái gì đó tương tự. Vòng phản hồi AI ngăn chặn các kỹ thuật bảo vệ an ninh mạng phổ biến trước đây, chẳng hạn như theo dõi dấu hiệu phần mềm độc hại, xây dựng vành đai xung quanh tài nguyên mạng hoặc quét mã do con người viết để tìm lỗ hổng. Chúng ta phải đặt ra yêu cầu cho các thiết kế AI an toàn trong giai đoạn sơ khai của công nghệ để AI có thể được đảm bảo an toàn từ lâu trước khi hộp Pandora được mở.

Vì vậy, làm thế nào để chúng ta giải quyết vấn đề này? Chúng ta nên lấy một trang ra khỏi thế giới học thuật. Chúng tôi đào tạo sinh viên bằng dữ liệu đào tạo được tuyển chọn kỹ lưỡng, diễn giải và truyền đạt cho họ thông qua đội ngũ giáo viên. Chúng tôi tiếp tục phương pháp này để dạy cho người lớn, nhưng người lớn phải tự mình thực hiện nhiều việc quản lý dữ liệu hơn.

Việc đào tạo mô hình AI cần áp dụng cách tiếp cận dữ liệu được quản lý theo hai giai đoạn. Để bắt đầu, các mô hình AI cơ bản sẽ được đào tạo bằng các phương pháp hiện tại bằng cách sử dụng lượng lớn tập dữ liệu ít được quản lý hơn. Những mô hình ngôn ngữ lớn cơ bản (LLM) này gần giống với một em bé sơ sinh. Sau đó, các mô hình cấp cơ sở sẽ được đào tạo với các tập dữ liệu được quản lý chặt chẽ tương tự như cách trẻ em được dạy và nuôi dạy để trở thành người lớn.

Nỗ lực xây dựng các tập dữ liệu đào tạo lớn, được tuyển chọn cho tất cả các loại mục tiêu sẽ không hề nhỏ. Điều này tương tự với tất cả nỗ lực mà phụ huynh, nhà trường và xã hội đã bỏ ra để cung cấp một môi trường chất lượng và thông tin chất lượng cho trẻ em khi chúng lớn lên (hy vọng) trở thành những người đóng góp giá trị gia tăng cho xã hội. Đó là mức độ nỗ lực cần thiết để xây dựng các bộ dữ liệu chất lượng nhằm đào tạo các mô hình AI chất lượng, hoạt động tốt, ít bị hỏng nhất và nó có thể dẫn đến việc cả một ngành AI và con người làm việc cùng nhau để dạy các mô hình AI thực hiện tốt công việc mục tiêu của mình .

Hiện trạng của quy trình đào tạo AI ngày nay cho thấy một số dấu hiệu của quy trình hai giai đoạn này. Tuy nhiên, do công nghệ GenAI và ngành này còn non trẻ nên việc đào tạo quá nhiều sẽ dẫn đến cách tiếp cận giai đoạn một ít được quản lý hơn.

Khi nói đến bảo mật AI, chúng ta không thể chờ đợi một giờ chứ đừng nói đến một thập kỷ. AI cần một ứng dụng 23andMe cho phép đánh giá đầy đủ “phả hệ thuật toán” để các nhà phát triển có thể hiểu đầy đủ về lịch sử “gia đình” của AI nhằm ngăn chặn các vấn đề mãn tính tái tạo, lây nhiễm sang các hệ thống quan trọng mà chúng ta dựa vào hàng ngày và tạo ra tác hại về kinh tế và xã hội điều đó có thể không thể thay đổi được.

An ninh quốc gia của chúng ta phụ thuộc vào điều đó.

Phân phối nội dung và PR được hỗ trợ bởi SEO. Được khuếch đại ngay hôm nay.
PlatoData.Network Vertical Generative Ai. Trao quyền cho chính mình. Truy cập Tại đây.
PlatoAiStream. Thông minh Web3. Kiến thức khuếch đại. Truy cập Tại đây.
Trung tâmESG. Than đá, công nghệ sạch, Năng lượng, Môi trường Hệ mặt trời, Quản lý chất thải. Truy cập Tại đây.
PlatoSức khỏe. Tình báo thử nghiệm lâm sàng và công nghệ sinh học. Truy cập Tại đây.
nguồn: https://www.darkreading.com/vulnerabilities-threats/why-you-need-to-know-your-ai-ancestry

Trí thông minh dữ liệu tạo

Tại sao bạn cần biết tổ tiên AI của mình

Phép đo độ chính xác

Bảo mật thiết kế AI

Tối đa hóa lợi nhuận vào năm 2024: Cái nhìn toàn diện về ValueZone.AI

Bộ trưởng Quốc phòng Anh tiết lộ việc Ý cung cấp tên lửa Storm Shadow cho Ukraine

Tin tức mới nhất

Đưa tin trực tiếp: SpaceX phóng 23 vệ tinh Starlink trên chuyến bay Falcon 9 từ Cape Canaveral

Ba chìa khóa để người dân trên đảo giành chiến thắng trong ván thứ năm

Lakers có được chiến thắng đáng mơ ước trước Denver, hiện đang dẫn trước 3-1 trong loạt trận

Falcon 9 phóng vệ tinh dẫn đường Galileo

NEVS Emily GT do cựu kỹ sư Saab thiết kế có thể được sản xuất tại Ý – Autoblog

Những người đam mê Dogecoin và Pepecoin tập hợp đằng sau Token AI mới được phát hành bởi nền tảng trao đổi Wahoo – CryptoInfoNet