Logo Zephyrnet

Đại lý AI của MIT tiên phong về khả năng diễn giải trong nghiên cứu AI

Ngày:

Trong một bước phát triển mang tính đột phá, các nhà nghiên cứu từ Phòng thí nghiệm Khoa học Máy tính và Trí tuệ Nhân tạo (CSAIL) của MIT đã giới thiệu một phương pháp mới tận dụng trí tuệ nhân tạo (AI) tác nhân để tự động hóa việc giải thích các mạng lưới thần kinh phức tạp. Khi quy mô và độ phức tạp của mạng lưới thần kinh tiếp tục phát triển, việc giải thích hành vi của chúng đã trở thành một câu đố đầy thách thức. Nhóm MIT đặt mục tiêu làm sáng tỏ bí ẩn này bằng cách sử dụng các mô hình AI để thử nghiệm các hệ thống khác và trình bày rõ hoạt động bên trong của chúng.

Đại lý AI của MIT tiên phong về khả năng diễn giải trong nghiên cứu AI

Thách thức về khả năng giải thích của mạng lưới thần kinh

Tìm hiểu hành vi của người được đào tạo mạng thần kinh đặt ra một thách thức đáng kể, đặc biệt với sự phức tạp ngày càng tăng của các mô hình hiện đại. Các nhà nghiên cứu của MIT đã thực hiện một cách tiếp cận độc đáo để giải quyết thách thức này. Họ sẽ giới thiệu các tác nhân AI có khả năng tiến hành thí nghiệm trên các hệ thống tính toán đa dạng, từ từng nơ-ron riêng lẻ đến toàn bộ mô hình.

Tác nhân được xây dựng từ các mô hình ngôn ngữ được đào tạo trước

Cốt lõi trong phương pháp của nhóm MIT là các tác nhân được xây dựng từ các mô hình ngôn ngữ được đào tạo trước. Các tác nhân này đóng một vai trò quan trọng trong việc tạo ra các giải thích trực quan về tính toán trong các mạng được đào tạo. Không giống như các quy trình giải thích thụ động chỉ đơn thuần phân loại hoặc tóm tắt các ví dụ, Tác nhân trí tuệ nhân tạo (AIAs) do MIT phát triển tích cực tham gia vào việc hình thành giả thuyết, thử nghiệm thử nghiệm và học tập lặp lại. Sự tham gia năng động này cho phép họ nâng cao hiểu biết của mình về các hệ thống khác trong thời gian thực.

Tạo và thử nghiệm giả thuyết tự trị

Sarah Schwettmann, tiến sĩ '21, đồng tác giả chính của bài báo về công trình đột phá này và là nhà khoa học nghiên cứu tại CSAIL, nhấn mạnh quyền tự chủ của AIA trong việc tạo và thử nghiệm giả thuyết. Khả năng tự động thăm dò các hệ thống khác của AIA có thể tiết lộ các hành vi mà các nhà khoa học có thể trốn tránh sự phát hiện. Schwettmann nêu bật khả năng vượt trội của các mô hình ngôn ngữ. Ngoài ra, họ còn được trang bị các công cụ để thăm dò, thiết kế và thực hiện các thí nghiệm nhằm nâng cao khả năng diễn giải.

TÌM: Tạo điều kiện thuận lợi cho khả năng diễn giải thông qua thiết kế mới lạ

Đại lý AI của MIT tiên phong về khả năng diễn giải trong nghiên cứu AI

Phương pháp tiếp cận FIND (Tạo điều kiện thuận lợi cho khả năng diễn giải thông qua thiết kế mới) của nhóm MIT giới thiệu các tác nhân có khả năng diễn giải có khả năng lập kế hoạch và thực hiện các thử nghiệm trên hệ thống tính toán. Những tác nhân này tạo ra những lời giải thích dưới nhiều hình thức khác nhau. Điều này bao gồm các mô tả ngôn ngữ về các chức năng và thiếu sót của hệ thống cũng như mã tái tạo hành vi của hệ thống. TÌM thể hiện sự thay đổi từ các phương pháp diễn giải truyền thống, tham gia tích cực vào việc tìm hiểu các hệ thống phức tạp.

Thiết kế thử nghiệm và học tập theo thời gian thực

Bản chất năng động của FIND cho phép thiết kế thử nghiệm và học tập theo thời gian thực. AIA tích cực cải tiến sự hiểu biết của họ về các hệ thống khác thông qua việc kiểm tra và thử nghiệm giả thuyết liên tục. Cách tiếp cận này tăng cường khả năng diễn giải và làm nổi bật các hành vi mà lẽ ra có thể không được chú ý.

nói của chúng tôi

Các nhà nghiên cứu của MIT hình dung ra vai trò then chốt của phương pháp FIND trong nghiên cứu khả năng diễn giải. Nó tương tự như cách các điểm chuẩn rõ ràng với các câu trả lời dựa trên cơ sở thực tế đã thúc đẩy những tiến bộ trong mô hình ngôn ngữ. Khả năng AIA tự động tạo ra các giả thuyết và thực hiện các thí nghiệm hứa hẹn sẽ mang lại mức độ hiểu biết mới cho thế giới phức tạp của mạng lưới thần kinh. Phương pháp FIND của MIT thúc đẩy nỗ lực tìm kiếm khả năng diễn giải AI, khám phá các hành vi của mạng lưới thần kinh và thúc đẩy nghiên cứu AI một cách đáng kể.

tại chỗ_img

Tin tức mới nhất

tại chỗ_img