Logo Zephyrnet

OpenAI Scholarship Spring 2020: Dự án cuối cùng

Ngày:


sức mạnh Alethea

Tìm kiếm ngữ pháp ở tất cả các vị trí phù hợp

Tôi bị cuốn hút bởi khả năng diễn giải của mạng nơ-ron. Hiểu được cách các mạng có nhiều kiến ​​trúc khác nhau biểu diễn thông tin có thể giúp chúng ta xây dựng các mạng đơn giản và hiệu quả hơn, cũng như dự đoán cách các mạng mà chúng ta đã xây dựng sẽ hoạt động như thế nào và thậm chí có thể cho chúng ta một số hiểu biết sâu sắc về cách con người suy nghĩ. Cùng với những dòng này, tôi đã phân tích cách GPT-2 đại diện cho ngữ pháp tiếng Anh và tìm thấy các mạng con nhỏ hơn có vẻ tương ứng với các cấu trúc ngữ pháp khác nhau. Tôi sẽ trình bày phương pháp luận và kết quả của tôi.

Tiếp theo, tôi muốn tìm hiểu cách mạng nơ-ron đại diện cho thông tin và sử dụng hiểu biết đó để dự đoán tốt hơn cách hệ thống học sâu hoạt động. Tôi tin rằng công việc này sẽ làm cho các hệ thống như vậy an toàn hơn và có lợi hơn cho nhân loại, cũng như làm cho chúng đơn giản hơn, nhanh hơn và hiệu quả hơn về mặt tính toán.

Blog


André Carerra

Phân tích ngữ nghĩa tiếng Anh sang GraphQL

Dự án chương trình học giả của tôi là phân tích ngữ nghĩa từ English-to-GraphQL. Đưa ra lời nhắc bằng tiếng Anh chẳng hạn như “Chúng tôi có bao nhiêu nhân viên?”, Hãy tìm một truy vấn GraphQL tương ứng để trả lại thông tin. Dự án liên quan đến việc tạo tập dữ liệu, đào tạo mô hình và tạo công cụ tương tác để xem kết quả.

Tôi muốn có tiếng nói về cách AI được hình thành — chương trình Học giả là một cơ hội tuyệt vời để học hỏi và tham gia.

Blog


Cathy Yeh

Chuyển nhượng Tín dụng Dài hạn với Vận chuyển Phần thưởng Tạm thời

Các thuật toán học tập củng cố tiêu chuẩn phải vật lộn với hiệu quả mẫu kém khi có phần thưởng thưa thớt với độ trễ tạm thời giữa hành động và hiệu ứng. Để giải quyết vấn đề chỉ định tín dụng dài hạn, chúng tôi sử dụng “phương tiện vận chuyển phần thưởng tạm thời” (TRT) để tăng phần thưởng tức thì của các cặp hành động nhà nước quan trọng với phần thưởng từ tương lai xa, sử dụng cơ chế chú ý để xác định các ứng cử viên cho TRT. Một loạt các thử nghiệm thế giới lưới cho thấy những cải thiện rõ ràng trong việc học khi TRT được sử dụng kết hợp với thuật toán phê bình tác nhân lợi thế tiêu chuẩn.

Tôi đánh giá cao rằng chương trình này đã cho tôi tự do tìm hiểu sâu và linh hoạt khả năng sáng tạo của mình.

Blog


Jorge Orbay

Định lượng khả năng diễn giải của các mô hình được đào tạo trên Coinrun

Mục đích của dự án này là tạo ra một đại lượng vô hướng đo lường khả năng diễn giải của mô hình A2C được đào tạo trên Coinrun của Procgen. Đại lượng vô hướng được tạo bằng cách sử dụng kết hợp phân bổ trên mô hình và mặt nạ của các tài sản của Coinrun. Tính vô hướng được sử dụng để kiểm tra tính hợp lệ của giả thuyết phân tập.

Chương trình này, và cụ thể là người cố vấn của tôi, đã nuôi dưỡng tôi tự tin để đi sâu vào lĩnh vực mà tôi không hiểu và các vấn đề khó giải quyết cho đến khi tôi có thể giải quyết chúng. Tôi hy vọng sẽ lấy lại sự tự tin mà tôi đã học được từ chương trình này để tiếp tục phá vỡ các vấn đề trong và với AI.

Blog


Kamal Ndousse

Học tập xã hội trong học tập củng cố đa tác nhân độc lập

Dự án của tôi đã khám phá sự chuyển giao kiến ​​thức chuyên môn của xã hội giữa các nhân viên RL hoàn toàn độc lập được đào tạo trong môi trường chia sẻ. Câu hỏi thúc đẩy là liệu các nhân viên mới có thể học cách bắt chước hành vi của chuyên gia để giải quyết các nhiệm vụ thăm dò khó mà họ không thể thành thạo một cách cô lập. Tôi sẽ thảo luận về những quan sát của tôi cũng như những môi trường tôi đã phát triển để thử nghiệm với việc chuyển giao kỹ năng xã hội.

Tôi tham gia chương trình Học giả để học hỏi từ những người xuất sắc tại OpenAI và để đắm mình vào nghiên cứu AI. Tôi rất biết ơn vì đã có cơ hội khám phá nghiên cứu hiện đại với sự hỗ trợ của các nhà nghiên cứu tài năng như vậy (đặc biệt cảm ơn người cố vấn của tôi là Natasha Jaques!)

Blog



Kata Slama

Hướng tới dự đoán cơn động kinh với Deep Network

Tôi đang thực hiện một dự án để dự đoán các cơn co giật động kinh bằng cách sử dụng các bản ghi âm của não. Tôi đã đóng khung nó như một bài toán phân loại hình ảnh dựa trên biểu đồ quang phổ của dữ liệu não. Mô hình thành công nhất của tôi cho đến nay là ResNet18. Trong cuộc đời hậu Học giả của mình, tôi dự định sẽ tiếp tục làm việc trong dự án này, và tìm cách giải thích được các mạng phân loại quang phổ.

Tôi muốn học cách áp dụng học sâu để giải quyết các vấn đề khoa học và thế giới thực. Chương trình Học giả OpenAI là cơ hội kỳ diệu này để bắt đầu bằng cách học hỏi từ những bộ óc giỏi nhất trong lĩnh vực này.

Blog



Pamela Mishkin

Các mô hình ngôn ngữ và cảnh báo đối phương chung

Sự nhiễu loạn đối phương được hiểu rõ về hình ảnh nhưng đối với ngôn ngữ thì ít hơn. Bài thuyết trình của tôi sẽ xem xét các tài liệu về cách các ví dụ đối nghịch phổ biến có thể cung cấp thông tin hiểu biết về các mô hình tổng hợp, tái tạo kết quả tạo ra các yếu tố kích hoạt đối thủ phổ quát cho GPT-2 và để tấn công các mô hình NLI.

Chương trình này đã củng cố cơ sở kỹ thuật của tôi trong việc học máy và giúp tôi hiểu cách các nhà nghiên cứu AI hiểu ý nghĩa chính sách trong công việc của họ.

Blog

Nguồn: https://openai.com/blog/openai-scholars-spring-2020-final-projects/

tại chỗ_img

Tin tức mới nhất

tại chỗ_img