Logo Zephyrnet

Ngoài ChatGPT: Các dự án mã nguồn mở trong AI sáng tạo

Ngày:

nghiên cứu mã nguồn mở

Trong lĩnh vực AI tổng hợp, các dự án nguồn mở đã nổi lên như những công cụ mạnh mẽ giúp dân chủ hóa quyền truy cập vào các mô hình tiên tiến và thúc đẩy sự phát triển hợp tác. Chúng cho phép các nhà nghiên cứu, nhà phát triển và những người đam mê thử nghiệm, cải thiện các mô hình hiện có và tạo ra các ứng dụng mới mang lại lợi ích cho toàn xã hội.

Trong bài viết này, tôi muốn xem xét ngắn gọn các dự án nguồn mở chính và thảo luận về tiềm năng cũng như các rủi ro về an toàn của chúng.

Ôm mặt: Một trung tâm của các mô hình AI nguồn mở

Ôm mặt nổi bật như một trung tâm chính cho các mô hình nguồn mở trong các lĩnh vực AI khác nhau. Lưu trữ hơn 200,000 mô hình, nó thu hẹp khoảng cách giữa nghiên cứu học thuật và ứng dụng công nghiệp. Các mô hình được đóng góp bởi các nhà lãnh đạo công nghệ như Meta, Microsoft, Google và OpenAI, cũng như các nhà nghiên cứu trên toàn cầu.

Đáng chú ý, Hugging Face mở rộng ra ngoài các mô hình lưu trữ. Nó có một bộ thư viện riêng, chẳng hạn như thư viện Transformers và Diffusers, phục vụ cho một loạt tác vụ.

  • Máy biến áp thư viện cung cấp các API và công cụ để dễ dàng tải xuống và đào tạo các mô hình được đào tạo trước tiên tiến nhất. Các mô hình này hỗ trợ các tác vụ phổ biến theo các phương thức khác nhau, chẳng hạn như:
    • Xử lý ngôn ngữ tự nhiên: phân loại văn bản, nhận dạng thực thể được đặt tên, trả lời câu hỏi, mô hình hóa ngôn ngữ, tóm tắt, dịch thuật, trắc nghiệm và tạo văn bản.
    • Thị giác máy tính: phân loại hình ảnh, phát hiện đối tượng và phân đoạn.
    • Âm thanh: nhận dạng giọng nói tự động và phân loại âm thanh.
    • Đa phương thức: trả lời câu hỏi trên bảng, nhận dạng ký tự quang học, trích xuất thông tin từ tài liệu được quét, phân loại video và trả lời câu hỏi bằng hình ảnh.
  • Máy khuếch tán thư viện cung cấp các mô hình khuếch tán âm thanh và tầm nhìn được đào tạo trước, đồng thời đóng vai trò là hộp công cụ mô-đun để suy luận và đào tạo. Chính xác hơn, Diffusers cung cấp:
    • khuếch tán tiên tiến đường ống có thể chạy trong suy luận chỉ với một vài dòng mã;
    • tiếng ồn khác nhau lịch trình có thể được sử dụng thay thế cho nhau để đánh đổi tốc độ ưu tiên so với chất lượng trong suy luận;
    • nhiều loại mô hình, chẳng hạn như UNet, có thể được sử dụng làm khối xây dựng trong hệ thống khuếch tán từ đầu đến cuối.
    • Hội thảo các ví dụ để chỉ ra cách đào tạo các nhiệm vụ mô hình khuếch tán phổ biến nhất.
  • Trong bước phát triển mới nhất, Ôm mặt đã giới thiệu ÔmTrò chuyện, chatbot của riêng mình. Giao diện rất giống với ChatGPT nhưng bạn cũng thấy liên kết đến ngươi mâu được sử dụng cho chatbot này (dựa trên LLaMA) và tương ứng trang tập dữ liệu. Hơn nữa, Chat UI cũng có mã nguồn mở trên GitHub.
ÔmTrò chuyện
  • Lưu ý rằng Hugging Face thực thi cơ chế kiểm tra trong đó các cá nhân phải yêu cầu quyền truy cập và nhận được sự chấp thuận trước khi tải xuống nhiều mô hình từ nền tảng của công ty. Mục tiêu là hạn chế quyền truy cập chỉ cho những cá nhân có thể đưa ra lý do hợp lệ, như được xác định bởi Hugging Face, để có được mô hình.

Ổn định AI: Biên giới mới

AI ổn định, một người chơi quan trọng khác trong lĩnh vực AI nguồn mở, cung cấp một bộ mô hình nguồn mở để tạo văn bản và hình ảnh.

  • Khuếch tán ổn định – một tập hợp các mô hình nguồn mở để tạo văn bản thành hình ảnh.
  • DeepFloyd NẾU – một mô hình chuyển văn bản thành hình ảnh mạnh mẽ có thể tích hợp văn bản vào hình ảnh một cách thông minh.
  • LM ổn định – LLM mã nguồn mở. Phiên bản Alpha của mô hình có sẵn các thông số 3B và 7B, với các mô hình thông số 15B đến 65B tiếp theo. Các nhà phát triển có thể có quyền truy cập miễn phí để kiểm tra, sử dụng và điều chỉnh các mô hình cơ sở StableLM cho mục đích thương mại hoặc nghiên cứu.
  • Vicuna ổn định – chatbot mã nguồn mở quy mô lớn đầu tiên được đào tạo thông qua học tăng cường từ phản hồi của con người (RLHF). StableVicuna được dựa trên một tinh chỉnh cuộc gọi mẫu 13B.
  • Hoạt ảnh ổn định – công cụ chuyển văn bản thành hình ảnh động, hiện chỉ dành cho nhà phát triển vì nó chưa có giao diện thân thiện với người dùng. Công cụ này cho phép ba cách để tạo hoạt ảnh:
    • Văn bản thành hoạt hình: Người dùng nhập lời nhắc văn bản và điều chỉnh các tham số khác nhau để tạo hoạt ảnh.
    • Nhập văn bản + nhập hình ảnh ban đầu: Người dùng cung cấp một hình ảnh ban đầu đóng vai trò là điểm bắt đầu hoạt ảnh của họ. Lời nhắc văn bản được sử dụng cùng với hình ảnh để tạo hoạt ảnh đầu ra cuối cùng.
    • Nhập video + nhập văn bản: Người dùng cung cấp một video ban đầu để làm cơ sở cho hoạt ảnh của họ. Bằng cách điều chỉnh các tham số khác nhau, họ đạt được hoạt ảnh đầu ra cuối cùng được hướng dẫn bổ sung bởi dấu nhắc văn bản.

[Nhúng nội dung]

Các mô hình mã nguồn mở khác

Nhiều mô hình nguồn mở khác đã được phát hành gần đây. Các mẫu nổi bật bao gồm:

  • Alpaca từ một nhóm tại Đại học Stanford,
  • Dolly từ công ty phần mềm Databricks, và
  • Não-GPT từ công ty AI Cerebras.

Các mô hình này là những bổ sung quan trọng cho hệ sinh thái AI nguồn mở, làm phong phú thêm sự đa dạng của nó.

Tuy nhiên, điều quan trọng cần lưu ý là nhiều mô hình mã nguồn mở được xây dựng trên các mô hình nền tảng được phát hành bởi những gã khổng lồ công nghệ như Meta và OpenAI.

  • Chẳng hạn, HuggingChat và Stable Vicuna dựa trên mô hình LLaMA có nguồn mở của Meta.
  • Hơn nữa, cộng đồng nguồn mở cũng đã được hưởng lợi từ bộ dữ liệu công khai mở rộng có tên là Pile, được biên soạn bởi EleutherAI, một tổ chức phi lợi nhuận. Pile có thể thực hiện được phần lớn là do tính mở của OpenAI, cho phép một nhóm lập trình viên thiết kế ngược cách GPT-3 được tạo ra.

Giờ đây, các chính sách nguồn mở của những gã khổng lồ công nghệ này đang phát triển. 

  • OpenAI là xem xét lại chính sách cởi mở trước đây của nó do lo ngại cạnh tranh.
  • Meta là tìm kiếm để cân bằng tính minh bạch và an toàn, thực hiện các biện pháp như giấy phép nhấp qua và hạn chế sử dụng dữ liệu.

Các công ty công nghệ hàng đầu như Meta, Google hoặc Microsoft nên đặc biệt thận trọng về rủi ro uy tín và do đó rất coi trọng tất cả các mối lo ngại về an toàn liên quan đến việc cung cấp nguồn mở cho các mô hình của họ.

Mối quan tâm về an toàn trong các dự án AI nguồn mở

Bất chấp tiềm năng to lớn của chúng, các dự án AI mã nguồn mở không phải là không có rủi ro. Bao gồm các:

  • Lạm dụng mô hình: Khả năng truy cập của các mô hình AI nguồn mở cũng có nghĩa là chúng có thể bị những kẻ độc hại lạm dụng cho các mục đích như deepfakes, thư rác tự động hoặc chiến dịch thông tin sai lệch.
    • Ví dụ: khá nhiều người sử dụng mã nguồn mở của các mô hình Khuếch tán ổn định để loại bỏ các bộ lọc và tạo nội dung khiêu dâm và hình ảnh có hại.
  • Thiên vị và Công bằng: Các mô hình nguồn mở được đào tạo trên dữ liệu công khai có thể phản ánh và lan truyền các thành kiến ​​có trong dữ liệu đó. Chúng cũng có thể được tinh chỉnh theo cách tạo ra những thành kiến ​​mới, dẫn đến kết quả đầu ra không công bằng hoặc phân biệt đối xử.
  • Thiếu giám sát và trách nhiệm giải trình: Trong môi trường mã nguồn mở, việc duy trì giám sát cách sử dụng và sửa đổi các mô hình có thể là một thách thức. Điều này có thể dẫn đến tình huống không rõ ai chịu trách nhiệm nếu có sự cố xảy ra.
  • Bảo mật dữ liệu và quyền riêng tư: Các dự án mã nguồn mở có thể dễ bị ảnh hưởng bởi các vấn đề bảo mật dữ liệu nếu không được quản lý đúng cách. Dữ liệu nhạy cảm có khả năng bị lộ trong quá trình phát triển và cũng có thể có rủi ro liên quan đến dữ liệu được sử dụng để đào tạo, thử nghiệm hoặc tinh chỉnh mô hình.

Tóm lại, các dự án nguồn mở trong AI tổng quát mang lại tiềm năng to lớn để thúc đẩy công nghệ AI và các ứng dụng của nó. Tuy nhiên, điều quan trọng là phải thừa nhận trách nhiệm đi kèm với sự tự do này. Khi lĩnh vực này tiếp tục phát triển, việc đảm bảo rằng các cân nhắc về đạo đức được ưu tiên trở nên ngày càng quan trọng. Bảo vệ chống lại việc sử dụng sai mục đích tiềm ẩn và những hậu quả không mong muốn là điều tối quan trọng.

Thưởng thức bài viết này? Đăng ký để cập nhật thêm nghiên cứu AI.

Chúng tôi sẽ cho bạn biết khi chúng tôi phát hành thêm các bài viết tóm tắt như thế này.

tại chỗ_img

Tin tức mới nhất

tại chỗ_img