Điều gì xảy ra khi hiệu suất AI tiệm cận? Bởi @ttunguz

Trước đây, mô hình AI càng lớn thì hiệu suất càng tốt. Ví dụ: trên các mô hình của OpenAI, các thông số đã tăng hơn 1000 lần và hiệu suất đã tăng gần gấp ba.

Mô hình OpenAI	Phát hành ngày	Thông số, B	MMLU
GPT2	2/14/19	1.5	0.324
GPT3	6/11/20	175	0.539
GPT3.5	3/15/22	175	0.7
GPT4	3/14/23	1760	0.864

Nhưng hiệu suất của mô hình sẽ sớm tiệm cận – ít nhất là trên thước đo này.

hình ảnh

Đây là một biểu đồ về hiệu suất của nhiều mô hình AI gần đây theo một tiêu chuẩn được chấp nhận rộng rãi gọi là MMLU. ¹ MMLU đo lường hiệu suất của mô hình AI so với học sinh trung học.

Tôi đã phân loại các mô hình theo cách này:

Lớn: > 100 tỷ tham số
Trung bình: tham số 15 đến 100b
Nhỏ : < 15b tham số

Theo thời gian, hiệu suất sẽ hội tụ nhanh chóng ở cả các kích cỡ mô hình và các nhà cung cấp mô hình.

Điều gì xảy ra khi mô hình nguồn mở của Facebook và mô hình nguồn đóng của Google hỗ trợ các mô hình của Google.com & của OpenAI hỗ trợ ChatGPT đều hoạt động tốt như nhau?

Các nhà khoa học máy tính đã gặp khó khăn trong việc phân biệt hiệu suất tương đối của các mô hình này bằng nhiều thử nghiệm khác nhau. Người dùng sẽ khó có thể làm tốt hơn.

Tại thời điểm đó, giá trị trong lớp mô hình sẽ bị thu gọn. Nếu một mô hình nguồn mở có sẵn miễn phí cũng tốt như mô hình trả phí, tại sao không sử dụng mô hình miễn phí? Và nếu một mô hình nguồn mở nhỏ hơn, ít tốn kém hơn cũng tốt như vậy thì tại sao không sử dụng mô hình đó?

Sự phát triển nhanh chóng của AI đã thúc đẩy sự quan tâm ngày càng tăng đối với chính các mô hình. Nhưng khá nhanh chóng, lớp cơ sở hạ tầng sẽ trở thành hàng hóa, giống như đã xảy ra trong đám mây nơi ba nhà cung cấp chiếm 65% thị phần: Amazon Web Services, Azure và Google Cloud Platform.

Các ứng dụng và công cụ dành cho nhà phát triển xung quanh các công ty môi giới hàng hóa AI khổng lồ là giai đoạn phát triển tiếp theo - nơi sự khác biệt hóa và phân phối sản phẩm thay vì những tiến bộ kỹ thuật thô sơ, rực rỡ.²

¹ MMLU đo lường 57 nhiệm vụ khác nhau bao gồm toán, lịch sử, khoa học máy tính và các chủ đề khác. Đó là một thước đo của nhiều người và nó không hoàn hảo – giống như bất kỳ điểm chuẩn nào. Có những hệ thống khác bao gồm cả hệ thống Elo. Đây là một tổng quan về sự khác biệt.. Mỗi điểm chuẩn đánh giá mô hình theo một phạm vi khác nhau: độ lệch,
lý luận toán học là hai ví dụ khác.

Phân phối nội dung và PR được hỗ trợ bởi SEO. Được khuếch đại ngay hôm nay.
PlatoData.Network Vertical Generative Ai. Trao quyền cho chính mình. Truy cập Tại đây.
PlatoAiStream. Thông minh Web3. Kiến thức khuếch đại. Truy cập Tại đây.
Trung tâmESG. Than đá, công nghệ sạch, Năng lượng, Môi trường Hệ mặt trời, Quản lý chất thải. Truy cập Tại đây.
PlatoSức khỏe. Tình báo thử nghiệm lâm sàng và công nghệ sinh học. Truy cập Tại đây.
nguồn: https://www.tomtunguz.com/what-happens-when-model-performance-asymptotes/

Trí thông minh dữ liệu tạo

Điều gì xảy ra khi hiệu suất AI tiệm cận? bởi @ttunguz

Tổng quan về các phương pháp thu thập dữ liệu tự động

Điều hướng các Thỏa thuận cho thuê thương mại cần sa ở Washington

Tin tức mới nhất

Được biết đến với dịch vụ chăm sóc sức khỏe răng miệng với giá cả phải chăng, Nha khoa hoàn chỉnh Roswell đang mang đến trải nghiệm bệnh nhân nha khoa AI công nghệ cao mới

SES có trụ sở tại Paris mua Intelsat với giá 3.1 tỷ USD khi các công ty vệ tinh châu Âu hợp nhất – Tech Startups

Trình mô phỏng đặc vụ cung cấp chương trình đào tạo đặc vụ bí mật VR FPS khi thực hiện nhiệm vụ

Sự kết thúc của ô nhiễm nhựa: Làm thế nào doanh nghiệp có thể vận hành tính tuần hoàn | GreenBiz

Xu hướng của các sản phẩm Micro SaaS và cách chúng ảnh hưởng đến văn hóa khởi nghiệp – Tech Startups

Mở rộng quy mô trung tâm khởi nghiệp địa phương thành một dự án quốc tế thành công thông qua giáo dục (Được tài trợ) | EU-Khởi nghiệp