Logo Zephyrnet

Chip máy tính quang tử mới sử dụng ánh sáng để cắt giảm chi phí năng lượng AI

Ngày:

Các mô hình AI đang lũ quyền lực.

Khi các thuật toán phát triển và trở nên phức tạp hơn, chúng ngày càng gây áp lực lên các chip máy tính hiện tại. Nhiều công ty đã thiết kế chip phù hợp với AI để giảm mức tiêu thụ điện năng. Nhưng tất cả đều dựa trên một nguyên tắc cơ bản—chúng sử dụng điện.

Tháng này, một nhóm từ Đại học Thanh Hoa ở Trung Quốc đã thay đổi công thức. Họ xây dựng chip mạng thần kinh sử dụng ánh sáng thay vì điện để chạy các nhiệm vụ AI với chi phí năng lượng bằng một phần nhỏ NVIDIA H100, một con chip hiện đại được sử dụng để đào tạo và chạy các mô hình AI.

Được gọi là Taichi, con chip này kết hợp hai loại xử lý dựa trên ánh sáng vào cấu trúc bên trong của nó. So với trước đây chíp quang, Taichi chính xác hơn nhiều đối với các tác vụ tương đối đơn giản như nhận dạng các con số viết tay hoặc các hình ảnh khác. Không giống như những người tiền nhiệm, con chip này cũng có thể tạo ra nội dung. Chẳng hạn, nó có thể tạo ra những hình ảnh cơ bản theo phong cách dựa trên nghệ sĩ người Hà Lan Vincent van Gogh hoặc những con số âm nhạc cổ điển lấy cảm hứng từ Johann Sebastian Bach.

Một phần hiệu quả của Taichi là do cấu trúc của nó. Con chip này được làm từ nhiều thành phần gọi là chiplets. Tương tự như tổ chức của bộ não, mỗi chiplet thực hiện song song các phép tính riêng của mình, kết quả của chúng sau đó được tích hợp với các phép tính khác để đưa ra giải pháp.

Đối mặt với vấn đề đầy thách thức là phân tách hình ảnh trên 1,000 danh mục, Taichi đã thành công gần 92% số lần, phù hợp với hiệu suất của chip hiện tại nhưng lại cắt giảm mức tiêu thụ năng lượng hơn một nghìn lần.

Đối với AI, “xu hướng xử lý các nhiệm vụ nâng cao hơn [là] không thể đảo ngược”, các tác giả viết. “Taichi mở đường cho điện toán quang tử [dựa trên ánh sáng] quy mô lớn”, dẫn đến AI linh hoạt hơn với chi phí năng lượng thấp hơn.

Chip trên vai

Chip máy tính ngày nay không kết hợp tốt với AI.

Một phần của vấn đề là về mặt cấu trúc. Việc xử lý và bộ nhớ trên chip truyền thống được tách biệt về mặt vật lý. Việc truyền dữ liệu giữa chúng tiêu tốn một lượng lớn năng lượng và thời gian.

Mặc dù hiệu quả trong việc giải quyết các vấn đề tương đối đơn giản, nhưng quá trình thiết lập lại cực kỳ tiêu tốn năng lượng khi sử dụng AI phức tạp, giống như các mô hình ngôn ngữ lớn hỗ trợ ChatGPT.

Vấn đề chính là chip máy tính được chế tạo như thế nào. Mỗi phép tính dựa vào các bóng bán dẫn, bật hoặc tắt để biểu thị số 0 và 1 được sử dụng trong phép tính. Các kỹ sư đã thu nhỏ đáng kể các bóng bán dẫn trong nhiều thập kỷ để họ có thể nhồi nhét nhiều hơn vào chip. Nhưng công nghệ chip hiện tại đang tiến tới điểm đột phá mà chúng ta không thể thu nhỏ lại được.

Các nhà khoa học từ lâu đã tìm cách cải tiến các con chip hiện tại. Một chiến lược lấy cảm hứng từ bộ não dựa vào các “khớp thần kinh”—“bến” sinh học kết nối các tế bào thần kinh—có chức năng tính toán và lưu trữ thông tin ở cùng một vị trí. Những con chip lấy cảm hứng từ não bộ hoặc thần kinh này sẽ cắt giảm mức tiêu thụ năng lượng và tăng tốc độ tính toán. Nhưng giống như những con chip hiện nay, chúng hoạt động dựa vào điện năng.

Một ý tưởng khác là sử dụng một cơ chế tính toán hoàn toàn khác: ánh sáng. Các tác giả viết: “Điện toán quang tử” đang “thu hút sự chú ý ngày càng tăng”. Thay vì sử dụng điện, có thể chiếm đoạt các hạt ánh sáng để cung cấp năng lượng cho AI với tốc độ ánh sáng.

Hãy có ánh sáng

So với các chip chạy bằng điện, ánh sáng sử dụng ít năng lượng hơn và có thể xử lý đồng thời nhiều phép tính. Khai thác những đặc tính này, các nhà khoa học đã xây dựng mạng lưới thần kinh quang học sử dụng photon—các hạt ánh sáng—cho chip AI, thay vì điện.

Những con chip này có thể hoạt động theo hai cách. Trong một, các chip phân tán tín hiệu ánh sáng vào các kênh được thiết kế để cuối cùng kết hợp các tia để giải quyết vấn đề. Được gọi là nhiễu xạ, các mạng nơ-ron quang học này gói các nơ-ron nhân tạo lại gần nhau và giảm thiểu chi phí năng lượng. Nhưng chúng không thể dễ dàng thay đổi, nghĩa là chúng chỉ có thể giải quyết một vấn đề đơn giản.

Một cách bố trí khác phụ thuộc vào một đặc tính khác của ánh sáng gọi là giao thoa. Giống như sóng đại dương, sóng ánh sáng kết hợp và triệt tiêu lẫn nhau. Khi ở bên trong các đường hầm vi mô trên chip, chúng có thể va chạm để tăng cường hoặc ức chế lẫn nhau—những kiểu giao thoa này có thể được sử dụng để tính toán. Các chip dựa trên nhiễu có thể được cấu hình lại dễ dàng bằng cách sử dụng một thiết bị gọi là giao thoa kế. Vấn đề là, chúng cồng kềnh và tiêu tốn rất nhiều năng lượng.

Sau đó là vấn đề về độ chính xác. Ngay cả trong các kênh điêu khắc thường được sử dụng cho các thí nghiệm giao thoa, ánh sáng bị dội lại và tán xạ, khiến cho việc tính toán không đáng tin cậy. Đối với một mạng nơ-ron quang học đơn lẻ, các lỗi có thể chấp nhận được. Nhưng với mạng quang lớn hơn và các vấn đề phức tạp hơn, nhiễu tăng theo cấp số nhân và trở nên không thể kiểm soát được.

Đây là lý do tại sao mạng lưới thần kinh dựa trên ánh sáng không thể dễ dàng mở rộng quy mô. Cho đến nay, chúng chỉ có thể giải quyết các nhiệm vụ cơ bản, chẳng hạn như nhận dạng số hoặc nguyên âm.

Nhóm nghiên cứu viết: “Việc phóng đại quy mô của các kiến ​​trúc hiện có sẽ không cải thiện hiệu suất một cách tương xứng”.

Đôi rắc rối

AI mới, Taichi, đã kết hợp hai đặc điểm này để thúc đẩy mạng lưới thần kinh quang học hướng tới việc sử dụng trong thế giới thực.

Thay vì định cấu hình một mạng nơ-ron đơn lẻ, nhóm đã sử dụng phương pháp chiplet, phương pháp này ủy quyền các phần khác nhau của nhiệm vụ cho nhiều khối chức năng. Mỗi khối có điểm mạnh riêng: Một khối được thiết lập để phân tích nhiễu xạ, có thể nén lượng lớn dữ liệu trong một khoảng thời gian ngắn. Một khối khác được nhúng giao thoa kế để gây nhiễu, cho phép chip được cấu hình lại dễ dàng giữa các tác vụ.

So với học sâu, Taichi sử dụng cách tiếp cận “nông cạn”, theo đó nhiệm vụ được trải rộng trên nhiều chiplet.

Với cấu trúc deep learning tiêu chuẩn, lỗi có xu hướng tích lũy theo lớp và theo thời gian. Thiết lập này giải quyết các vấn đề phát sinh từ quá trình xử lý tuần tự ngay từ đầu. Khi gặp một vấn đề, Taichi phân bổ khối lượng công việc trên nhiều cụm độc lập, giúp giải quyết các vấn đề lớn hơn dễ dàng hơn với ít sai sót nhất.

Chiến lược đã được đền đáp.

Taichi có khả năng tính toán tổng cộng 4,256 tế bào thần kinh nhân tạo, với gần 14 triệu thông số mô phỏng các kết nối não mã hóa khả năng học tập và trí nhớ. Nhóm nghiên cứu viết rằng khi sắp xếp hình ảnh thành 1,000 danh mục, chip quang tử có độ chính xác gần 92%, có thể so sánh với “các mạng thần kinh điện tử phổ biến hiện nay”.

Con chip này cũng xuất sắc trong các bài kiểm tra nhận dạng hình ảnh AI tiêu chuẩn khác, chẳng hạn như xác định các ký tự viết tay từ các bảng chữ cái khác nhau.

Ở thử nghiệm cuối cùng, nhóm đã thách thức AI quang tử nắm bắt và tái tạo nội dung theo phong cách của các nghệ sĩ và nhạc sĩ khác nhau. Khi được huấn luyện với các tiết mục của Bach, AI cuối cùng đã học được cao độ và phong cách tổng thể của nhạc sĩ. Tương tự, những hình ảnh của van Gogh hay Edvard Munch—nghệ sĩ đằng sau bức tranh nổi tiếng, Tiếng hét—được đưa vào AI cho phép nó tạo ra các hình ảnh theo phong cách tương tự, mặc dù nhiều hình ảnh trông giống trò giải trí của trẻ mới biết đi.

Mạng lưới thần kinh quang học vẫn còn nhiều việc phải làm. Nhưng nếu được sử dụng rộng rãi, chúng có thể là giải pháp thay thế tiết kiệm năng lượng hơn cho các hệ thống AI hiện tại. Taichi tiết kiệm năng lượng hơn 100 lần so với các thế hệ trước. Nhưng con chip này vẫn cần tia laser để cung cấp năng lượng và truyền dữ liệu, những thứ khó ngưng tụ.

Tiếp theo, nhóm nghiên cứu hy vọng có thể tích hợp các tia laser mini sẵn có và các thành phần khác vào một chip quang tử gắn kết duy nhất. Trong khi đó, họ hy vọng Taichi sẽ “đẩy nhanh quá trình phát triển các giải pháp quang học mạnh mẽ hơn” mà cuối cùng có thể dẫn đến “kỷ nguyên mới” của AI mạnh mẽ và tiết kiệm năng lượng.

Ảnh: người Tây Ban Nha_vfx / Shutterstock.com

tại chỗ_img

Tin tức mới nhất

tại chỗ_img