Logo Zephyrnet

AI mới của Google DeepMind sánh ngang với thành tích giành huy chương vàng trong Thế vận hội toán học

Ngày:

Sau giải một bài toán không thể giải được vấn đề năm ngoái, AI đã quay lại giải quyết vấn đề hình học.

Được phát triển bởi Google DeepMind, một thuật toán mới, AlphaGeometry, có thể xử lý các bài toán từ các kỳ thi Olympic Toán quốc tế trước đây—một cuộc thi cấp cao nhất dành cho học sinh trung học—và phù hợp với thành tích của những người đoạt huy chương vàng trước đó.

Khi thử thách với 30 bài toán hình học khó, AI đã giải thành công 25 bài trong thời gian quy định tiêu chuẩn, đánh bại các thuật toán tiên tiến trước đó với 15 câu trả lời.

Mặc dù thường được coi là nỗi ám ảnh của lớp toán trung học nhưng hình học lại gắn liền với cuộc sống hàng ngày của chúng ta. Nghệ thuật, thiên văn học, thiết kế nội thất và kiến ​​trúc đều dựa vào hình học. Điều hướng, bản đồ và lập kế hoạch tuyến đường cũng vậy. Về cốt lõi, hình học là một cách để mô tả không gian, hình dạng và khoảng cách bằng cách sử dụng lý luận logic.

Theo một cách nào đó, việc giải các bài toán hình học cũng giống như chơi cờ. Với một số quy tắc—được gọi là định lý và bằng chứng—có một số lượng giải pháp hạn chế cho mỗi bước, nhưng việc tìm ra giải pháp nào hợp lý phụ thuộc vào khả năng suy luận linh hoạt tuân theo các quy tắc toán học nghiêm ngặt.

Nói cách khác, việc giải quyết hình học đòi hỏi cả sự sáng tạo và cấu trúc. Trong khi con người phát triển những kỹ năng nhào lộn trí óc này qua nhiều năm luyện tập thì AI lại luôn gặp khó khăn.

AlphaGeometry kết hợp khéo léo cả hai tính năng vào một hệ thống duy nhất. Nó có hai thành phần chính: Một mô hình logic ràng buộc theo quy tắc nhằm cố gắng tìm ra câu trả lời và một mô hình ngôn ngữ lớn để tạo ra những ý tưởng vượt trội. Nếu AI không tìm ra giải pháp chỉ dựa trên lý luận logic, mô hình ngôn ngữ sẽ bắt đầu cung cấp những góc nhìn mới. Kết quả là một AI có cả khả năng sáng tạo và khả năng suy luận có thể giải thích được giải pháp của nó.

Hệ thống này là bước đột phá mới nhất của DeepMind trong việc giải quyết các vấn đề toán học bằng trí tuệ máy móc. Nhưng đôi mắt của họ đang hướng tới một giải thưởng lớn hơn. AlphaGeometry được xây dựng để suy luận logic trong các môi trường phức tạp—chẳng hạn như thế giới hỗn loạn hàng ngày của chúng ta. Ngoài toán học, các phép lặp trong tương lai có thể giúp các nhà khoa học tìm ra giải pháp trong các hệ thống phức tạp khác, chẳng hạn như giải mã các kết nối não hoặc làm sáng tỏ mạng lưới di truyền dẫn đến bệnh tật.

“Chúng ta đang thực hiện một bước nhảy lớn, một bước đột phá lớn về mặt kết quả”, tác giả nghiên cứu, Tiến sĩ Triệu Trinh nói với các Bán Chạy Nhất của Báo New York Times.

Nhóm đôi

Câu hỏi hình học nhanh: Hãy hình dung một hình tam giác có hai cạnh bằng nhau. Làm thế nào để chứng minh hai góc dưới bằng nhau?

Đây là một trong những thách thức đầu tiên mà AlphaGeometry phải đối mặt. Để giải được, bạn cần phải nắm vững các quy tắc trong hình học nhưng cũng phải có sự sáng tạo để nhích dần tới đáp án.

“Chứng minh các định lý cho thấy khả năng suy luận logic thành thạo…biểu thị một kỹ năng giải quyết vấn đề đáng chú ý,” nhóm nghiên cứu đã viết trong nghiên cứu được công bố ngày hôm nay trên Thiên nhiên.

Đây là nơi kiến ​​trúc của AlphaGeometry vượt trội. Được mệnh danh một hệ thống biểu tượng thần kinh, trước tiên nó giải quyết vấn đề với công cụ suy luận tượng trưng của nó. Hãy tưởng tượng những thuật toán này như một học sinh lớp A đang nghiên cứu nghiêm túc sách giáo khoa toán và tuân theo các quy tắc. Họ được hướng dẫn bởi logic và có thể dễ dàng trình bày từng bước dẫn đến giải pháp—chẳng hạn như giải thích một dòng lập luận trong một bài kiểm tra toán.

Những hệ thống này tuy cũ nhưng cực kỳ mạnh mẽ, ở chỗ chúng không gặp phải vấn đề “hộp đen” ám ảnh nhiều thuật toán học sâu hiện đại.

Học sâu đã định hình lại thế giới của chúng ta. Nhưng do cách thức hoạt động của các thuật toán này, chúng thường không thể giải thích được kết quả đầu ra của mình. Điều này sẽ không xảy ra khi nói đến toán học, vốn dựa vào lý luận logic chặt chẽ có thể được viết ra.

Công cụ suy luận tượng trưng chống lại vấn đề hộp đen ở chỗ chúng hợp lý và có thể giải thích được. Nhưng phải đối mặt với những vấn đề phức tạp, họ lại chậm chạp và gặp khó khăn trong việc thích ứng một cách linh hoạt.

Đây là nơi các mô hình ngôn ngữ lớn xuất hiện. Động lực thúc đẩy ChatGPT, các thuật toán này rất xuất sắc trong việc tìm ra các mẫu trong dữ liệu phức tạp và tạo ra các giải pháp mới nếu có đủ dữ liệu đào tạo. Nhưng họ thường thiếu khả năng tự giải thích nên cần phải kiểm tra lại kết quả của mình.

AlphaGeometry kết hợp những gì tốt nhất của cả hai thế giới.

Khi gặp một bài toán hình học, công cụ suy luận ký hiệu sẽ giải quyết bài toán đó trước tiên. Hãy giải bài toán tam giác. Thuật toán “hiểu” được tiền đề của câu hỏi, ở chỗ nó cần chứng minh hai góc dưới bằng nhau. Sau đó, mô hình ngôn ngữ gợi ý vẽ một đường mới từ đỉnh tam giác thẳng xuống đáy để giúp giải quyết vấn đề. Mỗi yếu tố mới giúp AI hướng tới giải pháp được mệnh danh là “cấu trúc”.

Công cụ suy luận tượng trưng nhận lời khuyên và viết ra logic đằng sau lý luận của nó. Nếu cấu trúc không hoạt động, hai hệ thống sẽ trải qua nhiều vòng cân nhắc cho đến khi AlphaGeometry đạt được giải pháp.

Toàn bộ quá trình thiết lập “giống như ý tưởng ‘suy nghĩ, nhanh và chậm’” đã viết nhóm trên blog của DeepMind. “Một hệ thống cung cấp những ý tưởng nhanh chóng, ‘trực quan’, còn hệ thống kia đưa ra quyết định có chủ ý và hợp lý hơn.”

Chúng ta là những nhà vô địch

Không giống như các tệp văn bản hoặc âm thanh, có rất ít ví dụ tập trung vào hình học, điều này gây khó khăn cho việc đào tạo AlphaGeometry.

Để giải quyết vấn đề này, nhóm đã tạo tập dữ liệu của riêng mình bao gồm 100 triệu ví dụ tổng hợp về các hình dạng hình học ngẫu nhiên và mối quan hệ được ánh xạ giữa các điểm và đường—tương tự như cách bạn giải hình học trong lớp toán nhưng ở quy mô lớn hơn nhiều.

Từ đó, AI nắm bắt các quy tắc hình học và học cách làm việc ngược từ giải pháp để tìm hiểu xem liệu nó có cần thêm bất kỳ cấu trúc nào hay không. Chu trình này cho phép AI học từ đầu mà không cần bất kỳ sự can thiệp nào của con người.

Đưa AI vào thử nghiệm, nhóm đã thử thách nó với 30 bài toán Olympic từ hơn một thập kỷ thi đấu trước đó. Các kết quả tạo ra đã được đánh giá bởi người từng đoạt huy chương vàng Olympic, Evan Chen, để đảm bảo chất lượng của chúng.

Nhìn chung, AI phù hợp với thành tích của những người đoạt huy chương vàng trước đây, hoàn thành 25 bài toán trong thời gian giới hạn. Các kết quả tiên tiến trước đó có 10 câu trả lời đúng.

“Kết quả của AlphaGeometry rất ấn tượng vì nó vừa có thể kiểm chứng vừa rõ ràng,” Chen nói. “Nó sử dụng các quy tắc hình học cổ điển với các góc và các hình tam giác giống nhau giống như học sinh làm.”

Ngoài Toán học

AlphaGeometry là bước đột phá mới nhất của DeepMind vào lĩnh vực toán học. trong 2021, AI của họ đã giải được các câu đố toán học khiến con người bối rối trong nhiều thập kỷ. Gần đây hơn, họ đã sử dụng mô hình ngôn ngữ lớn để giải quyết các vấn đề STEM ở cấp đại học và nứt một bài toán “không thể giải được” trước đây dựa trên trò chơi bài bằng thuật toán Tìm kiếm thú vị.

Hiện tại, AlphaGeometry được điều chỉnh theo hình học và có các cảnh báo. Phần lớn hình học là trực quan, nhưng hệ thống không thể “nhìn thấy” các bản vẽ, điều này có thể đẩy nhanh việc giải quyết vấn đề. Thêm hình ảnh, có lẽ với AI Song Tử của Google, ra mắt vào cuối năm ngoái, có thể củng cố trí thông minh hình học của nó.

Một chiến lược tương tự cũng có thể mở rộng phạm vi tiếp cận của AlphaGeometry tới nhiều lĩnh vực khoa học đòi hỏi khả năng suy luận chặt chẽ kèm theo một chút sáng tạo. (Hãy thành thật đi—tất cả đều như vậy.)

Nhóm nghiên cứu viết: “Với tiềm năng lớn hơn của việc đào tạo hệ thống AI từ đầu bằng dữ liệu tổng hợp quy mô lớn, phương pháp này có thể định hình cách các hệ thống AI trong tương lai khám phá kiến ​​thức mới, về toán học và hơn thế nữa”.

Ảnh: Joel Filipe / Unsplash 

tại chỗ_img

Tin tức mới nhất

tại chỗ_img