Logo Zephyrnet

Nvidia tiết lộ kiến ​​trúc trung tâm dữ liệu Hopper

Ngày:


Hội nghị Công nghệ GPU (GTC) của Nvidia đang diễn ra. Suốt trong Bài phát biểu của CEO Jensen Huang, chi tiết về thế hệ tiếp theo của Nvidia Kiến trúc phễu đã được tiết lộ. Mặc dù đó là một GPU tập trung vào AI và trung tâm dữ liệu, nhưng nó cho chúng ta một vài gợi ý về những gì chúng ta có thể mong đợi từ game theo định hướng chơi game của Nvidia Ada Lovelace Kiến trúc GPU, sẽ được phát hành vào cuối năm 2022.

H100 là một bước tiến lớn so với A100 hàng đầu hiện nay. GPU đầy đủ chứa 80 tỷ bóng bán dẫn hoặc hơn 26 tỷ bóng bán dẫn so với A100. Nó được xây dựng trên quy trình TSMC 4nm tùy chỉnh. Nó hỗ trợ lên đến 80GB bộ nhớ HBM 3 cung cấp băng thông lên đến 3 TB / s.

H100 hỗ trợ PCIe 5.0 và NVLink để kết nối nhiều GPU với nhau. Nó có thể cung cấp 2,000 TFLOPS hiệu suất FP16 và 1,000 TFLOPS TF32, gấp ba lần so với A100. Hopper giới thiệu một tập lệnh mới gọi là DPX. Nó được thiết kế để tăng tốc hiệu suất trong các lĩnh vực đa dạng như chẩn đoán bệnh, mô phỏng lượng tử, phân tích đồ thị và tối ưu hóa định tuyến.

GPU H100 đầy đủ bao gồm 18432 lõi CUDA và 576 lõi Tensor. Điều đó so với A100 với 8192 và 512 tương ứng, mặc dù hiện tại không phải tất cả các lõi đều được mở khóa, có lẽ là để tối đa hóa năng suất. Các đồng hồ lõi cũng chưa được hoàn thiện. Mặc dù được chế tạo trên một nút tiên tiến như vậy, phiên bản SXM của H100 đi kèm với TDP 700W. Đúng vậy, bảy. hàng trăm. watt.

Đánh giá Steam Deck: Phán quyết của chúng tôi
Tính khả dụng của Steam Deck: Làm thế nào để có được một cái
Thời lượng pin của Steam Deck: Thời lượng pin thực
Độ ồn của Bộ bài hơi nước là bao nhiêu? Nói gì cơ?
Máy mơ phỏng: Trình giả lập cuối cùng
PC chơi game ngân sách tốt nhất: Anh hùng điểm giá

H100 được coi là một con quái vật của một thẻ bài, nhưng liệu nó có phù hợp với các game thủ PC? Câu trả lời là đại loại như vậy. H100 là tất cả về hiệu suất máy tính chứ không phải đồ họa, nhưng chúng tôi có thể lấy một số thông tin và sử dụng nó để dự đoán phiên bản chơi game có thể trông như thế nào.

Việc chuyển sang nút TSMC 4nm tùy chỉnh là một bước tiến lớn so với quy trình 8nm của Samsung được sử dụng cho dòng RTX-30. Nó cũng có thể được sử dụng cho các thẻ dòng RTX-40. Cũng đáng chú ý là hỗ trợ cho PCIe 5.0. Mặc dù bản thân nó không được kỳ vọng sẽ mang lại bất kỳ lợi ích hiệu suất thực sự nào so với PCIe 4.0, nhưng nó cũng có thể làm tốt hơn PCIe 3.0 vẫn đang được sử dụng rộng rãi trên nhiều hệ thống chơi game.

Thẻ Nvidia H100 Hopper PCIe

(Tín dụng hình ảnh: Nvidia)

Nhưng có lẽ điều phiền toái lớn nhất là TDP 700W khá đáng kinh ngạc của cấu hình cao cấp. Chỉ cần nhìn vào VRM của thẻ đó! 700W cho một sản phẩm trung tâm dữ liệu là thứ có thể được quản lý, nhưng nếu chúng tôi nhận được bất cứ điều gì như vậy cho một chiếc RTX 4090 hàng đầu thì chúng tôi sẽ bị sốc. Thật đáng buồn, tin đồn về mức tiêu thụ điện năng tăng mạnh tiếp tục lên bề mặt. Ngay cả 500W cũng là một bước nhảy vọt và nó có nghĩa là dù sao thì card đồ họa XNUMX khe cắm có thể trở thành tiêu chuẩn, ở vị trí hàng đầu trên thị trường.

Nvidia vẫn đang làm việc trên H100. Nếu các đặc điểm chính của nó được chia sẻ với dòng RTX 40, thì công bằng mà nói rằng các thẻ cao cấp sẽ nóng và ngốn điện, nhưng được trang bị đầy đủ công nghệ và nhanh hơn nhiều so với RTX 3090 (và sắp được phát hành RTX 3090 Ti). AMD sẽ cạnh tranh với Thẻ dựa trên RDNA3 và nó được định hình là một trận chiến địa ngục, với hiệu suất toàn diện rõ ràng là ưu tiên của cả hai công ty với chi phí tiết kiệm điện. Chúng tôi không thể chờ đợi!

tại chỗ_img

Tin tức mới nhất

tại chỗ_img