Tag: FP8

Pelatihan terdistribusi dan penskalaan yang efisien dengan Amazon SageMaker Model Parallel dan Data Parallel Libraries | Layanan Web Amazon

AI 16 April, 2024

Ada kemajuan luar biasa dalam bidang pembelajaran mendalam terdistribusi untuk model bahasa besar (LLM), terutama setelah rilis ChatGPT di...

Berita Top

Microsoft, OpenAI dikatakan sedang merencanakan pusat data AI senilai $100 miliar

AI 1 April, 2024

Menskalakan LLM dengan PyTorch 2.0 FSDP di Amazon EKS – Bagian 2 | Layanan Web Amazon

AI 1 April, 2024

Pembicara Utama NVIDIA GTC | Arsitektur Blackwell akan Mempercepat Produk AI pada Akhir tahun 2024

AI 20 Maret, 2024

Mengapa OpenAI mungkin melakukan lindung nilai atas taruhannya pada AI kuantum

AI13 Maret, 2024

Analisis Komputasi kuantum masih tersisa satu dekade lagi, namun menurut pakar industri, komputasi kuantum mungkin menyimpan rahasia...

Nvidia memperkenalkan GPU workstation kecil yang hemat daya

AIFebruari 12, 2024

Nvidia memperluas portofolio GPU-nya pada hari Senin dengan kartu stasiun kerja kecil yang diklaimnya memberikan peningkatan kinerja yang cukup besar sambil hanya menyedot daya, relatif...

Meta untuk menerapkan chip AI khusus bersama AMD, GPU Nvidia

AIFebruari 2, 2024

Setelah bertahun-tahun melakukan pengembangan, Meta akhirnya dapat meluncurkan akselerator AI buatannya dengan cara yang berarti pada tahun ini. Kerajaan Facebook mengonfirmasi keinginannya...

Menjelajahi Alternatif Sumber Terbuka untuk Model OpenAI

AINovember 29, 2023

Pendahuluan Bulan November merupakan tahun yang dramatis dalam bidang AI. Perjalanan yang cukup panjang sejak peluncuran toko GPT, GPT-4-turbo, hingga OpenAI...

Tingkatkan kinerja inferensi untuk LLM dengan kontainer Amazon SageMaker baru | Layanan Web Amazon

AINovember 27, 2023

Hari ini, Amazon SageMaker meluncurkan versi baru (0.25.0) dari Large Model Inference (LMI) Deep Learning Containers (DLC) dan menambahkan dukungan untuk Pustaka TensorRT-LLM NVIDIA....

Pipa RISC-V yang lebih dalam menembus loop vektor-skalar – Semiwiki

SemikonduktorSeptember 14, 2023

Banyak tolok ukur kinerja prosesor modern bergantung pada tiga tingkat cache yang terus disalurkan. Namun, aplikasi baru yang intensif data seperti generatif multithread...

Nvidia memberikan superchip Grace Hopper-nya peningkatan HBM3e

AI8 Agustus 2023

Kurang dari tiga bulan setelah superchip Grace Hopper Nvidia memasuki produksi penuh, CEO dan pecinta jaket kulit Jensen Huang minggu ini mengambil...

Menavigasi Mahalnya Komputasi AI

Blockchain27 April, 2023

Ledakan AI generatif terikat pada komputasi. Ini memiliki properti unik yang menambahkan lebih banyak penghitungan secara langsung menghasilkan produk yang lebih baik. Biasanya, investasi R&D...

Jadi Anda ingin mengganti pekerja dengan AI? Hati-hati dengan biaya pelatihan ulang, mereka adalah pembunuh

AIJanuari 29, 2023

Komentar Ocehan jernih dan seni yang disintesis oleh ChatGPT atau Stable Diffusion telah menangkap imajinasi dan memicu kontroversi mengenai peran tersebut...

FP8: Spesifikasi Perangkat Keras Lintas Industri Untuk Pelatihan dan Inferensi AI (Arm, Intel, Nvidia)

SemikonduktorSeptember 16, 2022

Arm, Intel, dan Nvidia mengusulkan spesifikasi untuk format floating point (FP8) 8-bit yang dapat menyediakan format umum yang dapat dipertukarkan yang berfungsi untuk...

Intelijen Terbaru