Data Jinshi 24 Februari, DeepSeek hari ini meluncurkan 'Minggu Sumber Terbuka', dengan repositori kode pertama yang menjadi Flash MLA - inti dekode MLA efisien yang dioptimalkan untuk GPU Hopper, dirancang khusus untuk menangani urutan panjang yang dapat bervariasi. Menurut penjelasan, inspirasi dari Flash MLA berasal dari FlashAttention 2&3 dan proyek cutlass.
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
2 Suka
Hadiah
2
1
Bagikan
Komentar
0/400
ZhaoZhao
· 02-24 02:24
Data Jinshi 24 Februari, DeepSeek hari ini meluncurkan "Minggu Sumber Terbuka", repositori kode Sumber Terbuka pertama adalah Flash MLA - inti dekompresi MLA efisien yang dioptimalkan untuk GPU Hopper, dirancang khusus untuk mengolah urutan panjang variabel. Menurut informasi, inspirasi Flash MLA berasal dari FlashAttention 2&3 dan proyek cutlass.
DeepSeek memulai Minggu Sumber Terbuka
Data Jinshi 24 Februari, DeepSeek hari ini meluncurkan 'Minggu Sumber Terbuka', dengan repositori kode pertama yang menjadi Flash MLA - inti dekode MLA efisien yang dioptimalkan untuk GPU Hopper, dirancang khusus untuk menangani urutan panjang yang dapat bervariasi. Menurut penjelasan, inspirasi dari Flash MLA berasal dari FlashAttention 2&3 dan proyek cutlass.