Tadi malam, DeepSeek merilis pembaruan versi V3 di suatu platform — DeepSeek-V3-0324, dengan parameter model mencapai 6850 miliar, terdapat peningkatan signifikan dalam kemampuan kode, desain UI, dan kemampuan inferensi.
Pada konferensi GTC 2025 yang baru-baru ini diadakan, CEO sebuah perusahaan teknologi memberikan pujian tinggi terhadap DeepSeek. Dia menekankan bahwa pemahaman pasar sebelumnya yang menganggap model efisien DeepSeek akan mengurangi permintaan terhadap chip adalah salah, dan permintaan komputasi di masa depan hanya akan meningkat, bukan menurun.
DeepSeek sebagai produk perwakilan terobosan algoritma, hubungan antara pasokan chip layak untuk dibahas. Mari kita analisis terlebih dahulu arti dari daya komputasi dan algoritma terhadap perkembangan industri AI.
Evolusi Simbiotik Antara Kekuatan Komputasi dan Algoritma
Dalam bidang AI, peningkatan daya komputasi menyediakan dasar untuk menjalankan algoritma yang lebih kompleks, memungkinkan model untuk memproses lebih banyak data dan mempelajari pola yang lebih rumit; sedangkan optimasi algoritma dapat memanfaatkan daya komputasi dengan lebih efisien, meningkatkan efisiensi penggunaan sumber daya komputasi.
Hubungan simbiotik antara daya komputasi dan algoritma sedang membentuk kembali lanskap industri AI:
Diferensiasi jalur teknologi: Beberapa perusahaan mengejar pembangunan kluster komputasi super besar, sementara yang lain fokus pada optimasi efisiensi algoritma, membentuk aliran teknologi yang berbeda.
Rekonstruksi rantai industri: Sebuah perusahaan chip menjadi pemimpin dalam kekuatan komputasi AI melalui ekosistemnya, sementara penyedia layanan cloud mengurangi hambatan penerapan melalui layanan komputasi elastis.
Penyesuaian alokasi sumber daya: Perusahaan mencari keseimbangan antara investasi infrastruktur perangkat keras dan pengembangan algoritma yang efisien.
Kebangkitan Komunitas Sumber Terbuka: Model sumber terbuka seperti DeepSeek, LLaMA, dan lainnya memungkinkan inovasi algoritma dan hasil optimasi daya komputasi untuk dibagikan, mempercepat iterasi dan penyebaran teknologi.
Inovasi Teknologi DeepSeek
Keberhasilan DeepSeek tidak terlepas dari inovasi teknologinya. Berikut adalah penjelasan singkat tentang poin-poin inovasinya yang utama:
Optimasi Arsitektur Model
DeepSeek mengadopsi arsitektur kombinasi Transformer+MOE (Mixture of Experts) dan memperkenalkan mekanisme perhatian laten multi-kepala (Multi-Head Latent Attention, MLA). Arsitektur ini seperti tim ahli yang efisien, mampu memanggil ahli yang paling sesuai untuk berbagai tugas, yang secara signifikan meningkatkan efisiensi dan akurasi model.
Inovasi Metode Pelatihan
DeepSeek mengajukan kerangka pelatihan presisi campuran FP8. Kerangka ini mampu memilih presisi komputasi yang sesuai secara dinamis sesuai dengan kebutuhan tahap berbeda dalam proses pelatihan, sambil menjaga akurasi model dan meningkatkan kecepatan pelatihan serta mengurangi penggunaan memori.
Peningkatan efisiensi inferensi
Pada tahap inferensi, DeepSeek memperkenalkan teknologi Prediksi Multi-Token (Multi-token Prediction, MTP). Teknologi ini dapat memprediksi beberapa Token sekaligus, yang secara signifikan mempercepat kecepatan inferensi, sekaligus mengurangi biaya inferensi.
Terobosan algoritma pembelajaran penguatan
Algoritma pembelajaran penguatan baru GRPO (Generalized Reward-Penalized Optimization) dari DeepSeek mengoptimalkan proses pelatihan model. Algoritma ini menjamin peningkatan kinerja model sambil mengurangi perhitungan yang tidak perlu, mencapai keseimbangan antara kinerja dan biaya.
Inovasi-inovasi ini membentuk sebuah sistem teknologi yang lengkap, secara menyeluruh mengurangi kebutuhan daya komputasi dari pelatihan hingga inferensi. Sekarang, kartu grafis konsumen biasa pun dapat menjalankan model AI yang kuat, secara signifikan menurunkan ambang batas aplikasi AI, sehingga lebih banyak pengembang dan perusahaan dapat terlibat dalam inovasi AI.
Dampak terhadap Pemasok Chip
Beberapa pandangan berpendapat bahwa DeepSeek telah melewati lapisan perangkat lunak dari suatu perusahaan chip tertentu, sehingga terlepas dari ketergantungan terhadapnya. Sebenarnya, DeepSeek melakukan optimasi algoritma langsung melalui set instruksi dasar perusahaan tersebut. Dengan mengoperasikan lapisan ini, DeepSeek dapat mencapai penyetelan kinerja yang lebih halus.
Dampak ini terhadap pemasok chip bersifat dua arah. Di satu sisi, DeepSeek semakin terikat dengan perangkat keras dan ekosistemnya, sementara penurunan ambang batas aplikasi AI dapat memperluas skala pasar secara keseluruhan; di sisi lain, optimasi algoritma DeepSeek mungkin mengubah struktur permintaan pasar untuk chip high-end, di mana beberapa model AI yang sebelumnya membutuhkan GPU high-end untuk dijalankan, sekarang mungkin dapat berjalan secara efisien pada GPU kelas menengah bahkan kelas konsumen.
Arti untuk Industri AI di China
Optimisasi algoritma DeepSeek memberikan jalur terobosan teknologi untuk industri AI di Tiongkok. Dalam konteks keterbatasan chip kelas atas, pemikiran "perangkat lunak menggantikan perangkat keras" mengurangi ketergantungan pada chip impor terkemuka.
Di hulu, algoritma yang efisien mengurangi tekanan permintaan daya komputasi, memungkinkan penyedia layanan komputasi untuk memperpanjang siklus penggunaan perangkat keras melalui optimasi perangkat lunak, meningkatkan pengembalian investasi. Di hilir, model sumber terbuka yang telah dioptimalkan menurunkan ambang pengembangan aplikasi AI. Banyak perusahaan kecil dan menengah dapat mengembangkan aplikasi yang kompetitif berdasarkan model DeepSeek tanpa memerlukan sumber daya komputasi yang besar, yang akan memunculkan lebih banyak solusi AI di berbagai bidang vertikal.
Dampak Mendalam Web3+AI
Infrastruktur AI terdesentralisasi
Optimisasi algoritma DeepSeek memberikan dorongan baru untuk infrastruktur AI Web3. Arsitektur inovatif, algoritma yang efisien, dan kebutuhan daya komputasi yang lebih rendah membuat inferensi AI terdesentralisasi menjadi mungkin. Arsitektur MoE secara alami cocok untuk penyebaran terdistribusi, di mana node yang berbeda dapat memiliki jaringan ahli yang berbeda, tanpa perlu satu node menyimpan model lengkap, yang secara signifikan mengurangi persyaratan penyimpanan dan komputasi satu node, sehingga meningkatkan fleksibilitas dan efisiensi model.
Kerangka pelatihan FP8 lebih lanjut mengurangi kebutuhan akan sumber daya komputasi kelas atas, sehingga lebih banyak sumber daya komputasi dapat bergabung ke dalam jaringan node. Ini tidak hanya menurunkan hambatan untuk berpartisipasi dalam komputasi AI terdesentralisasi, tetapi juga meningkatkan kemampuan dan efisiensi komputasi seluruh jaringan.
Sistem Multi-Agent
Optimasi Strategi Perdagangan Cerdas: Melalui analisis data pasar secara real-time, prediksi fluktuasi harga jangka pendek, eksekusi perdagangan di blockchain, dan pengawasan hasil perdagangan, kolaborasi beberapa agen cerdas membantu pengguna mendapatkan imbal hasil yang lebih tinggi.
Eksekusi otomatis kontrak pintar: Beberapa agen cerdas beroperasi secara kolaboratif untuk memantau, mengeksekusi, dan mengawasi hasil kontrak pintar, mewujudkan otomatisasi logika bisnis yang lebih kompleks.
Manajemen portofolio investasi yang dipersonalisasi: AI membantu pengguna mencari peluang staking atau penyediaan likuiditas terbaik secara real-time berdasarkan preferensi risiko, tujuan investasi, dan kondisi keuangan pengguna.
DeepSeek, di bawah batasan daya komputasi, mencari terobosan melalui inovasi algoritma, membuka jalur pengembangan diferensial untuk industri AI di Tiongkok. Mengurangi hambatan aplikasi, mendorong integrasi Web3 dan AI, mengurangi ketergantungan pada chip kelas atas, memberdayakan inovasi keuangan, pengaruh ini sedang membentuk kembali lanskap ekonomi digital. Di masa depan, perkembangan AI tidak lagi hanya merupakan perlombaan daya komputasi, tetapi adalah perlombaan kolaborasi optimal antara daya komputasi dan algoritma. Di jalur baru ini, inovator seperti DeepSeek sedang mendefinisikan ulang aturan permainan dengan kecerdasan Tiongkok.
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
14 Suka
Hadiah
14
7
Bagikan
Komentar
0/400
MeaninglessGwei
· 12jam yang lalu
Juga mengejar gelombang ai
Lihat AsliBalas0
SleepyArbCat
· 12jam yang lalu
Tidur yang nyenyak dulu, lagipula AI juga tidak terburu-buru untuk naik...zzzz
Lihat AsliBalas0
Hash_Bandit
· 12jam yang lalu
penambangan hash pada kesulitan maksimum... jujur saja, v3 ini terasa seperti peningkatan asic sebenarnya
DeepSeek V3 memperbarui memimpin paradigma baru AI Algoritme terobosan mendukung perkembangan Web3
Pembaruan DeepSeek V3 Memimpin Paradigma Baru AI
Tadi malam, DeepSeek merilis pembaruan versi V3 di suatu platform — DeepSeek-V3-0324, dengan parameter model mencapai 6850 miliar, terdapat peningkatan signifikan dalam kemampuan kode, desain UI, dan kemampuan inferensi.
Pada konferensi GTC 2025 yang baru-baru ini diadakan, CEO sebuah perusahaan teknologi memberikan pujian tinggi terhadap DeepSeek. Dia menekankan bahwa pemahaman pasar sebelumnya yang menganggap model efisien DeepSeek akan mengurangi permintaan terhadap chip adalah salah, dan permintaan komputasi di masa depan hanya akan meningkat, bukan menurun.
DeepSeek sebagai produk perwakilan terobosan algoritma, hubungan antara pasokan chip layak untuk dibahas. Mari kita analisis terlebih dahulu arti dari daya komputasi dan algoritma terhadap perkembangan industri AI.
Evolusi Simbiotik Antara Kekuatan Komputasi dan Algoritma
Dalam bidang AI, peningkatan daya komputasi menyediakan dasar untuk menjalankan algoritma yang lebih kompleks, memungkinkan model untuk memproses lebih banyak data dan mempelajari pola yang lebih rumit; sedangkan optimasi algoritma dapat memanfaatkan daya komputasi dengan lebih efisien, meningkatkan efisiensi penggunaan sumber daya komputasi.
Hubungan simbiotik antara daya komputasi dan algoritma sedang membentuk kembali lanskap industri AI:
Diferensiasi jalur teknologi: Beberapa perusahaan mengejar pembangunan kluster komputasi super besar, sementara yang lain fokus pada optimasi efisiensi algoritma, membentuk aliran teknologi yang berbeda.
Rekonstruksi rantai industri: Sebuah perusahaan chip menjadi pemimpin dalam kekuatan komputasi AI melalui ekosistemnya, sementara penyedia layanan cloud mengurangi hambatan penerapan melalui layanan komputasi elastis.
Penyesuaian alokasi sumber daya: Perusahaan mencari keseimbangan antara investasi infrastruktur perangkat keras dan pengembangan algoritma yang efisien.
Kebangkitan Komunitas Sumber Terbuka: Model sumber terbuka seperti DeepSeek, LLaMA, dan lainnya memungkinkan inovasi algoritma dan hasil optimasi daya komputasi untuk dibagikan, mempercepat iterasi dan penyebaran teknologi.
Inovasi Teknologi DeepSeek
Keberhasilan DeepSeek tidak terlepas dari inovasi teknologinya. Berikut adalah penjelasan singkat tentang poin-poin inovasinya yang utama:
Optimasi Arsitektur Model
DeepSeek mengadopsi arsitektur kombinasi Transformer+MOE (Mixture of Experts) dan memperkenalkan mekanisme perhatian laten multi-kepala (Multi-Head Latent Attention, MLA). Arsitektur ini seperti tim ahli yang efisien, mampu memanggil ahli yang paling sesuai untuk berbagai tugas, yang secara signifikan meningkatkan efisiensi dan akurasi model.
Inovasi Metode Pelatihan
DeepSeek mengajukan kerangka pelatihan presisi campuran FP8. Kerangka ini mampu memilih presisi komputasi yang sesuai secara dinamis sesuai dengan kebutuhan tahap berbeda dalam proses pelatihan, sambil menjaga akurasi model dan meningkatkan kecepatan pelatihan serta mengurangi penggunaan memori.
Peningkatan efisiensi inferensi
Pada tahap inferensi, DeepSeek memperkenalkan teknologi Prediksi Multi-Token (Multi-token Prediction, MTP). Teknologi ini dapat memprediksi beberapa Token sekaligus, yang secara signifikan mempercepat kecepatan inferensi, sekaligus mengurangi biaya inferensi.
Terobosan algoritma pembelajaran penguatan
Algoritma pembelajaran penguatan baru GRPO (Generalized Reward-Penalized Optimization) dari DeepSeek mengoptimalkan proses pelatihan model. Algoritma ini menjamin peningkatan kinerja model sambil mengurangi perhitungan yang tidak perlu, mencapai keseimbangan antara kinerja dan biaya.
Inovasi-inovasi ini membentuk sebuah sistem teknologi yang lengkap, secara menyeluruh mengurangi kebutuhan daya komputasi dari pelatihan hingga inferensi. Sekarang, kartu grafis konsumen biasa pun dapat menjalankan model AI yang kuat, secara signifikan menurunkan ambang batas aplikasi AI, sehingga lebih banyak pengembang dan perusahaan dapat terlibat dalam inovasi AI.
Dampak terhadap Pemasok Chip
Beberapa pandangan berpendapat bahwa DeepSeek telah melewati lapisan perangkat lunak dari suatu perusahaan chip tertentu, sehingga terlepas dari ketergantungan terhadapnya. Sebenarnya, DeepSeek melakukan optimasi algoritma langsung melalui set instruksi dasar perusahaan tersebut. Dengan mengoperasikan lapisan ini, DeepSeek dapat mencapai penyetelan kinerja yang lebih halus.
Dampak ini terhadap pemasok chip bersifat dua arah. Di satu sisi, DeepSeek semakin terikat dengan perangkat keras dan ekosistemnya, sementara penurunan ambang batas aplikasi AI dapat memperluas skala pasar secara keseluruhan; di sisi lain, optimasi algoritma DeepSeek mungkin mengubah struktur permintaan pasar untuk chip high-end, di mana beberapa model AI yang sebelumnya membutuhkan GPU high-end untuk dijalankan, sekarang mungkin dapat berjalan secara efisien pada GPU kelas menengah bahkan kelas konsumen.
Arti untuk Industri AI di China
Optimisasi algoritma DeepSeek memberikan jalur terobosan teknologi untuk industri AI di Tiongkok. Dalam konteks keterbatasan chip kelas atas, pemikiran "perangkat lunak menggantikan perangkat keras" mengurangi ketergantungan pada chip impor terkemuka.
Di hulu, algoritma yang efisien mengurangi tekanan permintaan daya komputasi, memungkinkan penyedia layanan komputasi untuk memperpanjang siklus penggunaan perangkat keras melalui optimasi perangkat lunak, meningkatkan pengembalian investasi. Di hilir, model sumber terbuka yang telah dioptimalkan menurunkan ambang pengembangan aplikasi AI. Banyak perusahaan kecil dan menengah dapat mengembangkan aplikasi yang kompetitif berdasarkan model DeepSeek tanpa memerlukan sumber daya komputasi yang besar, yang akan memunculkan lebih banyak solusi AI di berbagai bidang vertikal.
Dampak Mendalam Web3+AI
Infrastruktur AI terdesentralisasi
Optimisasi algoritma DeepSeek memberikan dorongan baru untuk infrastruktur AI Web3. Arsitektur inovatif, algoritma yang efisien, dan kebutuhan daya komputasi yang lebih rendah membuat inferensi AI terdesentralisasi menjadi mungkin. Arsitektur MoE secara alami cocok untuk penyebaran terdistribusi, di mana node yang berbeda dapat memiliki jaringan ahli yang berbeda, tanpa perlu satu node menyimpan model lengkap, yang secara signifikan mengurangi persyaratan penyimpanan dan komputasi satu node, sehingga meningkatkan fleksibilitas dan efisiensi model.
Kerangka pelatihan FP8 lebih lanjut mengurangi kebutuhan akan sumber daya komputasi kelas atas, sehingga lebih banyak sumber daya komputasi dapat bergabung ke dalam jaringan node. Ini tidak hanya menurunkan hambatan untuk berpartisipasi dalam komputasi AI terdesentralisasi, tetapi juga meningkatkan kemampuan dan efisiensi komputasi seluruh jaringan.
Sistem Multi-Agent
Optimasi Strategi Perdagangan Cerdas: Melalui analisis data pasar secara real-time, prediksi fluktuasi harga jangka pendek, eksekusi perdagangan di blockchain, dan pengawasan hasil perdagangan, kolaborasi beberapa agen cerdas membantu pengguna mendapatkan imbal hasil yang lebih tinggi.
Eksekusi otomatis kontrak pintar: Beberapa agen cerdas beroperasi secara kolaboratif untuk memantau, mengeksekusi, dan mengawasi hasil kontrak pintar, mewujudkan otomatisasi logika bisnis yang lebih kompleks.
Manajemen portofolio investasi yang dipersonalisasi: AI membantu pengguna mencari peluang staking atau penyediaan likuiditas terbaik secara real-time berdasarkan preferensi risiko, tujuan investasi, dan kondisi keuangan pengguna.
DeepSeek, di bawah batasan daya komputasi, mencari terobosan melalui inovasi algoritma, membuka jalur pengembangan diferensial untuk industri AI di Tiongkok. Mengurangi hambatan aplikasi, mendorong integrasi Web3 dan AI, mengurangi ketergantungan pada chip kelas atas, memberdayakan inovasi keuangan, pengaruh ini sedang membentuk kembali lanskap ekonomi digital. Di masa depan, perkembangan AI tidak lagi hanya merupakan perlombaan daya komputasi, tetapi adalah perlombaan kolaborasi optimal antara daya komputasi dan algoritma. Di jalur baru ini, inovator seperti DeepSeek sedang mendefinisikan ulang aturan permainan dengan kecerdasan Tiongkok.