Merkeziyetsizlik AI eğitiminin öncü keşfi: Prime Intellect'ten Pluralis'e

Merkeziyetsizlik Eğitimi: AI Alanındaki Kutsal Kâse Keşfi

AI tam değer zincirinde, model eğitimi kaynak tüketimi en yüksek, teknik engeli en fazla olan aşamadır ve doğrudan modelin yetenek sınırını ve gerçek uygulama etkisini belirler. Çıkarım aşamasının hafif çağrılarıyla karşılaştırıldığında, eğitim süreci sürekli büyük ölçekli hesaplama gücü yatırımı, karmaşık veri işleme süreçleri ve yüksek yoğunluklu optimizasyon algoritmaları desteği gerektirir; bu, AI sisteminin inşasının gerçek "ağır sanayi"sidir. Mimari paradigması açısından, eğitim yöntemleri dört kategoriye ayrılabilir: merkezi eğitim, dağıtık eğitim, federasyon öğrenimi ve bu makalede odaklanılan Merkeziyetsizlik eğitimi.

Crypto AI'nin Kutsal Kâsesi: Merkeziyetsizlikle Eğitimdeki Sınırları Zorlama

Merkeziyetsizlik eğitimi, yerel yüksek performanslı kümelerde tek bir kurum tarafından tüm eğitim sürecinin tamamlandığı en yaygın geleneksel yöntemdir; donanım, alt yazılım, küme zamanlama sistemi ve eğitim çerçevesinin tüm bileşenleri, tek bir kontrol sistemi tarafından koordine edilerek çalıştırılır. Bu derin iş birliği mimarisi, bellek paylaşımının, gradyan senkronizasyonunun ve hata tolerans mekanizmalarının verimliliğini en üst düzeye çıkarır ve GPT, Gemini gibi büyük ölçekli modellerin eğitimi için oldukça uygundur; yüksek verimlilik ve kontrol edilebilir kaynaklar gibi avantajlara sahiptir, ancak aynı zamanda veri tekelciliği, kaynak engelleri, enerji tüketimi ve tek nokta riski gibi sorunlar da taşımaktadır.

Dağıtık eğitim, günümüz büyük model eğitiminde ana akım bir yöntemdir; bunun temelinde model eğitim görevlerinin parçalanıp birden fazla makineye dağıtılarak birlikte gerçekleştirilmesi yatmaktadır. Bu, tek bir makinenin hesaplama ve depolama darboğazlarını aşmak içindir. Fiziksel olarak "dağıtık" özelliklere sahip olsa da, genel olarak merkezi bir kurum tarafından kontrol edilmekte ve senkronize edilmektedir. Genellikle yüksek hızlı yerel ağ ortamlarında çalışmakta ve NVLink yüksek hızlı bağlantı teknolojisi ile ana düğüm, alt görevleri koordine etmektedir. Ana akım yöntemler şunları içerir:

  • Veri paralelliği: Her düğüm farklı veri parametreleri eğitiyor, model ağırlıklarının eşleşmesi gerekiyor.
  • Model paralelliği: Modelin farklı kısımlarını farklı düğümlere dağıtarak güçlü ölçeklenebilirlik sağlamak
  • Boru hattı paralel: Aşamalı seri yürütme, verimliliği artırır
  • Tensör paralelliği: Matris hesaplamalarının hassas bölünmesi, paralel granülasyonu artırır

Dağıtık eğitim, "merkezi kontrol + dağıtık yürütme" kombinasyonudur, aynı patronun uzaktan yöneterek birden fazla "ofis" çalışanının iş birliği içinde görevleri tamamlamasına benzer. Şu anda neredeyse tüm ana akım büyük modeller bu şekilde eğitim alıyor.

Crypto AI'nin Kutsal Kâsesi: Merkeziyetsizlik Eğitiminde Sınırları Zorlamak

Merkeziyetsizlik eğitimi, daha açık ve sansüre dayanıklı bir geleceği temsil eder. Temel özellikleri şunlardır: ( birbirine güvenmeyen birden fazla düğüm, merkezi bir koordinatör olmadan eğitim görevlerini işbirliği içinde tamamlamak için ev bilgisayarları, bulut GPU'ları veya kenar cihazları ) olabilir; genellikle protokoller aracılığıyla görev dağıtımı ve işbirliği sağlanır ve katkının dürüstlüğünü sağlamak için şifreleme teşvik mekanizmaları kullanılır. Bu modelin karşılaştığı başlıca zorluklar şunlardır:

  • Cihaz heterojenliği ve parçalama zorluğu: Heterojen cihazların koordinasyonu yüksek zorlukta, görev parçalama verimliliği düşük.
  • İletişim verimliliği darboğazı: Ağ iletişimi kararsız, gradyan senkronizasyonu darboğazı belirgin
  • Güvenilir yürütme eksikliği: Güvenilir yürütme ortamının eksikliği, düğümlerin gerçekten hesaplamaya katılıp katılmadığını doğrulamayı zorlaştırıyor.
  • Birlikte koordine eksikliği: Merkezi bir denetleyici yok, görev dağılımı, hata geri alma mekanizması karmaşık

Merkeziyetsizlik eğitimi, dünya genelindeki bir grup gönüllünün, her birinin hesap gücünü katkıda bulunarak modeli ortaklaşa eğitmesi olarak anlaşılabilir, ancak "gerçekten uygulanabilir büyük ölçekli merkeziyetsizlik eğitimi" hâlâ sistematik bir mühendislik zorluğu olup, sistem mimarisi, iletişim protokolleri, kripto güvenliği, ekonomik mekanizmalar, model doğrulama gibi birçok katmanla ilgilidir. Ancak "etkili işbirliği + dürüst teşvik + doğru sonuç" sağlanıp sağlanamayacağı hâlâ erken prototip keşif aşamasındadır.

Federated learning, bir geçiş biçimi olarak dağıtık ve Merkeziyetsizlik arasında, verilerin yerel olarak korunması ve model parametrelerinin merkezi olarak toplanmasını vurgular; bu, gizlilik uyumuna önem veren senaryolar için uygundur, örneğin sağlık ve finans (. Federated learning, dağıtık eğitim mühendislik yapısına ve yerel işbirliği yeteneğine sahiptir; aynı zamanda merkeziyetsiz eğitimdeki veri dağıtım avantajlarını taşır, ancak yine de güvenilir bir koordine ediciye bağımlıdır ve tamamen açık ve sansüre dayanıklı özelliklere sahip değildir. Bu, gizlilik uyum senaryolarında bir "kontrollü merkeziyetsizlik" çözümü olarak düşünülebilir; eğitim görevleri, güven yapısı ve iletişim mekanizması açısından görece ılımlıdır ve sanayi için geçici dağıtım yapıları olarak daha uygundur.

Merkeziyetsizlik eğitiminin sınırları, fırsatları ve gerçek yolları

Eğitim paradigması açısından, merkeziyetsizlik eğitimi tüm görev türleri için uygun değildir. Bazı senaryolarda, görev yapısının karmaşık olması, yüksek kaynak gereksinimleri veya işbirliği zorluğu nedeniyle, doğal olarak heterojen, güvensiz düğümler arasında verimli bir şekilde tamamlanması zordur. Örneğin, büyük model eğitimi genellikle yüksek bellek, düşük gecikme ve yüksek bant genişliğine ihtiyaç duyar; bu nedenle açık ağda etkin bir şekilde bölünüp senkronize edilmesi zordur; veri gizliliği ve egemenlik kısıtlamalarının güçlü olduğu görevler, yasal uyum ve etik kısıtlamalar nedeniyle açık paylaşımda bulunamaz; işbirliği teşvikleri olmayan görevler ise dış katılım motivasyonundan yoksundur. Bu sınırlar, mevcut merkeziyetsiz eğitim uygulamalarının gerçek kısıtlamalarını oluşturmaktadır.

Ancak bu, merkeziyetsizlik eğitiminin sahte bir önerme olduğu anlamına gelmez. Aslında, yapısal olarak hafif, kolay paralelleştirilebilir ve teşvik edici görev türlerinde merkeziyetsizlik eğitimi belirgin uygulama potansiyeli göstermektedir. Bunlar arasında ancak bunlarla sınırlı olmamak üzere: LoRA ince ayar, davranış uyumlu son eğitim görevleri ), RLHF, DPO (, veri toplama eğitimi ve etiketleme görevleri, kaynak kontrolüne sahip küçük temel model eğitimi ve kenar cihazlarının katıldığı iş birliği eğitimi senaryoları bulunmaktadır. Bu görevler genel olarak yüksek paralellik, düşük bağlanabilirlik ve heterojen hesaplama gücüne tolerans özelliklerine sahiptir, bu nedenle P2P ağları, Swarm protokolleri, dağıtık optimizatörler gibi yöntemlerle iş birliği eğitimi için son derece uygundur.

![Crypto AI'nin Kutsal Kâsesi: Merkeziyetsizlikle Eğitimdeki Sınırları Zorlamak])https://img-cdn.gateio.im/webp-social/moments-adb92bc4dfbaf26863cb0b4bb1081cd7.webp(

Merkeziyetsizlik eğitimi klasik proje analizi

Şu anda merkeziyetsizlik eğitim ve federatif öğrenme öncü alanında, temsilci blockchain projeleri arasında Prime Intellect, Pluralis.ai, Gensyn, Nous Research ve Flock.io bulunmaktadır. Teknik yenilikçilik ve mühendislik uygulama zorluğu açısından, Prime Intellect, Nous Research ve Pluralis.ai sistem mimarisi ve algoritma tasarımında daha fazla özgün keşif önermektedir ve mevcut teorik araştırmanın öncü yönlerini temsil etmektedir; Gensyn ve Flock.io'nun uygulama yolları ise nispeten net olup, ilk mühendislik ilerlemeleri gözlemlenmektedir. Bu makalede, bu beş projenin arkasındaki temel teknolojiler ve mühendislik yapıları sırasıyla analiz edilecek ve merkeziyetsiz AI eğitim sistemindeki farklılıkları ve tamamlayıcı ilişkileri daha fazla tartışılacaktır.

) Prime Intellect: Eğitim izleri doğrulanabilir güçlendirme öğrenimi işbirlikçi ağ öncüsü

Prime Intellect, güvene ihtiyaç duymayan bir AI eğitim ağı inşa etmeye kendini adamıştır, böylece herkes eğitim sürecine katılabilir ve hesaplama katkıları için güvenilir ödüller alabilir. Prime Intellect, PRIME-RL + TOPLOC + SHARDCAST üç temel modül aracılığıyla, doğrulanabilirlik, açıklık ve teşvik mekanizmasının tam olduğu bir AI merkeziyetsizlik eğitim sistemi inşa etmeyi hedeflemektedir.

01, Prime Intellect protokol yığın yapısı ve ana modül değeri

![Crypto AI'nin Kutsal Kâsesi: Merkeziyetsizlik Eğitiminin Önceki Keşfi]###https://img-cdn.gateio.im/webp-social/moments-69eb6c2dab3d6284b890285c71e7a47f.webp(

)# 02, Prime Intellect eğitiminin ana mekanizmalarının detaylı açıklaması

#PRIME-RL: Decoupled Asynchronous Reinforcement Learning Task Architecture

PRIME-RL, Prime Intellect'in Merkeziyetsizlik eğitim senaryoları için özelleştirilmiş bir görev modelleme ve yürütme çerçevesidir ve heterojen ağlar ile asenkron katılımcılar için tasarlanmıştır. Güçlendirme öğrenimi, öncelikli uyum nesnesi olarak kullanılmakta, eğitim, çıkarım ve ağırlık yükleme süreçleri yapısal olarak ayrıştırılmakta, bu sayede her eğitim düğümü yerel olarak bağımsız bir görev döngüsü tamamlayabilmekte ve standart arayüzler aracılığıyla doğrulama ve birleştirme mekanizmalarıyla işbirliği yapabilmektedir. Geleneksel denetimli öğrenme süreçleriyle karşılaştırıldığında, PRIME-RL, merkezi bir zamanlama ortamında esnek eğitimi gerçekleştirmek için daha uygundur; bu, sistem karmaşıklığını azaltmakta ve çoklu görev paralelliği ile strateji evrimi desteği için bir temel oluşturmaktadır.

#TOPLOC:Ağır olmayan eğitim davranış doğrulama mekanizması

TOPLOC###Güvenilir Gözlem & Politika-Yerel Kontrol(, Prime Intellect tarafından önerilen eğitim doğrulanabilirlik çekirdek mekanizmasıdır, bir düğümün gözlem verilerine dayanarak gerçekten etkili bir strateji öğrenimi gerçekleştirip gerçekleştirmediğini belirlemek için kullanılır. ZKML gibi ağır çözümlerden farklı olarak, TOPLOC, tam model yeniden hesaplamasına bağımlı değildir, bunun yerine "gözlem dizisi↔strateji güncellemesi" arasındaki yerel tutarlılık izini analiz ederek hafif yapı doğrulaması gerçekleştirir. Eğitim sürecindeki davranış izlerini doğrulanabilir nesnelere dönüştüren ilk yöntemdir, güvene dayanmayan eğitim ödül dağıtımını sağlamak için kritik bir yenilik olup, denetlenebilir, teşvik edici Merkeziyetsizlik işbirliği eğitim ağı oluşturmak için uygulanabilir bir yol sunar.

#SHARDCAST: Asenkron Ağırlık Toplama ve Yayılma Protokolü

SHARDCAST, Prime Intellect tarafından tasarlanmış bir ağırlık yayılımı ve toplama protokolüdür ve gerçek ağ ortamları için asenkron, bant genişliği kısıtlı ve düğüm durumu değişkenliğine özel olarak optimize edilmiştir. Gossip yayılım mekanizması ile yerel senkronizasyon stratejilerini birleştirerek, birden fazla düğümün senkronize olmayan durumlarda sürekli olarak kısmi güncellemeler göndermesine olanak tanır, ağırlıkların kademeli olarak yakınsamasını ve çoklu versiyon evrimini gerçekleştirir. Merkezi veya senkronize AllReduce yöntemlerine kıyasla, SHARDCAST, merkeziyetçilikten uzak eğitimlerin ölçeklenebilirliğini ve hata toleransını önemli ölçüde artırır; bu, kararlı ağırlık konsensüsü ve sürekli eğitim iterasyonları oluşturmanın temel temelidir.

#OpenDiLoCo: Seyrek Asenkron İletişim Çerçevesi

OpenDiLoCo, Prime Intellect ekibinin DeepMind tarafından önerilen DiLoCo fikrini bağımsız olarak gerçekleştirdiği ve açık kaynak olarak sunduğu bir iletişim optimizasyon çerçevesidir. Özellikle merkeziyetsiz eğitimde yaygın olan bant genişliği kısıtlılığı, cihaz heterojenliği ve düğüm istikrarsızlığı gibi zorluklarla başa çıkmak için tasarlanmıştır. Mimarisi veri paralelliğine dayanır, Ring, Expander, Small-World gibi seyrek topoloji yapıları oluşturarak küresel senkronizasyonun yüksek iletişim maliyetlerini önler ve model işbirliği eğitimini yalnızca yerel komşu düğümlere dayanarak tamamlar. Asenkron güncelleme ve kesinti tolerans mekanizması ile birleştirilen OpenDiLoCo, tüketici düzeyinde GPU'ların ve kenar cihazların eğitim görevlerine de istikrarlı bir şekilde katılmasını sağlar ve küresel işbirliği eğitimine katılabilirliği önemli ölçüde artırır. Merkeziyetsiz eğitim ağlarının inşası için temel iletişim altyapılarından biridir.

#PCCL: İşbirliği İletişim Kütüphanesi

PCCL)Prime Collective Communication Library(, Prime Intellect tarafından Merkeziyetsizlik AI eğitim ortamı için özel olarak tasarlanmış hafif iletişim kütüphanesidir ve geleneksel iletişim kütüphanelerinin heterojen cihazlar ve düşük bant genişliği ağlarındaki uyum sorunlarını çözmeyi amaçlamaktadır. PCCL, seyrek topolojiyi, gradyan sıkıştırmayı, düşük hassasiyet senkronizasyonunu ve kesinti geri yüklemeyi destekler, tüketici sınıfı GPU'larda ve istikrarsız düğümlerde çalışabilir, OpenDiLoCo protokolünün asenkron iletişim yeteneklerini destekleyen temel bileşendir. Bu, eğitim ağının bant genişliği toleransını ve cihaz uyumluluğunu önemli ölçüde artırır ve gerçekten açık, güvene dayanmayan bir işbirlikçi eğitim ağının "son mil" iletişim altyapısını sağlamaktadır.

)# 03, Prime Intellect teşvik ağı ve rol dağılımı

Prime Intellect, herkesin görevlere katılmasına ve gerçek katkılara dayalı ödüller kazanmasına olanak tanıyan, izin gerektirmeyen, doğrulanabilir ve ekonomik teşvik mekanizmasına sahip bir eğitim ağı inşa etti. Protokol, üç ana rol temelinde çalışmaktadır:

  • Görev başlatıcısı: Eğitim ortamını, başlangıç modelini, ödül fonksiyonunu ve doğrulama standartlarını tanımlamak
  • Eğitim düğümü: Yerel eğitim gerçekleştirin, ağırlık güncellemelerini ve gözlem izlerini gönderin
  • Doğrulama Düğümleri: Eğitim davranışlarının gerçekliğini doğrulamak için TOPLOC mekanizmasını kullanır ve ödül hesaplamasına ve strateji birleştirmeye katılır.

Protokolün temel süreçleri, görev yayınlama, düğüm eğitimi, iz doğrulama, ağırlık birleştirme ###SHARDCAST( ve ödül dağıtımını içerir ve "gerçek eğitim davranışları" etrafında bir teşvik kapalı döngü oluşturur.

![Crypto AI'nin Kutsal Kâsesi: Merkeziyetsizlik Eğitiminin Sınırlarını Keşfetme])https://img-cdn.gateio.im/webp-social/moments-b11af8d10db6e8baa0c19e87aa18dd82.webp(

)# 04, INTELLECT-2: İlk doğrulanabilir Merkeziyetsizlik eğitim modelinin yayımlanması

Prime Intellect, 2025 yılının Mayıs ayında INTELLECT-2'yi piyasaya sürdü. Bu, küresel ölçekte asenkron, güven gerektirmeyen Merkeziyetsizlik temelli düğümlerin işbirliği ile eğitilen ilk güçlendirilmiş öğrenme büyük modelidir ve parametre ölçeği 32B'ye ulaşmaktadır. INTELLECT-2 modeli, üç kıtada bulunan 100'den fazla GPU heterojen düğüm tarafından işbirliği ile eğitildi, tamamen asenkron bir yapı kullanılarak, eğitim süresi 400 saatten fazla sürdü ve asenkron işbirliği ağının uygulanabilirliğini ve istikrarını gösterdi. Bu model, yalnızca performans açısından bir atılım değil, aynı zamanda Prime Intellect'in önerdiği "

View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Reward
  • 6
  • Share
Comment
0/400
GasGuruvip
· 07-10 11:51
Bilgi İşlem Gücü hala en güvenilir şekilde merkezi. Dağıldı dağıldı.
View OriginalReply0
GhostAddressHuntervip
· 07-10 07:46
Bu ne zaman gerçekleşecek?
View OriginalReply0
MidnightSellervip
· 07-08 14:28
Bilgi İşlem Gücü卷起来了啊
View OriginalReply0
BridgeNomadvip
· 07-08 14:25
dağıtık yapay zeka eğitimi mi? köprüler gibi aynı güven sorunları bence... ilk büyük istismarı görene kadar bekleyin.
View OriginalReply0
JustHereForMemesvip
· 07-08 14:22
Aha, dağıtık AI eğitimi yapmak gerçekten para harcamak.
View OriginalReply0
LiquidationAlertvip
· 07-08 14:07
mahkum bireysel yatırımcı hızlandırıcısı işte geldi
View OriginalReply0
Trade Crypto Anywhere Anytime
qrCode
Scan to download Gate app
Community
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)