Merkeziyetsizlik Eğitimi: AI'nın Bir Sonraki Sınırı
AI'nin tüm değer zincirinde, model eğitimi en fazla kaynak tüketen ve en yüksek teknik engel olan aşamadır, doğrudan modelin yetenek sınırını ve gerçek uygulama etkisini belirler. Çıkarma aşamasının hafif çağrısına kıyasla, eğitim süreci sürekli büyük ölçekli hesaplama gücü yatırımı, karmaşık veri işleme süreçleri ve yüksek yoğunluklu optimizasyon algoritması desteği gerektirir, bu da AI sisteminin inşasında gerçek "ağır sanayi"dir. Mimari paradigması açısından, eğitim yöntemleri dört kategoriye ayrılabilir: merkezi eğitim, dağıtık eğitim, federatif öğrenme ve bu makalede odaklanılan Merkeziyetsizlik eğitim.
Merkeziyetsiz eğitim en yaygın geleneksel yöntemdir, tek bir kuruluş tarafından yerel yüksek performanslı küme içinde tüm eğitim süreci tamamlanır; donanım, altyapı yazılımı, küme zamanlama sistemi ve eğitim çerçevesindeki tüm bileşenler tek bir kontrol sistemi tarafından koordine edilir. Bu derin işbirliği mimarisi bellek paylaşımı, gradyan senkronizasyonu ve hata toleransı mekanizmalarının verimliliğini en üst düzeye çıkarır, GPT, Gemini gibi büyük ölçekli modellerin eğitimi için oldukça uygundur, yüksek verimlilik ve kontrol edilebilir kaynaklar avantajına sahiptir; ancak aynı zamanda veri tekelinin, kaynak engellerinin, enerji tüketiminin ve tek nokta riski gibi sorunları da barındırmaktadır.
Dağıtık eğitim, günümüzde büyük model eğitiminde ana akım bir yöntemdir; bunun temeli, model eğitim görevlerinin parçalanıp birden fazla makineye dağıtılarak birlikte yürütülmesidir. Bu, tek makine hesaplama ve depolama darboğazını aşmayı amaçlar. Fiziksel olarak "dağıtık" özelliklere sahip olmasına rağmen, genel olarak merkezi kuruluşlar tarafından kontrol edilen, planlanan ve senkronize edilen bir yapıdadır ve genellikle yüksek hızlı yerel alan ağı (LAN) ortamlarında çalışır; ana düğüm, tüm alt görevlerin koordinasyonunu sağlar. Ana akım yöntemler şunlardır:
Veri paralelliği: Her düğüm farklı veri parametrelerini eğitir, model ağırlıkları eşleşmelidir.
Model paralelliği: Modelin farklı bölümlerini farklı düğümlere dağıtarak güçlü ölçeklenebilirlik sağlamak
Boru hattı paralel: Aşamalı seri yürütme, verimliliği artırır.
Tensör paralelliği: Matris hesaplamalarını ince bir şekilde böler, paralel granülasyonu artırır
Dağıtık eğitim, "merkezi kontrol + dağıtık yürütme" kombinasyonudur; bu, aynı patronun uzaktan birden fazla "ofis" çalışanını bir araya getirerek bir görev tamamlamasını sağlamak gibidir. Şu anda neredeyse tüm önde gelen büyük modeller bu yöntemle eğitilmektedir.
Merkeziyetsizlik eğitimi, daha açık ve sansüre dirençli bir gelecek yolunu temsil eder. Temel özellikleri şunlardır: Merkezi bir koordinatör olmadan, birbirine güvenmeyen birçok düğüm eğitim görevlerini işbirliği içinde tamamlar ve genellikle görev dağılımı ve işbirliği için protokol ile yönlendirilir ve katkıların dürüstlüğünü sağlamak için kriptografik teşvik mekanizmaları kullanılır. Bu modelin karşılaştığı başlıca zorluklar şunlardır:
Cihaz heterojenliği ve parçalama zorluğu: Heterojen cihazların koordinasyonu zor, görev parçalama verimliliği düşük
İletişim verimliliği darboğazı: Ağ iletişimi istikrarsız, gradyan senkronizasyonu darboğazı belirgin
Birlikte koordinasyon eksikliği: Merkezi bir düzenleyici yok, görev dağıtımı ve hata geri alma mekanizması karmaşık.
Merkeziyetsizlik eğitimi, dünya genelindeki bir grup gönüllünün kendi hesaplama güçlerini katkıda bulunarak model eğitimi yapabilmesi olarak anlaşılabilir; ancak "gerçekten uygulanabilir büyük ölçekli merkeziyetsiz eğitim" hala sistematik bir mühendislik zorluğu olarak kalmaktadır. Bu, sistem mimarisi, iletişim protokolleri, şifre güvenliği, ekonomik mekanizmalar, model doğrulama gibi birçok düzeyi kapsamaktadır. Ancak "iş birliği etkili + dürüstlüğü teşvik etme + sonuçların doğruluğu" konuları hâlâ erken prototip keşif aşamasındadır.
Federated learning, bir geçiş biçimi olarak merkeziyetsizlik ile dağıtılmışlık arasında, verilerin yerel olarak saklanmasını ve model parametrelerinin merkezi olarak toplanmasını vurgular, gizlilik uyumuna önem veren senaryolar için uygundur. Federated learning, dağıtılmış eğitim mühendislik yapısına ve yerel işbirliği yeteneğine sahipken, aynı zamanda merkeziyetsiz eğitimdeki veri dağıtım avantajını da taşır, ancak yine de güvenilir bir koordinatör tarafa bağımlıdır ve tamamen açık ve sansüre dayanıklı özelliklere sahip değildir. Gizlilik uyum senaryolarında "kontrollü merkeziyetsizlik" çözümü olarak düşünülebilir, eğitim görevleri, güven yapısı ve iletişim mekanizmaları açısından daha ılımlıdır ve sanayi alanında geçiş dönemi dağıtım mimarisi olarak daha uygundur.
Merkeziyetsizlik eğitiminin sınırları, fırsatları ve gerçek yolları
Eğitim paradigması açısından, merkeziyetsiz eğitim tüm görev türlerine uygun değildir. Bazı senaryolarda, görev yapısı karmaşık, kaynak gereksinimleri çok yüksek veya işbirliği zorluğu büyük olduğunda, doğal olarak heterojen, güvensiz düğümler arasında verimli bir şekilde tamamlanması zorlaşır. Örneğin, büyük model eğitimi genellikle yüksek bellek, düşük gecikme ve yüksek bant genişliğine bağımlıdır, açık ağlarda etkili bir şekilde bölünmesi ve senkronize edilmesi zordur; veri gizliliği ve egemenlik kısıtlamaları olan görevler, yasal uyum ve etik kısıtlamalar nedeniyle açık bir şekilde paylaşılamaz; işbirliği teşvik temelinden yoksun görevler ise dış katılım motivasyonundan yoksundur. Bu sınırlar, mevcut merkeziyetsiz eğitimin gerçek kısıtlamalarını oluşturmaktadır.
Ama bu, merkeziyetsizlik eğitiminin bir sahte önerme olduğu anlamına gelmez. Aslında, yapı olarak hafif, kolay paralel hale getirilebilen ve teşvik edici görev türlerinde, merkeziyetsizlik eğitimi belirgin uygulama potansiyeli göstermektedir. Bunlar arasında, ancak bunlarla sınırlı olmamak üzere: LoRA ince ayarı, davranış hizalama sonrası eğitim görevleri, veri toplama eğitimi ve etiketleme görevleri, kaynak kontrolüne sahip küçük temel model eğitimleri ve kenar cihazlarının katıldığı işbirlikçi eğitim senaryoları bulunmaktadır. Bu görevler genel olarak yüksek paralellik, düşük bağlılık ve heterojen hesaplama gücüne tolerans gibi özelliklere sahiptir; bu nedenle P2P ağları, Swarm protokolleri, dağıtık optimizasyoncüler gibi yöntemler aracılığıyla işbirlikçi eğitim yapmak için son derece uygundur.
Merkeziyetsizlik Eğitimi Klasik Proje Analizi
Şu anda merkeziyetsizlik eğitim ve federatif öğrenme öncülüğünde, temsilci blockchain projeleri arasında Prime Intellect, Pluralis.ai, Gensyn, Nous Research ve Flock.io yer almaktadır. Teknolojik yenilik ve mühendislik uygulama zorluğu açısından, Prime Intellect, Nous Research ve Pluralis.ai sistem mimarisi ve algoritma tasarımı konusunda daha fazla özgün keşif önermiştir ve mevcut teorik araştırmaların öncü yönlerini temsil etmektedir; Gensyn ve Flock.io'nun uygulama yolları ise daha net olup, başlangıç mühendislik ilerlemeleri gözlemlenmektedir. Bu makalede, bu beş projenin arkasındaki temel teknoloji ve mühendislik yapısı sırayla analiz edilecek ve merkeziyetsiz AI eğitim sistemindeki farklılıklar ve tamamlayıcı ilişkileri daha da tartışılacaktır.
Prime Intellect: Eğitim izleri doğrulanabilir güçlendirilmiş öğrenme işbirliği ağı öncüsü
Prime Intellect, güvene ihtiyaç duymayan bir AI eğitim ağı inşa etmeye kendini adamıştır; herkesin eğitime katılabilmesi ve hesap katkıları için güvenilir ödüller alabilmesi sağlanacaktır. Prime Intellect, PRIM-RL + TOPLOC + SHARDCAST üç ana modülüyle, doğrulanabilir, açık ve teşvik mekanizmalarıyla donatılmış bir AI merkeziyetsiz eğitim sistemi inşa etmeyi hedeflemektedir.
01, Prime Intellect protokol yığını yapısı ve ana modül değeri
Prime Intellect'in temel mimarisi aşağıdaki ana modülleri içerir:
PRIME-RL: Ayrık Asenkron Güçlendirme Öğrenme Görev Mimarisi
TOPLOC: Hafif Ağırlık Eğitim Davranış Doğrulama Mekanizması
SHARDCAST: Asenkron Ağırlık Toplama ve Yayılma Protokolü
OpenDiLoCo: Seyrek Asenkron İletişim Çerçevesi
PCCL: İşbirliği İletişim Kütüphanesi
02, Prime Intellect eğitim anahtar mekanizmalarının detaylı açıklaması
PRIME-RL, Prime Intellect tarafından Merkeziyetsizlik eğitim senaryoları için özel olarak tasarlanmış bir görev modelleme ve yürütme çerçevesidir, heterojen ağlar ve asenkron katılım için özel olarak tasarlanmıştır. Güçlendirilmiş öğrenmeyi öncelikli uyum nesnesi olarak kullanır, eğitim, çıkarım ve ağırlık yükleme sürecini yapısal olarak birbirinden ayırır, böylece her eğitim düğümü yerel olarak bağımsız olarak görev döngüsünü tamamlayabilir ve standart arayüzler aracılığıyla doğrulama ve birleştirme mekanizmalarıyla işbirliği yapabilir. Geleneksel denetimli öğrenme süreçlerine kıyasla, PRIME-RL merkezi bir planlama ortamında esnek eğitim gerçekleştirmek için daha uygundur, hem sistem karmaşıklığını azaltır hem de çoklu görev paralelliği ve strateji evrimi için bir temel oluşturur.
TOPLOC, Prime Intellect tarafından önerilen, bir düğümün gerçekten gözlem verilerine dayanarak etkili bir strateji öğrenimi gerçekleştirip gerçekleştirmediğini belirlemek için kullanılan eğitim doğrulama çekirdek mekanizmasıdır. ZKML gibi ağır çözümlerden farklı olarak, TOPLOC tam model yeniden hesaplamasına dayanmaz, bunun yerine "gözlem dizisi↔strateji güncellemesi" arasındaki yerel tutarlılık izlerini analiz ederek hafif yapı doğrulamasını tamamlar. Eğitim sürecindeki davranış izlerini doğrulanabilir nesnelere dönüştüren ilk sistemdir; bu, güvene ihtiyaç duymayan eğitim ödül dağıtımını gerçekleştirmenin anahtar yeniliğidir ve denetlenebilir, teşvik edici bir Merkeziyetsizlik işbirliği eğitim ağı inşa etmek için uygulanabilir bir yol sunar.
SHARDCAST, Prime Intellect tarafından tasarlanan ağırlık yayılımı ve toplama protokolüdür, asenkron, bant genişliği kısıtlı ve düğüm durumu değişken olan gerçek ağ ortamları için optimize edilmiştir. Gossip yayılım mekanizması ile yerel senkronizasyon stratejisini birleştirerek, birden fazla düğümün farklı senkronizasyon durumlarında sürekli kısmi güncellemeler göndermesine olanak tanır ve ağırlıkların kademeli yakınsamasını ve çoklu versiyon evrimini gerçekleştirir. Merkezi veya senkronize AllReduce yöntemleri ile karşılaştırıldığında, SHARDCAST merkeziyetsizlik eğitiminde ölçeklenebilirliği ve hata toleransı yeteneğini önemli ölçüde artırmaktadır, kararlı ağırlık konsensüsünün oluşturulması ve sürekli eğitim iterasyonlarının temel altyapısını sağlamaktadır.
OpenDiLoCo, Prime Intellect ekibinin DeepMind tarafından önerilen DiLoCo fikrini bağımsız olarak gerçekleştirdiği ve açık kaynak yaptığı bir iletişim optimizasyon çerçevesidir ve merkeziyetsiz eğitimde sık karşılaşılan bant genişliği kısıtlılığı, cihaz heterojenliği ve düğüm istikrarsızlığı gibi zorluklar için özel olarak tasarlanmıştır. Mimarisi veri paralelliğine dayanmakta olup, Ring, Expander, Small-World gibi seyrek topolojik yapılar inşa ederek küresel senkronizasyonun yüksek iletişim maliyetinden kaçınmakta ve yalnızca yerel komşu düğümlere bağımlı kalarak modelin işbirlikçi eğitimini tamamlamaktadır. Asenkron güncellemeler ve kesinti tolerans mekanizması ile bir araya geldiğinde, OpenDiLoCo, tüketici seviyesindeki GPU'ların ve kenar cihazlarının eğitim görevlerine kararlı bir şekilde katılmasını sağlamakta ve küresel işbirlikçi eğitimin katılımını önemli ölçüde artırmakta, merkeziyetsiz eğitim ağlarının inşası için kritik iletişim altyapılarından biri olmaktadır.
PCCL, Prime Intellect tarafından merkeziyetsizlik AI eğitim ortamı için özel olarak tasarlanmış hafif bir iletişim kütüphanesidir ve geleneksel iletişim kütüphanelerinin heterojen cihazlar ve düşük bant genişliği ağlarındaki uyum sorunlarını çözmeyi amaçlamaktadır. PCCL, seyrek topolojileri, gradyan sıkıştırmayı, düşük hassasiyetli senkronizasyonu ve kesinti kurtarmayı destekler, tüketici sınıfı GPU ve istikrarsız düğümler üzerinde çalışabilir; OpenDiLoCo protokolünün asenkron iletişim yeteneklerinin temel bileşenidir. Eğitim ağının bant genişliği toleransını ve cihaz uyumluluğunu önemli ölçüde artırarak, gerçekten açık ve güvene ihtiyaç duymayan bir işbirlikçi eğitim ağı inşa etmek için "son bir mil" iletişim temelini sağlamaktadır.
03, Prime Intellect teşvik ağı ve rol dağılımı
Prime Intellect, herkesin görevlere katılabilmesini ve gerçek katkılara dayalı ödüller kazanabilmesini sağlayan, izin gerektirmeyen, doğrulanabilir ve ekonomik teşvik mekanizmasına sahip bir eğitim ağı inşa etti. Protokol, üç ana rol üzerine çalışmaktadır:
Görev başlatıcısı: eğitim ortamını, başlangıç modelini, ödül fonksiyonunu ve doğrulama standartlarını tanımlar.
Eğitim düğümü: Yerel eğitim yap, ağırlık güncellemelerini ve gözlem izlerini gönder
Doğrulama Düğümü: Eğitim davranışının gerçekliğini doğrulamak için TOPLOC mekanizmasını kullanır ve ödül hesaplama ile strateji birleştirmeye katılır.
Protokolün temel süreçleri arasında görev yayınlama, düğüm eğitimi, iz doğrulama, ağırlık birleştirme ve ödül dağıtımı yer almaktadır; bu süreçler, "gerçek eğitim davranışı" etrafında bir teşvik kapalı döngü oluşturmaktadır.
04, INTELLECT-2: İlk doğrulanabilir Merkeziyetsizlik eğitim modelinin yayımlanması
Prime Intellect, 2025 yılının Mayıs ayında, asenkron, güvene ihtiyaç duymayan Merkeziyetsizlik düğümleri ile işbirliği yaparak eğitilen dünyanın ilk güçlendirilmiş öğrenme büyük modeli olan INTELLECT-2'yi tanıttı. INTELLECT-2 modelinin parametre ölçeği 32B'ye ulaşıyor. INTELLECT-2 modeli, üç kıtada 100'den fazla GPU heterojen düğüm tarafından işbirliği ile eğitildi.
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
11 Likes
Reward
11
3
Share
Comment
0/400
airdrop_whisperer
· 07-04 00:05
AI için kimler ekran kartlarını sattı?
View OriginalReply0
GateUser-aa7df71e
· 07-01 22:27
Bu AI eğitim patlaması mutlaka büyük yükseliş yapacak. Bir Pozisyon Oluşturun tam zamanı.
Merkeziyetsizlik eğitimi: AI öncü teknolojisinin analizi ve temsilci projelerin karşılaştırması
Merkeziyetsizlik Eğitimi: AI'nın Bir Sonraki Sınırı
AI'nin tüm değer zincirinde, model eğitimi en fazla kaynak tüketen ve en yüksek teknik engel olan aşamadır, doğrudan modelin yetenek sınırını ve gerçek uygulama etkisini belirler. Çıkarma aşamasının hafif çağrısına kıyasla, eğitim süreci sürekli büyük ölçekli hesaplama gücü yatırımı, karmaşık veri işleme süreçleri ve yüksek yoğunluklu optimizasyon algoritması desteği gerektirir, bu da AI sisteminin inşasında gerçek "ağır sanayi"dir. Mimari paradigması açısından, eğitim yöntemleri dört kategoriye ayrılabilir: merkezi eğitim, dağıtık eğitim, federatif öğrenme ve bu makalede odaklanılan Merkeziyetsizlik eğitim.
Merkeziyetsiz eğitim en yaygın geleneksel yöntemdir, tek bir kuruluş tarafından yerel yüksek performanslı küme içinde tüm eğitim süreci tamamlanır; donanım, altyapı yazılımı, küme zamanlama sistemi ve eğitim çerçevesindeki tüm bileşenler tek bir kontrol sistemi tarafından koordine edilir. Bu derin işbirliği mimarisi bellek paylaşımı, gradyan senkronizasyonu ve hata toleransı mekanizmalarının verimliliğini en üst düzeye çıkarır, GPT, Gemini gibi büyük ölçekli modellerin eğitimi için oldukça uygundur, yüksek verimlilik ve kontrol edilebilir kaynaklar avantajına sahiptir; ancak aynı zamanda veri tekelinin, kaynak engellerinin, enerji tüketiminin ve tek nokta riski gibi sorunları da barındırmaktadır.
Dağıtık eğitim, günümüzde büyük model eğitiminde ana akım bir yöntemdir; bunun temeli, model eğitim görevlerinin parçalanıp birden fazla makineye dağıtılarak birlikte yürütülmesidir. Bu, tek makine hesaplama ve depolama darboğazını aşmayı amaçlar. Fiziksel olarak "dağıtık" özelliklere sahip olmasına rağmen, genel olarak merkezi kuruluşlar tarafından kontrol edilen, planlanan ve senkronize edilen bir yapıdadır ve genellikle yüksek hızlı yerel alan ağı (LAN) ortamlarında çalışır; ana düğüm, tüm alt görevlerin koordinasyonunu sağlar. Ana akım yöntemler şunlardır:
Dağıtık eğitim, "merkezi kontrol + dağıtık yürütme" kombinasyonudur; bu, aynı patronun uzaktan birden fazla "ofis" çalışanını bir araya getirerek bir görev tamamlamasını sağlamak gibidir. Şu anda neredeyse tüm önde gelen büyük modeller bu yöntemle eğitilmektedir.
Merkeziyetsizlik eğitimi, daha açık ve sansüre dirençli bir gelecek yolunu temsil eder. Temel özellikleri şunlardır: Merkezi bir koordinatör olmadan, birbirine güvenmeyen birçok düğüm eğitim görevlerini işbirliği içinde tamamlar ve genellikle görev dağılımı ve işbirliği için protokol ile yönlendirilir ve katkıların dürüstlüğünü sağlamak için kriptografik teşvik mekanizmaları kullanılır. Bu modelin karşılaştığı başlıca zorluklar şunlardır:
Merkeziyetsizlik eğitimi, dünya genelindeki bir grup gönüllünün kendi hesaplama güçlerini katkıda bulunarak model eğitimi yapabilmesi olarak anlaşılabilir; ancak "gerçekten uygulanabilir büyük ölçekli merkeziyetsiz eğitim" hala sistematik bir mühendislik zorluğu olarak kalmaktadır. Bu, sistem mimarisi, iletişim protokolleri, şifre güvenliği, ekonomik mekanizmalar, model doğrulama gibi birçok düzeyi kapsamaktadır. Ancak "iş birliği etkili + dürüstlüğü teşvik etme + sonuçların doğruluğu" konuları hâlâ erken prototip keşif aşamasındadır.
Federated learning, bir geçiş biçimi olarak merkeziyetsizlik ile dağıtılmışlık arasında, verilerin yerel olarak saklanmasını ve model parametrelerinin merkezi olarak toplanmasını vurgular, gizlilik uyumuna önem veren senaryolar için uygundur. Federated learning, dağıtılmış eğitim mühendislik yapısına ve yerel işbirliği yeteneğine sahipken, aynı zamanda merkeziyetsiz eğitimdeki veri dağıtım avantajını da taşır, ancak yine de güvenilir bir koordinatör tarafa bağımlıdır ve tamamen açık ve sansüre dayanıklı özelliklere sahip değildir. Gizlilik uyum senaryolarında "kontrollü merkeziyetsizlik" çözümü olarak düşünülebilir, eğitim görevleri, güven yapısı ve iletişim mekanizmaları açısından daha ılımlıdır ve sanayi alanında geçiş dönemi dağıtım mimarisi olarak daha uygundur.
Merkeziyetsizlik eğitiminin sınırları, fırsatları ve gerçek yolları
Eğitim paradigması açısından, merkeziyetsiz eğitim tüm görev türlerine uygun değildir. Bazı senaryolarda, görev yapısı karmaşık, kaynak gereksinimleri çok yüksek veya işbirliği zorluğu büyük olduğunda, doğal olarak heterojen, güvensiz düğümler arasında verimli bir şekilde tamamlanması zorlaşır. Örneğin, büyük model eğitimi genellikle yüksek bellek, düşük gecikme ve yüksek bant genişliğine bağımlıdır, açık ağlarda etkili bir şekilde bölünmesi ve senkronize edilmesi zordur; veri gizliliği ve egemenlik kısıtlamaları olan görevler, yasal uyum ve etik kısıtlamalar nedeniyle açık bir şekilde paylaşılamaz; işbirliği teşvik temelinden yoksun görevler ise dış katılım motivasyonundan yoksundur. Bu sınırlar, mevcut merkeziyetsiz eğitimin gerçek kısıtlamalarını oluşturmaktadır.
Ama bu, merkeziyetsizlik eğitiminin bir sahte önerme olduğu anlamına gelmez. Aslında, yapı olarak hafif, kolay paralel hale getirilebilen ve teşvik edici görev türlerinde, merkeziyetsizlik eğitimi belirgin uygulama potansiyeli göstermektedir. Bunlar arasında, ancak bunlarla sınırlı olmamak üzere: LoRA ince ayarı, davranış hizalama sonrası eğitim görevleri, veri toplama eğitimi ve etiketleme görevleri, kaynak kontrolüne sahip küçük temel model eğitimleri ve kenar cihazlarının katıldığı işbirlikçi eğitim senaryoları bulunmaktadır. Bu görevler genel olarak yüksek paralellik, düşük bağlılık ve heterojen hesaplama gücüne tolerans gibi özelliklere sahiptir; bu nedenle P2P ağları, Swarm protokolleri, dağıtık optimizasyoncüler gibi yöntemler aracılığıyla işbirlikçi eğitim yapmak için son derece uygundur.
Merkeziyetsizlik Eğitimi Klasik Proje Analizi
Şu anda merkeziyetsizlik eğitim ve federatif öğrenme öncülüğünde, temsilci blockchain projeleri arasında Prime Intellect, Pluralis.ai, Gensyn, Nous Research ve Flock.io yer almaktadır. Teknolojik yenilik ve mühendislik uygulama zorluğu açısından, Prime Intellect, Nous Research ve Pluralis.ai sistem mimarisi ve algoritma tasarımı konusunda daha fazla özgün keşif önermiştir ve mevcut teorik araştırmaların öncü yönlerini temsil etmektedir; Gensyn ve Flock.io'nun uygulama yolları ise daha net olup, başlangıç mühendislik ilerlemeleri gözlemlenmektedir. Bu makalede, bu beş projenin arkasındaki temel teknoloji ve mühendislik yapısı sırayla analiz edilecek ve merkeziyetsiz AI eğitim sistemindeki farklılıklar ve tamamlayıcı ilişkileri daha da tartışılacaktır.
Prime Intellect: Eğitim izleri doğrulanabilir güçlendirilmiş öğrenme işbirliği ağı öncüsü
Prime Intellect, güvene ihtiyaç duymayan bir AI eğitim ağı inşa etmeye kendini adamıştır; herkesin eğitime katılabilmesi ve hesap katkıları için güvenilir ödüller alabilmesi sağlanacaktır. Prime Intellect, PRIM-RL + TOPLOC + SHARDCAST üç ana modülüyle, doğrulanabilir, açık ve teşvik mekanizmalarıyla donatılmış bir AI merkeziyetsiz eğitim sistemi inşa etmeyi hedeflemektedir.
01, Prime Intellect protokol yığını yapısı ve ana modül değeri
Prime Intellect'in temel mimarisi aşağıdaki ana modülleri içerir:
02, Prime Intellect eğitim anahtar mekanizmalarının detaylı açıklaması
PRIME-RL, Prime Intellect tarafından Merkeziyetsizlik eğitim senaryoları için özel olarak tasarlanmış bir görev modelleme ve yürütme çerçevesidir, heterojen ağlar ve asenkron katılım için özel olarak tasarlanmıştır. Güçlendirilmiş öğrenmeyi öncelikli uyum nesnesi olarak kullanır, eğitim, çıkarım ve ağırlık yükleme sürecini yapısal olarak birbirinden ayırır, böylece her eğitim düğümü yerel olarak bağımsız olarak görev döngüsünü tamamlayabilir ve standart arayüzler aracılığıyla doğrulama ve birleştirme mekanizmalarıyla işbirliği yapabilir. Geleneksel denetimli öğrenme süreçlerine kıyasla, PRIME-RL merkezi bir planlama ortamında esnek eğitim gerçekleştirmek için daha uygundur, hem sistem karmaşıklığını azaltır hem de çoklu görev paralelliği ve strateji evrimi için bir temel oluşturur.
TOPLOC, Prime Intellect tarafından önerilen, bir düğümün gerçekten gözlem verilerine dayanarak etkili bir strateji öğrenimi gerçekleştirip gerçekleştirmediğini belirlemek için kullanılan eğitim doğrulama çekirdek mekanizmasıdır. ZKML gibi ağır çözümlerden farklı olarak, TOPLOC tam model yeniden hesaplamasına dayanmaz, bunun yerine "gözlem dizisi↔strateji güncellemesi" arasındaki yerel tutarlılık izlerini analiz ederek hafif yapı doğrulamasını tamamlar. Eğitim sürecindeki davranış izlerini doğrulanabilir nesnelere dönüştüren ilk sistemdir; bu, güvene ihtiyaç duymayan eğitim ödül dağıtımını gerçekleştirmenin anahtar yeniliğidir ve denetlenebilir, teşvik edici bir Merkeziyetsizlik işbirliği eğitim ağı inşa etmek için uygulanabilir bir yol sunar.
SHARDCAST, Prime Intellect tarafından tasarlanan ağırlık yayılımı ve toplama protokolüdür, asenkron, bant genişliği kısıtlı ve düğüm durumu değişken olan gerçek ağ ortamları için optimize edilmiştir. Gossip yayılım mekanizması ile yerel senkronizasyon stratejisini birleştirerek, birden fazla düğümün farklı senkronizasyon durumlarında sürekli kısmi güncellemeler göndermesine olanak tanır ve ağırlıkların kademeli yakınsamasını ve çoklu versiyon evrimini gerçekleştirir. Merkezi veya senkronize AllReduce yöntemleri ile karşılaştırıldığında, SHARDCAST merkeziyetsizlik eğitiminde ölçeklenebilirliği ve hata toleransı yeteneğini önemli ölçüde artırmaktadır, kararlı ağırlık konsensüsünün oluşturulması ve sürekli eğitim iterasyonlarının temel altyapısını sağlamaktadır.
OpenDiLoCo, Prime Intellect ekibinin DeepMind tarafından önerilen DiLoCo fikrini bağımsız olarak gerçekleştirdiği ve açık kaynak yaptığı bir iletişim optimizasyon çerçevesidir ve merkeziyetsiz eğitimde sık karşılaşılan bant genişliği kısıtlılığı, cihaz heterojenliği ve düğüm istikrarsızlığı gibi zorluklar için özel olarak tasarlanmıştır. Mimarisi veri paralelliğine dayanmakta olup, Ring, Expander, Small-World gibi seyrek topolojik yapılar inşa ederek küresel senkronizasyonun yüksek iletişim maliyetinden kaçınmakta ve yalnızca yerel komşu düğümlere bağımlı kalarak modelin işbirlikçi eğitimini tamamlamaktadır. Asenkron güncellemeler ve kesinti tolerans mekanizması ile bir araya geldiğinde, OpenDiLoCo, tüketici seviyesindeki GPU'ların ve kenar cihazlarının eğitim görevlerine kararlı bir şekilde katılmasını sağlamakta ve küresel işbirlikçi eğitimin katılımını önemli ölçüde artırmakta, merkeziyetsiz eğitim ağlarının inşası için kritik iletişim altyapılarından biri olmaktadır.
PCCL, Prime Intellect tarafından merkeziyetsizlik AI eğitim ortamı için özel olarak tasarlanmış hafif bir iletişim kütüphanesidir ve geleneksel iletişim kütüphanelerinin heterojen cihazlar ve düşük bant genişliği ağlarındaki uyum sorunlarını çözmeyi amaçlamaktadır. PCCL, seyrek topolojileri, gradyan sıkıştırmayı, düşük hassasiyetli senkronizasyonu ve kesinti kurtarmayı destekler, tüketici sınıfı GPU ve istikrarsız düğümler üzerinde çalışabilir; OpenDiLoCo protokolünün asenkron iletişim yeteneklerinin temel bileşenidir. Eğitim ağının bant genişliği toleransını ve cihaz uyumluluğunu önemli ölçüde artırarak, gerçekten açık ve güvene ihtiyaç duymayan bir işbirlikçi eğitim ağı inşa etmek için "son bir mil" iletişim temelini sağlamaktadır.
03, Prime Intellect teşvik ağı ve rol dağılımı
Prime Intellect, herkesin görevlere katılabilmesini ve gerçek katkılara dayalı ödüller kazanabilmesini sağlayan, izin gerektirmeyen, doğrulanabilir ve ekonomik teşvik mekanizmasına sahip bir eğitim ağı inşa etti. Protokol, üç ana rol üzerine çalışmaktadır:
Protokolün temel süreçleri arasında görev yayınlama, düğüm eğitimi, iz doğrulama, ağırlık birleştirme ve ödül dağıtımı yer almaktadır; bu süreçler, "gerçek eğitim davranışı" etrafında bir teşvik kapalı döngü oluşturmaktadır.
04, INTELLECT-2: İlk doğrulanabilir Merkeziyetsizlik eğitim modelinin yayımlanması
Prime Intellect, 2025 yılının Mayıs ayında, asenkron, güvene ihtiyaç duymayan Merkeziyetsizlik düğümleri ile işbirliği yaparak eğitilen dünyanın ilk güçlendirilmiş öğrenme büyük modeli olan INTELLECT-2'yi tanıttı. INTELLECT-2 modelinin parametre ölçeği 32B'ye ulaşıyor. INTELLECT-2 modeli, üç kıtada 100'den fazla GPU heterojen düğüm tarafından işbirliği ile eğitildi.