0G ve Çin Mobil, 107 Milyar Parametreli Yapay Zeka Modelini Merkeziyetsiz Altyapıyla İlk Kez Eğitti

0G, China Mobile iş birliğiyle, merkeziyetsiz altyapı kullanarak 107 milyar parametreli bir yapay zeka modeli eğitti. Bu, 100 milyar parametrenin üzerindeki bir modelin merkezi veri merkezi kümeleri olmadan geliştirildiği ilk örnek oldu.

"Bu ölçekte merkeziyetsiz eğitim, büyük model geliştirmenin artık hiper ölçekli GPU çiftliklerine özel erişim gerektirmediğini kanıtlıyor," dedi 0G Labs'ın kurucu ortağı Michael Heinrich. "Kullanılmayan bilgi işlem kapasitesine sahip telekom sağlayıcıları artık yapay zeka tedarik zincirine katılabilir."

Model, 0G'ın merkeziyetsiz eğitim çerçevesi kullanılarak eğitildi. Bu çerçeve, 0G Labs araştırmalarına göre, bant genişliği yalnızca bir gigabayt kadar düşük olan ağlarda bile, önceki merkeziyetsiz yaklaşımlardan 357 kata kadar daha hızlı modeller eğitebilen DiLoCoX yöntemini içeriyor. Proje, hesaplama yükünü tek bir veri merkezi yerine China Mobile'ın mevcut altyapısına dağıtarak, yapay zeka geliştirmeyi bir avuç hiper ölçekli şirketle sınırlayan merkezi GPU kümelerinin geleneksel darboğazını aştı.

Merkeziyetsiz eğitim kurumsal yapay zeka için neden önemli

Bu başarı, yapay zeka endüstrisindeki yapısal bir sorunu ele alıyor: büyük modellerin eğitimi, GPU kümelerine devasa ön sermaye harcamaları gerektiriyor ve bu da en zengin teknoloji şirketleri dışındaki herkesi dışarıda bırakıyor. Merkeziyetsiz eğitim, ağa bağlı herhangi bir bilgi işlemi potansiyel bir eğitim düğümü olarak ele alarak bu modeli tersine çeviriyor. Ağı genelinde geniş ancak çoğunlukla boşta olan bilgi işlem altyapısını işleten China Mobile gibi telekom operatörleri için bu, mevcut varlıklardan yeni bir gelir akışı yaratıyor.

Bu yaklaşım aynı zamanda Nvidia'nın tedarik kısıtlamaları ve ihracat kontrolleriyle karşı karşıya kalan H100 ve B200 GPU'larına olan bağımlılığı da azaltıyor. 0G'ın çerçevesi, heterojen bilgi işlem kaynaklarını dağıtık bir ağ üzerinde birleştirerek, tek tip GPU kümeleri gerektirmek yerine bir dizi donanım türü kullanarak modelleri eğitebiliyor. Bu, Nvidia'nın en yeni çipleri için teslim sürelerinin 12 ayı aştığı 200 milyar dolarlık veri merkezi GPU pazarındaki baskıyı hafifletebilir.

Ancak, veri hazırlığı bir engel olmaya devam ediyor. Gartner, parçalanmış veya silolanmış veriler nedeniyle yapay zeka projelerinin %60 kadarının 2026 yılına kadar terk edilebileceğini tahmin ediyor; bu, merkeziyetsiz eğitimin tek başına çözmediği bir sorun. Bu yaklaşımı benimsemek isteyen işletmeler, dağıtık bilgi işlemden faydalanmadan önce veri altyapılarını birleştirmelidir.

Yapay zeka altyapı yığını için rekabetçi etkiler

0G-China Mobile kilometre taşı, Nvidia ve büyük bulut sağlayıcıları tarafından desteklenen merkezi eğitim modeline meydan okuyor. Merkeziyetsiz eğitim benimsenirse, satın alma modellerini hiper ölçekli GPU-hizmet-olarak tekliflerinden, telekom operatörlerinin ve uç sağlayıcılarının boş kapasiteyi nakde çevirdiği daha parçalanmış bir pazara kaydırabilir.

Bilgi işlem kaynaklarını tokenize eden iki proje olan Bittensor ve Render Network, işletmeler merkeziyetsiz alternatifleri keşfettikçe artan talep görebilir. Modelleri dağıtık altyapı üzerinde eğitebilme yeteneği aynı zamanda Avrupa Birliği ve Çin gibi bölgelerde, veri egemenliği gerekliliklerinin merkezi sınır ötesi eğitimi zorlaştırdığı artan düzenleyici baskıyla da uyumlu.

Yatırımcılar için bu gelişme, yapay zeka altyapısı tezine yeni bir değişken ekliyor. Nvidia'nın en son mali yılında 47,5 milyar dolara ulaşan veri merkezi geliri, büyük model eğitiminin yoğun GPU kümeleri gerektirdiği varsayımı üzerine inşa edildi. Merkeziyetsiz yöntemlerin ölçekte uygulanabilir olduğu kanıtlanırsa, merkezi yapay zeka bilgi işleminin toplam adreslenebilir pazarı daralabilir ve bu da dağıtık kaynakları bir araya getirebilen altyapı sağlayıcılarına fayda sağlayabilir.

Bu makale yalnızca bilgilendirme amaçlıdır ve yatırım tavsiyesi niteliği taşımaz.