CoreWeave, DeepSeek-V3'ü 2 dakikada eğiterek AI bulut rekoru kırdı

CoreWeave, 671 milyar parametreli DeepSeek-V3 modelini sadece iki dakikanın biraz üzerinde eğitti; bu sonuç, AI-native bulut sağlayıcısının tam yığın altyapı stratejisini doğruluyor.

CoreWeave Inc., 671 milyar parametreli DeepSeek-V3'ü 8.192 NVIDIA GB300 GPU'da 2,02 dakikada eğiterek MLPerf Training v6.0 kıyaslamasında en hızlı sonuca imza attı ve bu turda sunulan en büyük GB300 kümesi oldu.

"DeepSeek-V3'ü en büyük GB300 kümesinde iki dakikada eğitmek, yıllarca süren metalden modele mühendislik yatırımını yansıtıyor," dedi CoreWeave Ürün ve Mühendislikten Sorumlu Genel Müdür Yardımcısı Chen Goldberg.

Şirket, üç küme boyutunda lineere yakın ölçeklenme gösterdi: 8.192 GPU'da 2,02 dakika, 4.096 GPU'da 3,09 dakika ve 2.048 GPU'da 5,54 dakika. CoreWeave ayrıca Llama-3.1-405B'yi 4.096 GB300 GPU'da 9,77 dakikada eğitirken, karşılaştırılabilir GB200 dağıtımlarına kıyasla yüzde 20 daha az GPU kullandı. Kompakt bir 64 GPU'lu B200 kümesinde GPT-OSS-20B'yi 26,98 dakikada ve Llama-3.1-8B'yi 16,54 dakikada eğitti.

Müşterilerin kullanımına sunulan aynı altyapı üzerinde elde edilen sonuçlar, CoreWeave'in uzmanlaşmış AI eğitim pazarında hiper ölçekleyicilere karşı konumunu güçlendiriyor. CoreWeave hisseleri, Mart 2025'teki halka arzının ardından Nasdaq'ta CRWV koduyla işlem görüyor.

MLPerf v6.0 Sonuçları AI Eğitim Pazarı Hakkında Ne Ortaya Koyuyor?

MLCommons tarafından 16 Haziran'da yayınlanan MLPerf Training v6.0, iki yeni kıyaslama ekledi — DeepSeek V3 ve GPT-OSS 20B — her ikisi de modelin toplam parametrelerinin yalnızca bir kısmını belirteç başına etkinleştiren Uzman Karışımı (MoE) mimarisi üzerine inşa edildi. DeepSeek V3, belirteç başına etkinleştirilen 37 milyar ile toplam 671 milyar parametre kullanarak paketteki en büyük kıyaslama oldu. Toplam 21 milyar parametre ve 3,6 milyar etkinleştirilmiş parametreye sahip GPT-OSS 20B ise daha küçük donanım yapılandırmalarına sahip kuruluşlar için bir giriş noktası olarak tasarlandı.

Tura, 13 farklı donanım hızlandırıcı ve 19 ana bilgisayar işlemcisi kullanan 95 benzersiz sistem genelinde 24 kuruluş katıldı. Bulut sistemi başvuruları, altı ay önceki sürüm 5.1'e kıyasla iki kattan fazla artarak barındırılan AI eğitimine yönelik büyüyen pazarı yansıttı. Sunulan sistemlerin yüzde 60'ı çok düğümlüydü.

"Kıyaslama performansı ile üretim gerçekliği arasındaki uçurum, AI altyapısındaki en kalıcı zorluklardan biri olmaya devam ediyor," dedi Futurum Research Araştırma Direktörü Brendan Burke. "CoreWeave'in MLPerf Training v6.0 sonuçları, özellikle DeepSeek-V3'ü kıyaslamadaki en büyük GB300 kümesinde iki dakikada eğitmesi, tam yığın AI uzmanlığının yeni donanım geldikçe gerçek dünya performans kazanımlarını bileşik olarak artırdığını gösteriyor."

CoreWeave'in Altyapı Yığını Sonuçları Nasıl Elde Etti?

CoreWeave, performansını platformunun her katmanındaki optimizasyonlara bağladı. CoreWeave Mission Control, büyük ölçekli eğitim işlerinden önce ve sırasında donanım, üretici yazılımı, ağ ve termal koşulları doğrulayarak raf ölçekli sistemlerde sürekli sağlık kontrolleri gerçekleştiriyor ve gecikenleri azaltıyor. Şirketin SUNK zamanlayıcısı topoloji bilincine sahip olup, MoE iş yükleri için raflar arası iletişimi en aza indirmek amacıyla uzman paralel gruplarını aynı NVL72 alanı içinde konumlandırıyor. Ray bilincine sahip bir ağ oluşturma stratejisi, binlerce GPU ölçeğinde sıcak noktaları önlemek için trafiği doku genelinde dengeliyor.

Çalıştırmalarda, GB300 NVL72 topolojisine göre uyarlanmış CUDA grafikleri ve Tensör, boru hattı ve bağlam paralel parçalama ile NVIDIA NeMo Framework Sürüm 26.04'ün yanı sıra ölçeklendirme dokusu için RoCE çalıştıran NVIDIA Spectrum-X Ethernet kullanıldı.

CoreWeave, DeepSeek-V3'te bir GB300 platformunu 2.048 GPU'nun ötesine ölçekleyen tek başvuru sahibiydi. Şirket ayrıca hem SemiAnalysis ClusterMAX 1.0 hem de 2.0'da en yüksek Platin sıralamasını elde eden tek AI bulutu konumunda.

Bu, AI Bulut Rekabet Ortamı İçin Ne Anlama Geliyor?

CoreWeave'in kıyaslama sonuçları, AI eğitim altyapısına yönelik talep hızlanırken geliyor. Sharon AI (SHAZ), NVIDIA ile Avustralya'da 72 megavatlık yeni veri merkezi kapasitesinde 40.000'e kadar GB300 GPU içerebilecek altı yıllık stratejik bir bilgi işlem işbirliğini duyurmasının ardından Cuma günü yaklaşık yüzde 25 yükseldi. Anlaşma, Sharon AI'nın toplam AI fabrika ayak izini 132 megavata çıkarıyor.

CoreWeave için MLPerf sonuçları, işletmelerin büyük ölçekli AI iş yükleri için bulut sağlayıcılarını değerlendirdiği bir dönemde platformunun bağımsız bir doğrulamasını sağlıyor. Şirketin, müşterilerine sunduğu aynı altyapıyı kullanırken en zorlu MoE modellerinde lineere yakın ölçeklenme sunabilmesi, v6.0 turunda da sonuç gönderen Amazon Web Services, Microsoft Azure ve Google Cloud'a karşı ölçülebilir bir farklılaştırıcı yaratıyor.

Mart 2025'te halka arz edilen CoreWeave hisseleri, AI altyapı inşasının bir temsilcisi konumunda. MLPerf sonuçları, yatırımcılara şirketin tam yığın yaklaşımının, AI eğitim pazarı seyrek hesaplama mimarilerine doğru kayarken sürdürülebilir bir rekabet avantajına dönüşüp dönüşmediğini değerlendirmek için somut bir kıyaslama sağlıyor.

Bu makale yalnızca bilgilendirme amaçlıdır ve yatırım tavsiyesi niteliği taşımamaktadır.