Çinli yapay zeka rakibi DeepSeek, amiral gemisi modelinde %75'lik kalıcı bir fiyat indiriminden başlayarak, mevcut yapay zeka donanım pazarına karşı uzun vadeli stratejik bir hamle düzenlemek için teknik verimlilikleri silah olarak kullanıyor.
Çinli yapay zeka rakibi DeepSeek, amiral gemisi modelinde %75'lik kalıcı bir fiyat indiriminden başlayarak, mevcut yapay zeka donanım pazarına karşı uzun vadeli stratejik bir hamle düzenlemek için teknik verimlilikleri silah olarak kullanıyor.

Çinli yapay zeka rakibi DeepSeek, amiral gemisi modelinde %75'lik kalıcı bir fiyat indiriminden başlayarak, mevcut yapay zeka donanım pazarına karşı uzun vadeli stratejik bir hamle düzenlemek için teknik verimlilikleri silah olarak kullanıyor.
Çinli yapay zeka girişimi DeepSeek, yeni bir 70 milyar RMB'lik finansman turundan elde edilen 45 milyar dolarlık yatırım öncesi değerlemeyi kullanarak, amiral gemisi V4-Pro modelinin fiyatlarını kalıcı olarak yüzde 75 oranında düşürüyor. Bu stratejik hamle, rakiplerin önüne geçmek ve üst düzey Batılı donanımlara olan bağımlılığı azaltmak için tasarlandı.
DeepSeek'in kurucusu Liang Wenfeng iki yıl önce, "İlkemiz para kaybetmemek ama aynı zamanda aşırı kar da etmemektir" demişti; bu felsefe şimdi şirketin KV Önbelleği (KV Cache) gibi alanlardaki teknik verimliliklerinin çarpıcı biçimde daha düşük bir maliyet yapısı sağlamasıyla somutlaşıyor.
V4-Pro API fiyatı artık kalıcı olarak promosyon oranında, milyon token başına 0,025 ile 6 yuan (yaklaşık 0,0035 ila 0,83 dolar) arasında belirlenecek; şirket Cumartesi günü yaptığı açıklamada bu rakamın 24 yuanlık zirve noktasına göre büyük bir düşüş olduğunu belirtti. Bu, 1 milyon tokenlık bir bağlam için KV Önbelleği HBM bellek gereksinimlerini, bazı rakip modellerin gerektirdiği 60GB'ın çok küçük bir kısmı olan sadece 5,48GB'a düşüren yenilikler sayesinde mümkün oldu.
DeepSeek'in stratejisi, API fiyat savaşlarının ötesine geçerek 10 trilyon dolar değerinde olduğu tahmin edilen bir donanım tedarik zincirini yeniden yapılandırmayı hedefliyor. Şirket, modellerini daha ucuz LPDDR bellek ve SSD'ler için optimize ederek, yerli Çin çiplerinin Nvidia gibi liderlerle rekabet etmesi için uygulanabilir bir yol oluşturuyor ve oluşturulmasına yardımcı olduğu donanım pazarından potansiyel olarak önemli bir pay almayı hedefliyor.
DeepSeek'in agresif fiyatlandırması, donanım maliyetlerini en aza indirmek için tasarlanmış bir dizi derin teknik yeniliğin doğrudan bir sonucudur. Bu stratejinin merkezinde, büyük dil modellerinin bellek yoğun bileşeni olan Anahtar-Değer (KV) Önbelleği'nin çarpıcı biçimde küçültülmesi yer alıyor. V4 modelinin KV Önbelleği ayak izini rakiplerinin on birinden daha azına indirerek DeepSeek, bu verileri pahalı Yüksek Bant Genişlikli Bellekten (HBM) daha ticari SSD'lere ve NAND flash depolamaya aktarabiliyor.
Bu verimlilik donanım yığını boyunca bir dalgalanma etkisi yaratıyor. SGLang ekibinden gelen araştırmalar, HBM'den önemli ölçüde daha ucuz olan LPDDR belleğin, model parametrelerini gerektiğinde akıtmak için bir "ağırlık geçici depolama alanı" olarak hizmet edebileceğini gösteriyor; bu yöntem DeepSeek'in Karma Uzmanlar (MoE) mimarisinin benzersiz bir şekilde uygun olduğu bir yöntemdir. Bu yaklaşım, pahalı, yüksek performanslı GPU belleğini daha büyük miktarlarda daha ucuz sistem belleği ile etkili bir şekilde ikame ediyor. EUV litografi kısıtlamaları nedeniyle son teknoloji GPU'lar üretmekte sınırlamalarla karşılaşan Çin'in yerli çip endüstrisi için bu kritik bir gelişmedir. Daha az güçlü işlemcilerin daha fazla bellekle eşleştirilerek rekabetçi kalmasına olanak tanıyor; bu, ham hesaplama eksikliklerini aşmak için bir "şerit değiştirme" stratejisidir.
Dahası DeepSeek, donanımlar arası bir derleyici çerçevesi olan TileLang'e yatırım yaptı. Bu yazılım katmanı, donanım farklılıklarını soyutlamayı amaçlayarak yapay zeka kodunun çeşitli platformlarda çalışmasına olanak tanıyor ve birçok geliştiriciyi Nvidia'nın donanımına hapseden güçlü "CUDA hendeğini" aşmayı hedefliyor.
Yakın zamandaki bir yatırımcı toplantısından alınan raporlara göre, kurucu Liang Wenfeng, anlık etkinin yapay zeka donanım pazarında bir bozulma yaratmak olmasına rağmen nihai hedefin Yapay Genel Zeka (AGI) arayışı olduğunu belirtti. Donanım verimliliği stratejisi, bu uzun vadeli hedef için gerekli temeldir.
AGI'ye ulaşmak, muhtemelen bir yapay zekanın deneme yanılma yoluyla öğrenip kendini geliştirdiği Pekiştirmeli Öğrenme (RL) ve Özyinelemeli Öz-Geliştirme (RSI) gibi teknikler kullanılarak devasa ölçekli eğitim gerektirecektir. Bu yöntemler hesaplama açısından astronomiktir; trilyonlarca token üretilmesini ve geniş "ya şöyleyse" senaryo modellemelerini gerektirir. DeepSeek, hesaplamanın temel maliyetini düşürerek, daha önce karşılanamaz olan bu eğitim süreçlerini ekonomik olarak uygulanabilir kılıyor. MoE modellerinden KV Önbelleği sıkıştırmasına kadar her yenilik, AGI eğitimini peşinden gidilebilecek kadar uygun fiyatlı hale getirme tekil hedefinde birleşiyor.
Bu durum DeepSeek'in kaynak yaratma ve fiyatlandırma stratejisinin yeni bir ışık altında görünmesini sağlıyor. Şirket sadece API erişimi satmıyor; kendi kendine yeten bir yapay zeka tedarik zinciri inşa etmek için CATL ve devlete bağlı fonlar da dahil olmak üzere bir donanım ortakları ve yatırımcı koalisyonu kuruyor. Yatırımcılar için bahis bir yazılım şirketine değil, bunu kimin inşa edebileceğine dair ekonomik denklemi temelden değiştirerek yapay zekadaki küresel güç dengesini yeniden şekillendirebilecek stratejik bir kilit taşına yapılıyor. Bu, DeepSeek'i sadece diğer yapay zeka laboratuvarlarına değil, mevcut yapay zeka patlamasının temelini oluşturan Nvidia da dahil olmak üzere tüm donanım ekosistemine doğrudan bir rakip olarak konumlandırıyor.
Bu makale sadece bilgilendirme amaçlıdır ve yatırım tavsiyesi teşkil etmez.