Yapay zeka yarışında, en büyük modeli değil, en verimli olanı önceliklendiren bir karşı hareket güç kazanıyor.
Yapay zeka yarışında, en büyük modeli değil, en verimli olanı önceliklendiren bir karşı hareket güç kazanıyor.

SenseTime’ın yeni nesil “SenseNova 6.7 Flash-Lite” modeli jeton (token) tüketimini yüzde 60 oranında düşürüyor; bu da sektörün daha büyük yapay zeka modelleri inşa etmekten uzaklaşıp, maliyet ve veri egemenliği gibi gerçek dünyadaki kurumsal kısıtlamalar dahilinde çalışabilen sistemlere doğru daha geniş bir pivot yaptığının sinyalini veriyor.
IBM Asya Pasifik Genel Müdürü Hans Dekkers yakın tarihli bir röportajda, “Asya'da yapay zeka patlamasına baktığımda, egemenliğin modellerden daha fazla önem kazandığını görüyorum” diyerek, veri ifşası endişeleri nedeniyle kurumsal verilerin %99'una yapay zeka tarafından hala dokunulmadığını belirtti.
SenseNova modeli, verimliliğini ara bir görsel-metin dönüştürme katmanını ortadan kaldıran ve karmaşık belgeleri ile grafikleri doğrudan yorumlayan yerel bir çok modlu mimari aracılığıyla elde ediyor. Bu durum, Tencent ve DeepSeek gibi rakiplerin modellerinde görülen kaba kuvvet ölçeklendirmesinin aksine, belirli ve yüksek değerli kurumsal iş akışlarını hedefliyor.
Bu hamle, tek bir güçlü model yerine düzinelerce daha küçük, uzmanlaşmış model dağıtmaya yönelik büyüyen bir kurumsal stratejiyi yansıtıyor. Bu değişim, yapay zekada yeni bir rekabet cephesi yaratıyor: IBM'in hedeflediği ve SenseTime'ınki gibi verimli, düşük maliyetli modellerin önemli talep görebileceği, model karışımını yönetebilen orkestrasyon platformları.
Piyasanın büyük bir kısmı kıyaslama performansına odaklanırken, kurumlar büyük, genel amaçlı yapay zekaları devreye almaya çalışırken yapısal bir uyumsuzlukla karşılaşıyor. Özellikle Asya Pasifik genelindeki düzenleyici parçalanma, veri egemenliğini temel bir operasyonel kısıtlama haline getiriyor. Şirketler genellikle tescilli verilerini harici, monolitik modellere açmakta tereddüt ediyor ve bu da yapay zeka adaptasyonunun önünde bir engel oluşturuyor. Dekkers, “Seçim uyumluluk ile inovasyon arasında değil... tüm dijital mimariniz üzerinde kontrolü elde tutmakla ilgili” dedi. Bu tereddüt, değerli kurumsal verilerin büyük çoğunluğunun silolarda kalmasına ve yapay zeka sistemleri tarafından kullanılmamasına neden olarak, bu sınırlar içinde çalışabilecek araçlar için devasa, henüz keşfedilmemiş bir pazarı temsil ediyor.
Verimli ve düşük güçlü yapay zekaya olan talep, GSI Technology'den Didier Lasserre'in “milyar dolarlık pazarlar” olarak adlandırdığı alanda yeni fırsatlar yaratıyor. GSI'ın Gemini II ilişkisel işlem birimi (APU) net bir vaka çalışması sunuyor. Yakın tarihli bir savunma konsept kanıtında, çip yalnızca 30 watt sistem gücü kullanarak yaklaşık üç saniyelik bir ilk jeton süresine ulaştı; bu, drone gözetimi için kritik bir ölçüt. Güç kısıtlı bir ortamdaki bu performans doğrudan bir sözleşme galibiyetine yol açtı ve yeni bir akıllı şehir projesi için kullanılıyor. GSI gibi uzmanlaşmış donanımların başarısı (geleneksel SRAM işindeki %22'lik büyüme ile finanse edilen), ham ölçek yerine gecikme ve verimliliğe öncelik veren hedefli yapay zeka çözümleri oluşturmanın uygulanabilirliğini kanıtlıyor; bu tam da SenseTime'ın hafif modeliyle hedeflediği niş alan.
SenseTime'ın SenseNova 6.7 Flash-Lite ile yaklaşımı, bu gelişmekte olan paradigmaya doğrudan uyuyor. Bilgi arama görevlerinde jeton kullanımını %60 oranında azaltarak çalıştırılması doğal olarak daha ucuz olan bir model inşa eden şirket, kurumların en büyük modeli kullanma prestiji yerine maliyet tasarrufu ve kontrolü tercih edeceğine dair bahis oynuyor. Bu, şirketlerin her bir özel iş için en iyi aracı (ister GPT-4 gibi küresel bir dev, ister Alibaba gibi bölgesel bir oyuncu, isterse özel bir dahili sistem olsun) dağıtmak için orkestrasyon platformlarını kullandığı “kendi modelini getir” ortamına yönelik daha büyük bir trendin parçası. Bu bağlamda, en değerli oyuncu en büyük modele sahip olan değil, belirli bir iş sorunu için en verimli ve uyumlu çözümü sunan olabilir.
Bu makale sadece bilgilendirme amaçlıdır ve yatırım tavsiyesi teşkil etmez.