Geleneksel yapay zeka modelleri GPU gücüne bağlıdır. Ne kadar güçlü GPU’lar kullanılırsa, model o kadar iyi çalışır.
Ancak DeepSeek AI, düşük donanım gereksinimiyle aynı performansı verebilen bir sistem geliştirdi.
Çin, ABD’nin son yarı iletken yasakları nedeniyle en güçlü GPU’lara erişemediği için daha verimli bir yapay zeka mimarisi geliştirmek zorunda kaldı.
Nasıl Daha Ucuz Çalışıyor?
Veri sıkıştırma (knowledge distillation) tekniği kullanarak daha küçük ama verimli bir model oluşturdular.
OpenAI’nin API yanıtlarını sürekli sorgulayarak bilgi toplayıp kendi modelini eğittiği iddia ediliyor (bu yüzden OpenAI hukuki işlem başlatabilir).
ChatGPT-4’ü eğitmek 100 milyon dolara mal olurken, DeepSeek AI sadece 5 milyon dolara eğitildi.
Farklı Yöntemleri:
Multi-token sistemi: Geleneksel AI kelime kelime işlerken, DeepSeek tüm cümleleri aynı anda analiz edebiliyor, bu da işlemi 2 kat hızlandırıyor.
Gereksiz parametreleri devre dışı bırakma: OpenAI’nin 1.8 trilyon parametre kullandığı yerde, DeepSeek yalnızca 671 milyar parametreyle aynı sonucu alabiliyor.
Yalnızca gerekli bölümleri aktif etme: Sorunun türüne göre yalnızca ilgili model bölümleri çalıştırılıyor (örneğin, kodlama sorularında yalnızca kodlama bölümü aktif oluyor).
Sonuçlar ve Etkiler:
Herkes kendi bilgisayarında çalıştırabilir: OpenAI’nin aksine DeepSeek açık kaynaklı ve herkes kendi bilgisayarında çalıştırabilir.
Rekabeti artırıyor:Yapay zeka artık büyük teknoloji şirketlerinin tekelinde değil, bireyler de kendi modellerini eğitebilir.
Maliyetler düşecek: Daha az GPU ihtiyacı olduğu için donanım maliyetleri azalacak.
ABD-Çin AI Savaşı: DeepSeek’in başarısı, ABD ve Çin arasındaki yapay zeka yarışını daha da kızıştırabilir.
Leave Your Comment