DeepSeek yarışmasının ardından Silikon Vadisi çıtayı yükseltiyor: Programcılara milyonlarca dolarlık teklifler, daha fazla iç güvenlik ve yeni modeller.

Geçtiğimiz Ocak ayında, Silikon Vadisi'nde yer sarsıldı ve bu sarsıntı, bölgedeki sayısız depremin olağan kaynağı olan San Andreas Fayı'nın tektonik hareketlerinden kaynaklanmıyordu. 65 bin mil batıda, Çin'in Hangzhou şehrinde, az bilinen bir şirket, Amerika Birleşik Devletleri'ndeki en gelişmiş modellerle rekabet edebileceğini iddia ettiği açık kaynaklı bir yapay zekayı yeni tanıtmıştı.
DeepSeek R1 olarak adlandırılan bu istihbarat, OpenAI veya Google'ın en gelişmiş modellerinin maliyetinin çok daha azıyla eğitilmişti, ancak daha iyi olmasa da karşılaştırılabilir sonuçlar sunuyordu ve açık kaynak kodlu olarak dağıtılıyordu.
Ülkenin her iki yakasında da alarm zilleri çalıyordu. Örneğin New York'ta borsa, çok daha karmaşık yapay zekâ araçları geliştirmek için milyarlarca dolar yatırım yapan birçok teknoloji şirketinin değerlemesini ağır bir şekilde cezalandırdı. İlk kurban, piyasa değeri %17'den fazla düşerek sadece birkaç gün içinde yaklaşık 600 milyar dolarlık değer kaybına uğrayan Nvidia oldu. Sonuçta DeepSeek, verimli ve rekabetçi modeller elde etmek için yalnızca pahalı H100 GPU'larına güvenmenin gerekli olmadığını kanıtladı.
Ancak panik, Kaliforniyalı girişimlerin can damarı olan Sand Hill Road'daki girişim sermayesi şirketlerinde hissedilir hale geldi. 2022'de ChatGPT'nin piyasaya sürülmesinden bu yana, bu şirketler arasında yapay zekanın bölgenin yeni itici gücü, dot-com patlaması ve uygulama ekonomisinden sonraki büyük devrim olacağı konusunda fikir birliği vardı. Aniden, düzinelerce yapay zeka odaklı şirketin yüksek geliştirme ve personel maliyetlerini finanse etmek için yatırılan yüz milyarlarca doların geri kazanılması çok zor görünüyordu.
DeepSeek'in en büyük yeniliği, tutumlu yaklaşımıydı . 2023 yılında Liang Wenfeng tarafından kurulan ve HighFlyer yatırım fonuna bağlı olan şirket, yalnızca 6 milyon dolar ve 2.000 GPU gerektiren bir eğitim programının ardından R1'i piyasaya sürdü. Size bir fikir vermek gerekirse, bu, yakın zamana kadar popüler ChatGPT aracını çalıştıran ve artık yerini GPT-5'e bırakan dil modeli GPT-4'ü eğitmenin maliyetinin onda birinden bile daha az.
Düşük eğitim ve " çıkarım " maliyetlerine rağmen (uzun dil modelini kullanım için çalıştırma sürecine verilen ad), R1, şu anda bu araçların en umut verici becerisi olan akıl yürütme, matematik ve kod üretme yeteneklerini referans modellere kıyasla sunar.
Sektörün önde gelen isimleri, istemeyerek de olsa bu zorluğun farkına vardı. Andreessen Horowitz'in kurucu ortağı Marc Andreessen , DeepSeek R1'i "şimdiye kadar gördüğüm en etkili devrimlerden biri" olarak nitelendirdi. Hatta Microsoft CEO'su Satya Nadella ve OpenAI CEO'su Sam Altman bile "etkileyici" olarak nitelendirdi.
Analistler, duyuruyu, ABD uzay programını çıkmaza sokan ve teknolojik üstünlük anlatısını yerle bir eden Sovyet uydusu Sputnik'in fırlatılışına benzetmekte gecikmediler.
DAHA FAZLA YATIRIMAltı ay sonra, şaşkınlık hissi aciliyete dönüştü. Mark Zuckerberg liderliğindeki ve her şeye ayak uydurmaya takıntılı görünen Meta , zaten devasa olan bir planı hızlandırdı. Önümüzdeki yıllarda, 5 gigawatt'a kadar ölçeklenebilen ve Manhattan'la karşılaştırılabilir bir yüzey alanına sahip devasa veri merkezleri de dahil olmak üzere, yapay zeka altyapısına 60 milyar ila 72 milyar dolar arasında yatırım yapacak.
Ayrıca şirket içinde "patlayıcı" olarak tanımlanan tekliflerle bir yetenek avına da çıktı; üst düzey araştırmacılar veya mühendisler için yüz milyonlarca dolara ulaşabilen ikramiyeler ve maaşlar teklif edildi; bu, yakın teknoloji tarihinde eşi benzeri görülmemiş bir şey.
Bu stratejinin arkasında makul bir endişe yatıyor. Geçtiğimiz Ocak ayına kadar Meta'nın dil modeli Llama 3 , OpenAI'ninkinden daha az güçlü ancak her türlü araç ve projeye kolayca uyarlanabilen en iyi açık kaynaklı alternatif olarak kabul ediliyordu. DeepSeek'in gelişi ve evrimi Llama 4'ün biraz hayal kırıklığı yaratan lansmanı, Zuckerberg'i kararlı bir duruş sergilemeye zorladı.
Yapay zeka yarışında şimdiye kadar lider gibi görünen şirket OpenAI ise savunmaya geçti. CEO'su Sam Altman, DeepSeek-R1'in gelişimini kamuoyuna duyurmaktan başka çaresi yoktu ve bunu şaşırtıcı olarak nitelendirdi, ancak uzun vadeli sürdürülebilirliğini henüz kanıtlamadığını da belirtti.
O zamandan beri, Altman, Amerika Birleşik Devletleri'nin büyük bir kısmı gibi, varlığını görmezden gelmeyi, başını öne eğmeyi ve çabalarını ve yatırımlarını ikiye katlamayı tercih etti. OpenAI, kullanıcıların karmaşık görevleri otonom olarak çalışabilen bir yapay zekaya devretmesine olanak tanıyan ChatGPT Agent gibi yeni araçlar piyasaya sürdü ve artık teknolojisine dayalı gelecekteki açık kaynaklı modeller hakkında daha özgürce konuşuyor; bu, yakın zamana kadar göz ardı edilmiş bir seçenekti. Dahası, çalışmasını sağlayan dil motorunu, bugüne kadarki en gelişmiş yapay zeka sistemi olan GPT-5 ile değiştirdi. Yönetici, ChatGPT'yi artık bir doktora öğrencisiyle sohbet etmeye benzetiyor.
Şirket ayrıca, DeepSeek'in eğitiminin bir kısmının kendi kurumundan sızdırılan verilere dayandığı endişesiyle iç süreçlerindeki güvenliği de güçlendirdi. Silikon Vadisi uzmanları arasında yaygın olan görüş, DeepSeek'in bu kadar az kaynakla böylesine rekabetçi bir model başlatabilmesinin sebebinin, mevcut teknolojiyi GPT-4'te "damıtarak" ve OpenAI modelini kendi modeline de aynı şekilde çalışmayı öğretmek için kullanarak başardığıdır.
Kendilerini korumak için, birçok yatırım fonu da yatırım stratejilerinde değişiklik yapmayı düşünüyor ve daha az altyapıya odaklanan, daha çok yazılım ve algoritmalara odaklanan ve tescilli modeller yerine açık kaynaklı modellere dayanan şirketlere öncelik veriyor. Tescilli modeller daha pahalı ve değiştirilmesi daha zor.
İlk paniğin ardından, bölgede fahiş değerlemeler tekrar norm haline geldi ve yetenek mücadelesi yoğunlaştı. Ancak temel bir şeyin değiştiği hissi -Silikon Vadisi'nin artık teknoloji dünyasının merkezi olmadığı korkusu- hâlâ varlığını sürdürüyor.
elmundo