Anthropic'in Claude 3.7 Sonnet'i yapay zekanın bir sonraki büyük savaşında OpenAI ve DeepSeek'i hedef alıyor

Sektör lideri AI kapsamı hakkında en son güncellemeler ve özel içerikler için günlük ve haftalık bültenlerimize katılın. Daha Fazla Bilgi Edinin
Anthropic , kullanıcılara bir AI'nın yanıt üretmeden önce " düşünmek " için ne kadar zaman harcadığı konusunda benzeri görülmemiş bir kontrol sağlayan bir model olan Claude 3.7 Sonnet'in lansmanıyla OpenAI , DeepSeek ve tüm AI sektörüne bir uyarı atışı yaptı. Komut satırı AI kodlama aracı olan Claude Code'un lansmanıyla birlikte yayınlanan bu sürüm, Anthropic'in kurumsal AI pazarına agresif bir şekilde girdiğini gösteriyor; bu, işletmelerin yazılım oluşturma ve işi otomatikleştirme biçimini yeniden şekillendirebilir.
Bahisler daha yüksek olamazdı. Geçtiğimiz ay DeepSeek, ABD sistemleriyle maliyetin çok daha altında eşleşen bir AI modeliyle teknoloji dünyasını şaşkına çevirdi, Nvidia'nın hisselerini %17 düşürdü ve Amerika'nın AI liderliği konusunda alarmlar çaldı. Şimdi Anthropic, AI muhakemesi üzerinde hassas kontrolün (sadece ham hız veya maliyet tasarrufu değil) ona bir avantaj sağlayacağına bahse giriyor.

Anthropic'te araştırma için ürün yönetimini yöneten Dianne Penn, VentureBeat ile yaptığı bir röportajda, "Biz sadece muhakemenin, erişmek için ayrı bir ücret ödemeniz gereken ayrı bir şey olmaktan ziyade, bir AI'nın temel bir parçası ve temel bileşeni olduğuna inanıyoruz," dedi. "Tıpkı insanlar gibi, AI hem hızlı yanıtları hem de karmaşık düşünmeyi ele almalıdır. 'Saat kaç?' gibi basit bir soru için anında cevap vermelidir. Ancak glütensiz diyet ihtiyaçlarını karşılayarak iki haftalık bir İtalya gezisi planlamak gibi karmaşık görevler için daha kapsamlı bir işlem süresine ihtiyaç duyar."
"Muhakemeyi, planlamayı ve kendini düzeltmeyi ayrı yetenekler olarak görmüyoruz," diye ekledi. "Bu yüzden bu, esasen felsefi farklılığı ifade etme biçimimiz... İdeal olarak, modelin kendisi bir sorunun daha yoğun düşünme ve ayarlama gerektirdiğini fark etmeli, kullanıcıların farklı muhakeme modlarını açıkça seçmesini gerektirmemelidir."

Karşılaştırma verileri Anthropic'in iddialı vizyonunu destekliyor. Genişletilmiş düşünme modunda, Claude 3.7 Sonnet lisansüstü düzeydeki akıl yürütme görevlerinde %78,2 doğruluk oranına ulaşarak OpenAI'nin en son modellerine meydan okuyor ve DeepSeek R1'i geride bırakıyor.
Ancak daha açıklayıcı ölçümler gerçek dünya uygulamalarından geliyor: Model , perakende odaklı araç kullanımında %81,2 puan alıyor ve talimatları takip etmede (%93,2) belirgin iyileştirmeler gösteriyor; bu alanlar rakiplerin ya zorlandığı ya da sonuçlarını yayınlamadığı alanlar.
Geleneksel matematik kıyaslamalarında DeepSeek ve OpenAI önde gelirken, Claude 3.7'nin birleşik yaklaşımı, tek bir modelin hızlı yanıtlar ve derin analiz arasında etkili bir şekilde geçiş yapabileceğini ve işletmelerin farklı görev türleri için ayrı AI sistemleri sürdürme ihtiyacını ortadan kaldırabileceğini gösteriyor.
Yayımlanma zamanlaması çok önemli. DeepSeek'in geçen ayki çıkışı, Silikon Vadisi'nde şok dalgaları yaratarak, daha önce düşünülenden çok daha az işlem gücüyle sofistike AI muhakemesinin gerçekleştirilebileceğini gösterdi. Bu, AI geliştirme maliyetleri ve altyapı gereksinimleri hakkındaki temel varsayımları sorguladı. DeepSeek sonuçlarını yayınladığında, Nvidia'nın hissesi tek bir günde %17 düştü - yatırımcılar aniden pahalı çiplerin gelişmiş AI için gerçekten gerekli olup olmadığını sorgulamaya başladı.
İşletmeler için riskler daha yüksek olamazdı. Şirketler, hangi yaklaşımın baskın olacağına bahse girerek AI'yı operasyonlarına entegre etmek için milyonlarca dolar harcıyor . Anthropic'in hibrit modeli, ikna edici bir orta yol sunuyor: Anında müşteri hizmetleri yanıtlarından karmaşık finansal analizlere kadar, eldeki göreve göre AI performansını ince ayar yapma yeteneği. Sistem, ek akıl yürütme özellikleriyle bile Anthropic'in önceki milyon giriş belirteci başına 3 dolar ve milyon çıkış belirteci başına 15 dolar fiyatlandırmasını koruyor.

"Müşterilerimiz müşterileri için sonuçlar elde etmeye çalışıyor," diye açıkladı Anthropic'in platform başkanı Michael Gerstenhaber. "Aynı modeli kullanmak ve aynı modeli farklı şekillerde yönlendirmek Thompson Reuters gibi birinin yasal araştırma yapmasına, Cursor veya GitHub gibi kodlama ortaklarımızın uygulamalar geliştirmesine ve bu hedeflere ulaşmasına olanak sağlıyor."
Anthropic'in hibrit yaklaşımı hem teknik bir evrimi hem de stratejik bir kumarı temsil ediyor. OpenAI farklı yetenekler için ayrı modeller korurken ve DeepSeek maliyet verimliliğine odaklanırken, Anthropic hem rutin görevleri hem de karmaşık akıl yürütmeyi idare edebilen birleşik sistemler peşinde. Bu, işletmelerin AI'yı nasıl dağıttığını yeniden şekillendirebilecek ve birden fazla uzmanlaşmış modeli bir arada kullanma ihtiyacını ortadan kaldırabilecek bir felsefe.
Anthropic bugün ayrıca geliştiricilerin karmaşık mühendislik görevlerini doğrudan yapay zekaya devretmesine olanak tanıyan bir komut satırı aracı olan Claude Code'u tanıttı. Sistem, kod değişikliklerini taahhüt etmeden önce insan onayı gerektiriyor ve bu da sorumlu yapay zeka geliştirmeye yönelik büyüyen sektör odağını yansıtıyor.

"Aslında Claude'un yaptığı değişiklikleri kabul etmeniz gerekiyor. Elleri direksiyonda olan bir gözden geçirensiniz," diye belirtti Penn. "Esasında modelin belirli eylemlerde bulunması için kabul etmeniz gereken bir tür kontrol listesi var."
Duyurular, AI geliştirmedeki yoğun rekabetin ortasında geldi. Stanford araştırmacıları yakın zamanda 50 doların altında bir açık kaynaklı akıl yürütme modeli oluşturdular, Microsoft ise OpenAI'nin o3-mini modelini Azure'a entegre etti. DeepSeek'in başarısı ayrıca AI geliştirmeye yönelik yeni yaklaşımları teşvik etti ve bazı şirketler maliyetleri daha da düşürebilecek model damıtma tekniklerini araştırdı.

Penn, AI yeteneklerindeki çarpıcı ilerlemeyi beklenmedik bir örnekle gösterdi: "Claude'un farklı versiyonlarından Pokémon oynamasını istedik... Bu versiyon Vermilion Şehri'ne kadar ulaştı, birden fazla Pokémon yakaladı ve hatta seviye atlamak için çabaladı. Rakiplerine karşı savaşmak için doğru Pokémon'a sahip."
Penn, "Bence yenilik yapmaya ve akıl yürütmenin niteliğini zorlamaya devam edeceğimizi, dinamik akıl yürütme gibi şeylere doğru ilerleyeceğimizi göreceksiniz," diye açıkladı. "Bunu her zaman zekanın ayrı bir şey olmaktan ziyade temel bir parçası olarak düşündük."
Anthropic'in yaklaşımının gerçek testi, kurumsal benimsemeden gelecektir. Pokémon oynamak önemsiz görünse de, işletmelerin ihtiyaç duyduğu uyarlanabilir zeka türünü gösterir: Uzmanlaşmış modeller arasında geçiş yapmadan hem rutin işlemleri hem de karmaşık stratejik kararları idare edebilen yapay zeka. Claude'un önceki sürümleri, bir oyunun başlangıç kasabasının ötesine geçemiyordu. En son sürüm, stratejiler oluşturuyor, kaynakları yönetiyor ve taktiksel kararlar alıyor; gerçek dünyadaki iş zorluklarının karmaşıklığını yansıtan yetenekler.
Kurumsal müşteriler için bu, farklı görevler için birden fazla AI sistemini sürdürmek ile daha yetenekli tek bir çözümü devreye sokmak arasındaki fark anlamına gelebilir. Önümüzdeki birkaç ay, Anthropic'in birleşik AI muhakemesine olan bahsinin kurumsal pazarı yeniden şekillendirip şekillendirmeyeceğini veya sektörün hızlı evriminde başka bir deney olup olmayacağını ortaya koyacaktır.
Patronunuzu etkilemek istiyorsanız, VB Daily sizin için burada. Şirketlerin üretken yapay zeka ile ilgili olarak düzenleyici değişikliklerden pratik dağıtımlara kadar neler yaptıklarına dair içeriden bilgiler veriyoruz, böylece maksimum yatırım getirisi için içgörüler paylaşabilirsiniz.
Gizlilik Politikamızı okuyun
Abone olduğunuz için teşekkürler. Daha fazla VB bültenine buradan göz atın.
Bir hata oluştu.

venturebeat