Yapay Zeka Temsilcileri Berbat Serbest Çalışanlardır


Yapay zekanın ofis çalışanlarının yerini topluca alması fikrine meydan okuyan bir deneye göre, en iyi yapay zeka ajanları bile çevrimiçi serbest çalışma konusunda oldukça umutsuz.
Veri açıklama şirketi Scale AI ve kâr amacı gütmeyen bir kuruluş olan Yapay Zeka Güvenliği Merkezi'ndeki (CAIS) araştırmacılar tarafından geliştirilen yeni bir kıyaslama ölçütü olan Uzaktan Çalışma Endeksi, öncü yapay zeka modellerinin ekonomik açıdan değerli işleri otomatikleştirme yeteneğini ölçüyor.
Araştırmacılar, önde gelen yapay zeka ajanlarından birkaçına çeşitli simüle edilmiş serbest çalışma görevleri verdiler ve en iyilerinin bile işin %3'ünden daha azını gerçekleştirebildiğini ve olası 143.991 dolardan 1.810 dolar kazanabildiğini gördüler. Araştırmacılar çeşitli araçları incelediler ve en yeteneklisinin aynı adlı Çinli bir girişim olan Manus olduğunu, ardından xAI'dan Grok, Anthropic'ten Claude, OpenAI'dan ChatGPT ve Google'dan Gemini olduğunu buldular.
CAIS direktörü Dan Hendrycks, "Umarım bu, yapay zeka yeteneklerinde neler olup bittiğine dair çok daha doğru izlenimler verir," diyor. Bazı ajanlar son bir yılda önemli ölçüde iyileşmiş olsa da, bunun aynı oranda devam edeceği anlamına gelmediğini de ekliyor.
Yapay zekadaki olağanüstü gelişmeler, yapay zekanın yakında insan zekasını geride bırakıp çok sayıda çalışanın yerini alacağı yönünde spekülasyonlara yol açtı. Mart ayında, Anthropic CEO'su Dario Amodei, kodlama işlerinin yüzde 90'ının birkaç ay içinde otomatikleştirileceğini öne sürmüştü.
Yapay zekanın önceki dalgaları, örneğin radyologların yapay zeka algoritmalarıyla yakın zamanda değiştirileceği gibi, iş kayıpları konusunda yanlış tahminlere yol açmıştı.
Araştırmacılar, onaylı Upwork çalışanları aracılığıyla bir dizi serbest çalışma görevi oluşturdular. Görevler, grafik tasarım, video düzenleme, oyun geliştirme ve veri toplama gibi idari işler de dahil olmak üzere çeşitli işleri kapsıyordu. Her işin açıklamasını, işi gerçekleştirmek için gereken dosyaların bir dizini ve bir insan tarafından üretilmiş tamamlanmış bir proje örneğiyle birleştirdiler.
Hendrycks, yapay zeka modellerinin son yıllarda kodlama , matematik ve mantıksal akıl yürütmede daha iyi hale gelmesine rağmen, farklı araçları kullanmakta ve çok sayıda adım içeren karmaşık görevleri gerçekleştirmekte hâlâ zorlandıklarını söylüyor. "Uzun süreli hafıza depolama yetenekleri yok ve deneyimlerden sürekli öğrenme sağlayamıyorlar. İnsanlar gibi iş başında beceri edinemiyorlar," diyor.
Analiz, OpenAI tarafından Eylül ayında sunulan ve ekonomik açıdan değerli işleri ölçmeyi amaçlayan GDPval adlı bir ekonomik iş kıyaslamasına karşı bir tez sunuyor. GDPval'e göre, GPT-5 gibi öncü yapay zeka modelleri, çeşitli ofis işlerindeki 220 görevde insan yeteneklerine yaklaşıyor. OpenAI ise herhangi bir yorumda bulunmadı.
Scale AI'nın araştırma direktörü Bing Liu, "Yıllardır yapay zeka ve işler hakkında tartışıyoruz, ancak bunların çoğu varsayımsal veya teorikti" diye ekliyor.
Liu ve Hendrycks, yeni ölçütün yapay zekânın ekonomik etkisi için mükemmel bir ölçüt olmadığını kabul ediyor. Birçok meslek, bu ölçütün kapsamına girmeyen görevleri de içeriyor. Gerçekte, birçok serbest çalışanın da yapay zekâyı üretkenliklerini artıracak bir araç olarak kullanma olasılığı yüksek.
Ancak yapay zekanın işleri ele geçirdiği fikri ivme kazanıyor. Amazon bu hafta, kısmen üretken yapay zekanın hızlı yükselişine bağladığı bir hamleyle 14.000 kişiyi işten çıkaracağını duyurdu. Amazon'un insan deneyimi ve teknolojiden sorumlu kıdemli başkan yardımcısı Beth Galetti, kamuoyuyla paylaşılan bir notta, "Bu nesil yapay zeka, internetten bu yana gördüğümüz en dönüştürücü teknoloji," diye yazdı . "Şirketlerin (hem mevcut pazar segmentlerinde hem de tamamen yeni pazar segmentlerinde) her zamankinden çok daha hızlı yenilik yapmasını sağlıyor."
Ancak Uzaktan Çalışma Endeksi bir gösterge ise, yapay zekanın boşalan bu rollerden herhangi birine adım atması pek olası görünmüyor.
Yapay zekanın işinizi elinizden almasından mı endişeleniyorsunuz? [email protected] adresine e-posta göndererek bana bildirin.
Bu, Will Knight'ın Yapay Zeka Laboratuvarı bülteninin bir sayısıdır . Önceki bültenleri buradan okuyabilirsiniz.
wired




