Yapay zekalı sohbet robotlarının öğrenmesi için daha fazla kitaba ihtiyaç var ve ABD'deki birçok kütüphane onlara kitap ödünç verecek.

Dil Seçin

Turkish

Down Icon

Ülke Seçin

Mexico

Down Icon

Yapay zekalı sohbet robotlarının öğrenmesi için daha fazla kitaba ihtiyaç var ve ABD'deki birçok kütüphane onlara kitap ödünç verecek.

Yapay zekalı sohbet robotlarının öğrenmesi için daha fazla kitaba ihtiyaç var ve ABD'deki birçok kütüphane onlara kitap ödünç verecek.

İnternette duyduğumuz her şey , yapay zekaya insanlık hakkında bir şeyler öğretmenin sadece başlangıcıydı. Şimdi, teknoloji şirketleri daha da eski bir bilgi deposuna yöneliyor: kütüphane rafları.

15. yüzyıla kadar uzanan ve 254 dilde yayınlanmış yaklaşık bir milyon kitap , Harvard Üniversitesi'nin yakın zamanda araştırmacılarla paylaştığı koleksiyonun bir parçasıdır. Boston Halk Kütüphanesi'nin elinde bulunan eski gazete ve hükümet belgeleri hazineleri yakında dahil edilecektir.

Yüzyıllar öncesinden kalma kitaplara erişim sağlamak için kasaların açılması, yazarlar, görsel sanatçılar ve yaratıcı çalışmalarını izinleri olmadan yapay zeka sohbet robotlarını eğitmek için kullanan diğer kişiler tarafından açılan davalarla karşı karşıya kalan teknoloji şirketleri için zengin bir veri kaynağı anlamına gelebilir.

Kamu malı

Microsoft'un yardımcı genel danışmanı Burton Davis, "Telif hakkı devam eden içeriklere göre şu anda daha az tartışmalı olduğu için kamuya açık bilgilerle başlamak ihtiyatlı bir karardır" dedi.

Davis, kütüphanelerin ayrıca "muazzam miktarda ilginç kültürel, tarihi ve dilsel veri" bulundurduğunu ve bunun son yıllarda AI sohbet robotlarının büyük ölçüde öğrendiği çevrimiçi yorumlardan eksik olduğunu belirtti. Bilginin tükenmesi korkusu, AI geliştiricilerinin sohbet robotları tarafından oluşturulan ve daha düşük kalitedeki "sentetik" verilere yönelmesine de yol açtı.

Microsoft ve ChatGPT'nin yaratıcısı OpenAI'nin sınırsız bağışlarının desteğiyle Harvard merkezli Kurumsal Veri Girişimi , dünyanın dört bir yanındaki kütüphaneler ve müzelerle, hizmet verdikleri topluluklara da fayda sağlayacak şekilde tarihi koleksiyonlarını yapay zekaya hazır hale getirme konusunda çalışıyor .

Harvard Hukuk Fakültesi Kütüphane İnovasyon Laboratuvarı'nda araştırmayı yöneten Aristana Scourtas, "Şu anda yapay zekanın elinde olan gücün bir kısmını bu kurumlara geri kaydırmaya çalışıyoruz" dedi. "Kütüphaneciler her zaman veri ve bilginin koruyucuları olmuştur."

Chatbot'lar. Clarín Arşivi. Chatbot'lar. Clarín Arşivi.

Harvard'ın yeni yayınladığı veri kümesi, Institutional Books 1.0, 394 milyondan fazla taranmış kağıt sayfası içeriyor . En eski çalışmalardan biri 15. yüzyıla dayanıyor: Koreli bir ressamın çiçek ve ağaç yetiştiriciliği üzerine el yazısıyla yazdığı düşünceler. En büyük çalışma yoğunluğu 19. yüzyıldan kalma, edebiyat, felsefe, hukuk ve tarım gibi konulardaki çalışmalardır; hepsi nesiller boyu kütüphaneciler tarafından titizlikle korunup düzenlenmiştir.

Doğruluğu artırın

Sistemlerinin doğruluğunu ve güvenilirliğini artırmaya çalışan yapay zeka geliştiricileri için oldukça faydalı olacağı vaat ediliyor.

Veri girişiminin yönetici direktörü ve aynı zamanda siber uzayın incelenmesine odaklanan bir kuruluş olan Harvard'ın Berkman Klein İnternet ve Toplum Merkezi'nde baş teknoloji sorumlusu olan Greg Leppert, "Yapay zeka eğitiminde kullanılan verilerin çoğu orijinal kaynaklardan gelmiyor" diye belirtti. Bu kitap koleksiyonunun "aslında bu materyalleri toplayan kurumlar tarafından taranan fiziksel kopyaya kadar" kapsadığını ekledi.

ChatGPT yapay zekada ticari bir çılgınlık başlatmadan önce, çoğu yapay zeka araştırmacısı Wikipedia'dan, Reddit gibi sosyal medya forumlarından ve bazen korsan kitapların bulunduğu geniş depolarından topladıkları metin pasajlarının kökeniyle özellikle ilgilenmiyordu . Sadece bilgisayar bilimcilerinin token dediği şeye ihtiyaçları vardı: her biri bir kelimenin bir parçasını temsil edebilen veri birimleri.

Chatbots.REUTERS/Dado Ruvic/Illustration Chatbots.REUTERS/Dado Ruvic/Illustration

Harvard'ın yeni AI eğitim koleksiyonunun tahmini 242 milyar jetonu var, bu miktar insanların kavraması için zor olsa da, en gelişmiş AI sistemlerine beslenen miktarın sadece bir damlası. Örneğin, Facebook'un ana şirketi Meta, kapsamlı AI dil modelinin son sürümünün metin, resim ve videolardan çıkarılan 30 trilyondan fazla jeton üzerinde eğitildiğini söyledi.

Meta ayrıca komedyen Sarah Silverman ve diğer yayınlanmış yazarların , şirketin korsan eserlerin bulunduğu "hayalet kütüphanelerden" kitaplarını çaldığını iddia ederek açtıkları davayla da karşı karşıya.

Şimdi bazı çekincelerle kraliyet kütüphaneleri kendi koşullarını dayatıyorlar.

Telif hakkı ihlalleri

Telif hakkı ihlali davalarıyla da karşı karşıya olan OpenAI, bu yıl aralarında Oxford Üniversitesi'nin 400 yıllık Bodleian Kütüphanesi'nin de bulunduğu bir grup araştırma kuruluşuna 50 milyon dolar bağışladı. Bu kütüphane, nadir kitapları dijitalleştiriyor ve bunları yazıya geçirmek için yapay zekayı kullanıyor.

Şirket ilk olarak ABD'nin en büyük kütüphanelerinden biri olan Boston Halk Kütüphanesi'ne başvurduğunda, kütüphanenin dijitalleştirdiği tüm bilgilerin herkese açık olacağını açıkça belirttiğini dijital ve çevrimiçi hizmetler direktörü Jessica Chapel paylaştı.

"OpenAI'nin devasa miktarda eğitim verisine ilgisi vardı. Bizim de devasa miktarda dijital nesneye ilgimiz var. Yani bu, ilgi alanlarının çakıştığı bir durum gibi görünüyor," dedi Chapel.

Dijitalleştirme pahalıdır. Örneğin, Boston kütüphanesi, 19. yüzyılın sonlarında ve 20. yüzyılın başlarında Quebec'teki Kanadalı göçmen toplulukları arasında yaygın olarak dağıtılan düzinelerce Fransızca New England gazetesini tarayıp düzenlemek için titiz bir çalışma harcadı. Bu metin artık yapay zekayı eğitmek için kullanıldığından, kütüphanecilerin zaten sürdürmek istediği projelerin finansmanına yardımcı oluyor.

Chatbots.REUTERS/Dado Ruvic/Illustration Chatbots.REUTERS/Dado Ruvic/Illustration

Harvard'ın koleksiyonu, 2006 yılında bir diğer teknoloji devi olan Google'ın 20 milyondan fazla kitaptan oluşan, aranabilir bir çevrimiçi kütüphane oluşturma projesi kapsamında dijitalleştirilmeye başlanmıştı .

Google, birçok yeni, telif hakkıyla korunan eserin yer aldığı çevrimiçi kütüphanesi nedeniyle yazarların açtığı davaları savuşturmak için yıllarca uğraştı . Sonunda 2016'da, ABD Yüksek Mahkemesi telif hakkı ihlali iddialarını reddeden alt mahkeme kararlarını onayladığında bir çözüm buldu.

95 yıllık koruma

Şimdi, Google ilk kez Harvard ile Google Books ciltlerini kamu malından çıkarmak ve bunları AI geliştiricileriyle paylaşmanın yolunu açmak için çalıştı . Amerika Birleşik Devletleri'ndeki telif hakkı korumaları genellikle 95 yıl sürer ve ses kayıtları için daha uzun sürer.

Yeni girişim, Google'ı kitap projesi nedeniyle dava eden ve yakın zamanda yapay zeka şirketlerini mahkemeye veren aynı yazar grubu tarafından alkışlandı.

Yazarlar Birliği'nin yönetici direktörü Mary Rasenberger bir bildiride, "Bu başlıkların çoğu yalnızca büyük kütüphanelerin raflarında bulunuyor ve bu veri setinin oluşturulması ve kullanılması bu ciltlere ve içerdikleri bilgiye erişimi genişletecek," dedi. "Her şeyden önce, eğitim için kapsamlı bir yasal veri setinin oluşturulması yeni AI modellerinin oluşturulmasını demokratikleştirecek."

Google'ın yapay zeka (AI) sohbet robotu Gemini için iki sayfalık gönderileri gösteren, Google tarafından sağlanan fotoğraf. EFE/Google Google'ın yapay zeka (AI) sohbet robotu Gemini için iki sayfalık gönderileri gösteren, Google tarafından sağlanan fotoğraf. EFE/Google

Tüm bunların gelecek nesil yapay zeka araçları için ne kadar yararlı olacağı henüz bilinmiyor ; zira veriler, herkesin indirebileceği açık kaynaklı yapay zeka veri kümeleri ve modelleri barındıran Hugging Face platformunda paylaşılıyor.

Kitap koleksiyonu, AI'nın tipik veri kaynaklarından daha dilsel olarak çeşitlidir. Ciltlerin yarısından azı İngilizce'dir, ancak özellikle Almanca, Fransızca, İtalyanca, İspanyolca ve Latince olmak üzere Avrupa dilleri baskın olmaya devam etmektedir.

Son derece önemli

Leppert, 19. yüzyıl düşüncesine dayanan bir kitap koleksiyonunun , teknoloji sektörünün, insanlar kadar iyi planlama ve akıl yürütme yeteneğine sahip yapay zeka ajanları üretme çabaları için "son derece önemli" olabileceğini belirtti.

"Bir üniversitede, akıl yürütmenin ne anlama geldiğine dair çok sayıda öğretim materyaliniz var," diye gözlemledi. "Süreçlerin nasıl yürütüleceği ve analizlerin nasıl gerçekleştirileceği hakkında çok sayıda bilimsel bilginiz var."

Aynı zamanda, itibarını yitirmiş bilimsel ve tıbbi teorilerden ırkçı ve sömürgeci anlatılara kadar çok sayıda güncelliğini yitirmiş veri de mevcut .

Harvard Kütüphane İnovasyon Laboratuvarı koordinatörü Kristi Mukk, "Böylesine büyük bir veri kümesiyle uğraştığınızda, zararlı içerik ve dil konusunda bazı zorlu sorunlar ortaya çıkıyor" dedi ve girişimin, veri kullanım risklerini azaltmak için rehberlik sağlamayı ve böylece "kullanıcıların kendi bilinçli kararlarını vermelerine ve yapay zekayı sorumlu bir şekilde kullanmalarına yardımcı olmayı" amaçladığını söyledi.

The Associated Press'in bilgileriyle.

Clarin

Clarin

Benzer Haberler

Tüm Haberler
Animated ArrowAnimated ArrowAnimated Arrow