New York Times Makbuzları Getiriyor – The Hollywood Reporter
Nisan içinde, New York Times Otomatik sohbet robotlarını eğitmek için makalelerinin kullanımına ilişkin endişeleri çözecek bir anlaşmayı araştırmak için OpenAI ve Microsoft’a ulaştı. Medya kuruluşu, ChatGPT ve BingChat’in yüksek oranda duyurulmasının ardından şirketlere, teknolojilerinin telif hakkıyla korunan çalışmaları ihlal ettiği uyarısında bulundu. Kararın şartları arasında bir lisans anlaşması ve üretken yapay zeka araçları etrafında korkuluklar kurulması yer alıyordu, ancak görüşmelerde böyle bir ateşkes sağlanamadı.
Müzakerelerde çıkmaza girildiğinde, Zamanlar Çarşamba günü, haber yayıncılık endüstrisi üzerinde geniş kapsamlı etkileri olabilecek bir davada, teknolojinin gündeme getirdiği yeni telif hakkı sorunları nedeniyle dava açan ilk büyük medya şirketi oldu. Potansiyel olarak tehlikede olan: Okuyucuların yapay zeka araçları tarafından oluşturulan arama sonuçları lehine doğrudan kaynakları atlayabildiği bir ortamda medyanın finansal sürdürülebilirliği. Dava, OpenAI’yi pahalı bir lisans anlaşmasını kabul etmeye zorlayabilir çünkü bu durum, sohbet robotunu eğitmek için telif hakkıyla korunan materyalleri kullanmasını engelleyen olumsuz bir içtihat hukuku yaratabilir.
Zamanlar‘ şikayeti, AI şirketlerine karşı diğer telif hakkı davalarındaki argümanlara dayanıyor ve bazı tuzaklardan kaçınıyor. Özellikle, OpenAI’nin sohbet botunun kendisinin hak ihlalinde bulunduğu teorisini geliştirmekten uzak duruyor ve şirketin teknolojisi tarafından oluşturulan makalelerden birebir alıntılara işaret ediyor; bu da benzer davaları denetleyen birden fazla mahkemenin talep ettiğinin kanıtı.
Dava, OpenAI ve Microsoft ürünlerine ilişkin kapsamlı kanıtlar sunarak, istendiğinde makalelerin neredeyse kelimesi kelimesine alıntılarını görüntüleyerek kullanıcıların ödeme duvarını aşmasına olanak tanıyor. Bu yanıtlar, Zamanlar sıradan arama sonuçlarında gösterilen metin parçacıklarının çok ötesine geçmeyi savunuyor. Bir örnek: Bing Chat, 2023 tarihli “Hamas’ın İsrail Ordusu hakkında bildiği sırlar” başlıklı makalenin ilk 396 kelimesinin ikisi dışında tamamını kopyaladı. Bir sergi, OpenAI’nin GPT’sinin üzerinde eğitim aldığı ve The Guardian’dan makaleleri ezberlediği yüzlerce durumu gösteriyor. Zamanlarkırmızı renkte kelime kelime kopyalama ve siyah renkte farklılıklar ile.
Aynı davalara bakan iki mahkemeye göre, davacıların muhtemelen üzerinde eğitim aldıkları iddia edilen telif hakkıyla korunan materyalle aynı olan, sohbet botları tarafından üretilen ve hak ihlalinde bulunduğu iddia edilen çalışmalara dair kanıt göstermesi gerekecek. Bu, StabilityAI’ye dava açan sanatçılar için potansiyel olarak büyük bir sorun teşkil ediyor çünkü sanatçılar “belirli bir Metin İstemine yanıt olarak sağlanan Stabil Difüzyon çıktı görüntülerinin hiçbirinin, eğitim verilerindeki herhangi bir belirli görüntüyle yakın eşleşme olmayacağını” kabul ettiler. ABD Bölge Hakimi William Orrick, Ekim ayında AI jeneratörlerine yönelik iddiaları reddeden bir kararda, telif hakkı iddialarının “‘önemli benzerlik’ türü iddialar olmadan ayakta kalabileceğine” “ikna olmadığını” yazdı. Bir ay sonra onun izinden giden ABD Bölge Hakimi Vince Chhabria, çıktılardan herhangi birinin “davacıların yeniden şekillendirilmesi, dönüştürülmesi veya uyarlanması olarak anlaşılabileceğine” dair kanıt bulunmadığında, Meta’nın yazarların açtığı bir davada hak ihlalinden sorumlu tutulup tutulamayacağını sorguladı. ‘ kitabın.”
Haynes Boone’un fikri mülkiyet uygulamaları başkanı Jason Bloom, “İşten çıkarılma ihtimali yüksek olan bir davaya sahip olmak için, işinize büyük ölçüde benzeyen bir çıktı örneği göstermeniz gerekiyor” diyor. “Bunu diğer durumlarda kanıtlamak gerçekten zor oldu.”
Çıktılar, makalelerin Zamanlar Yapay zeka sistemlerini eğitmek için kullanıldı. Eğitim veri kümeleri büyük ölçüde kara kutular olduğundan, diğer davaların çoğunda davacılar çalışmalarının dahil edildiğini kesin olarak söyleyemediler. Örneğin OpenAI’ye dava açan yazarlar, şirketin kitaplarını kullandığının kanıtı olarak yalnızca ChatGPT’nin romanlarındaki temaların özetlerini ve derinlemesine analizlerini ürettiğini gösterebilir.
Zamanlar‘ yaklaşımı, davasını çoğunlukla yapay zeka sistemlerini eğitmek için telif hakkıyla korunan materyallerin alınmasıyla ilgili sorunlarla sınırlamayı seçen Yazarlar Birliği’nin şikayetiyle çelişiyor. Kuruluşun genel müdürü Mary Rasenberger, “Telif hakkı yasası her zaman önemli benzerlik konusunda ısrar etti” diyor. “Ve tam bir reprodüksiyona sahip olduğunuzda, bu tanım gereği büyük ölçüde benzerdir.”
Zamanlar bunun GPT’yi eğitmek için kullanılan en büyük özel veri kaynağı olduğunu (ve genel olarak yalnızca Wikipedia ve ABD patent belgeleri veritabanının ardından üçüncü kaynak) olduğunu vurguluyor. Çevrimiçi olarak yaygın olarak bulunan bir çöp içerik okyanusunun ortasında, saygın yayıncıların makaleleri eğitim verileri olarak yeniden önem kazanıyor çünkü bunların iyi yazılmış ve doğru olma olasılıkları genellikle çevrimiçi olarak bulunan diğer içeriklere göre daha yüksek. Bu ortamda, haber arşivleri teknoloji şirketleri için giderek daha değerli hale geldikçe bu dava gelecek birkaç davadan ilki olabilir. Sahibi Axel Springer Politika Ve İşletme İçeriğibu ay GPT ürünlerini eğitmeye yönelik içeriği için OpenAI ile bir anlaşmaya vardı ve kendi yasal itirazını başlatmak yerine yapay zeka devinden para almayı tercih etti.
Yine de Zamanlar kurgu içerikli yazarların önderlik ettiği diğer bazı davalarla karşılaştırıldığında zorlu bir mücadeleyle karşı karşıya kalabilir. Yazarlar Birliği tarafından açılan dava, gerçeklerin telif hakkıyla korunamaması nedeniyle muhtemelen yalnızca bir kurgu yazarları sınıfını temsil etmeyi amaçlıyor; bu da haber makaleleri veya kurgu olmayan romanlara ilişkin ihlal iddiasını daha da zorlaştırıyor. Kelimenin tam anlamıyla kopyalandığına dair kanıt sağlamak, Zamanlar OpenAI ürünlerinin sadece gerçekleri sunmakla kalmayıp, sunuldukları kompozisyonu da kopyaladıklarını göstermek için.
Şikayet, telif hakkı ihlali, telif hakkı ihlaline katkıda bulunulması, ticari markanın sulandırılması, haksız rekabet ve Dijital Binyıl Telif Hakkı Yasası’nın ihlali iddialarını beraberinde getiriyor. Onu yapay zeka şirketlerine karşı diğerlerinden ayıran davadaki bir kırışıklık, sahte bir şekilde “halüsinasyonları” şirkete atfettiği iddialarını içeriyor. Zamanlar.
“Büyük gazetelerin portakal suyunun Hodgkin dışı lenfomayla bağlantılı olduğunu bildiren bilgilendirici bir makale talep edilmesine yanıt olarak, bir GPT modeli tamamen şu şekilde uyduruldu: ‘The New York Times, 10 Ocak 2020’de ‘Çalışma Bulguları’ başlıklı bir makale yayınladı. Şikayette Portakal Suyu ile Hodgkin Dışı Lenfoma Arasındaki Olası Bağlantı” ifadesi yer alıyor. “The Times asla böyle bir makale yayınlamadı.”
Her kasıtlı ihlal için yasal maksimum miktar 150.000 ABD doları olduğundan, bir ihlalin tespiti büyük zararlara yol açabilir.