Pelatihan AI pada Buku Berhak Cipta Memicu Perdebatan Fair Use saat Anthropic Meraih Kemenangan Parsial

Tim Komunitas BigGo
Pelatihan AI pada Buku Berhak Cipta Memicu Perdebatan Fair Use saat Anthropic Meraih Kemenangan Parsial

Putusan pengadilan terbaru yang menguntungkan Anthropic telah memicu kembali diskusi tentang apakah perusahaan AI dapat secara legal melatih model mereka menggunakan konten berhak cipta. Meskipun perusahaan tersebut meraih kemenangan parsial untuk operasi pemindaian buku mereka, kasus ini mengungkap pertanyaan yang lebih mendalam tentang bagaimana hukum hak cipta berlaku untuk kecerdasan buatan di era digital.

Pertarungan hukum ini berasal dari masa-masa awal Anthropic ketika perusahaan yang didirikan oleh mantan peneliti OpenAI ini mengunduh jutaan buku bajakan untuk melatih model AI mereka. Antara tahun 2021 dan 2022, mereka memperoleh lebih dari 7 juta salinan tidak sah dari situs-situs pembajakan terkenal termasuk Books3, Library Genesis, dan Pirate Library Mirror. Kemudian, perusahaan beralih ke pendekatan yang lebih sah dengan menghabiskan jutaan dolar Amerika Serikat untuk membeli dan memindai buku fisik.

Timeline Akuisisi Buku Anthropic:

  • Januari-Februari 2021: Mengunduh Books3 (196.640 buku bajakan)
  • Juni 2021: Mengunduh 5+ juta buku dari Library Genesis
  • Juli 2022: Mengunduh 2+ juta buku dari Pirate Library Mirror
  • Februari 2024: Merekrut mantan kepala kemitraan pemindaian buku Google
  • 2024: Membeli dan memindai jutaan buku fisik senilai jutaan USD

Analogi Manusia-AI Mendapat Kritik

Putusan Hakim William Alsup menarik paralel antara pembelajaran manusia dan pelatihan AI, dengan berargumen bahwa sebagaimana manusia membaca buku dan menggunakannya dalam tulisan mereka, model AI seharusnya memiliki hak yang serupa. Namun, perbandingan ini telah memicu perdebatan sengit di komunitas teknologi.

Para kritikus berargumen bahwa antropomorfisasi ini melewatkan poin krusial tentang skala dan kecepatan. Isu fundamental bukanlah apakah AI dapat belajar dari buku, tetapi apakah hukum fair use yang ada dapat menangani skala masif di mana sistem-sistem ini beroperasi. Tidak seperti manusia yang mungkin membaca ratusan buku dalam seumur hidup, model AI dapat memproses jutaan karya secara bersamaan dan merespons pertanyaan yang tak terhitung jumlahnya secara instan.

Tetapi membuat siapa pun membayar secara khusus untuk penggunaan buku setiap kali mereka membacanya, setiap kali mereka mengingatnya dari memori, setiap kali mereka kemudian menggunakannya ketika menulis hal-hal baru dengan cara-cara baru akan menjadi tidak terpikirkan.

Skala Mengubah Segalanya

Diskusi komunitas mengungkap kekhawatiran utama: kecepatan dan skala secara fundamental mengubah lanskap hukum. Banyak yang menunjukkan bahwa fair use dirancang untuk aktivitas skala manusia, bukan pemrosesan data skala industri. Ketika sistem AI dapat secara instan mengingat dan mensintesis informasi dari jutaan karya berhak cipta, hal ini berpotensi merusak insentif ekonomi yang dimaksudkan untuk dilindungi oleh hak cipta.

Beberapa membandingkan ini dengan area lain di mana skala mengubah legalitas. Sebuah situs web yang mengalami lalu lintas organik dari media sosial tidak melanggar hukum apa pun, tetapi volume permintaan otomatis yang sama akan merupakan serangan DDoS. Perbedaannya tidak hanya terletak pada niat, tetapi pada kemampuan teknologi yang memungkinkan skala tersebut.

Ringkasan Putusan Pengadilan:

  • Kemenangan Fair Use: Operasi pemindaian buku dianggap transformatif dan dilindungi
  • Tanggung Jawab Pembajakan: Materi bajakan yang diunduh tidak dilindungi oleh fair use
  • Langkah Selanjutnya: Persidangan juri menunggu untuk unduhan buku bajakan
  • Preseden Hukum: Putusan besar pertama tentang fair use data pelatihan AI

Hasil Hukum yang Beragam

Keputusan pengadilan bersifat bernuansa, menemukan bahwa operasi pemindaian buku Anthropic yang kemudian memenuhi syarat sebagai fair use karena bersifat transformatif dan dijaga internal. Namun, unduhan materi bajakan sebelumnya tidak mendapat perlindungan yang sama dan kemungkinan akan menghadapi persidangan juri.

Keputusan yang terbagi ini menyoroti kompleksitas penerapan konsep hak cipta tradisional pada pengembangan AI. Meskipun perusahaan berpotensi dapat mengklaim fair use untuk pelatihan AI yang transformatif, mereka tidak dapat begitu saja mengabaikan hak cipta dengan menggunakan materi bajakan sebagai data sumber.

Putusan ini menetapkan preseden penting, tetapi masih jauh dari kata terakhir. Dengan kasus serupa yang tertunda terhadap perusahaan AI besar lainnya, dan yurisdiksi yang berbeda berpotensi mencapai kesimpulan yang berbeda, lanskap hukum untuk data pelatihan AI tetap tidak pasti. Industri teknologi akan mengamati dengan cermat saat kasus-kasus ini berkembang, mengetahui bahwa hasilnya dapat mengubah cara sistem AI dikembangkan dan diterapkan.

Referensi: Anthropic wins a major fair use victory for Al - but it's still in trouble for stealing books