Seorang hakim federal telah memberikan putusan yang terbagi dalam kasus hak cipta besar yang dapat mengubah cara perusahaan AI memperoleh data pelatihan. Meskipun Anthropic meraih kemenangan signifikan dalam hal fair use, perusahaan kini menghadapi potensi ganti rugi miliaran dolar karena mengunduh lebih dari 7 juta buku bajakan untuk membangun asisten AI mereka Claude.
Kasus ini mengungkap dua pendekatan yang sangat berbeda yang diambil Anthropic untuk mengumpulkan materi pelatihan. Di satu sisi, perusahaan menghabiskan jutaan dolar untuk membeli buku fisik bekas, yang kemudian mereka potong dan pindai menjadi file digital sebelum membuang yang asli. Hakim William Alsup memutuskan proses ini sangat transformatif dan memenuhi syarat sebagai fair use di bawah hukum hak cipta.
Metode Akuisisi Data Anthropic
- Pendekatan legal: Membeli jutaan buku bekas, memotong dan memindainya, membuang buku asli
- Pendekatan ilegal: Mengunduh 5 juta buku dari Library Genesis (2021) + 2 juta dari Pirate Library Mirror (2022)
- Putusan pengadilan: Pemindaian buku fisik = penggunaan wajar; unduhan bajakan = pelanggaran hak cipta
Kemenangan Hukum yang Datang dengan Harga
Putusan fair use hakim ini merupakan kemenangan besar bagi industri AI. Alsup membandingkan pelatihan AI dengan pembelajaran manusia, mencatat bahwa orang selalu membaca buku, menginternalisasi tema-temanya, dan menggunakan pengetahuan itu untuk menciptakan karya baru. Dia berargumen bahwa mengharuskan pembayaran setiap kali seseorang mengingat informasi dari memori akan tidak terpikirkan.
Namun, kemenangan ini datang dengan peringatan yang signifikan. Pengadilan menemukan bahwa salah satu pendiri Anthropic, Ben Mann, dengan sengaja mengunduh setidaknya 5 juta buku dari Library Genesis pada 2021, diikuti oleh 2 juta lainnya dari Pirate Library Mirror pada 2022. Komunikasi internal mengungkapkan perusahaan lebih memilih mencuri buku untuk menghindari kerumitan hukum/praktik/bisnis dari lisensi yang tepat.
Kisah Dua Standar
Putusan ini telah memicu perdebatan sengit tentang keadilan dalam penegakan hak cipta. Banyak anggota komunitas menunjuk pada kontras yang mencolok antara bagaimana individu dan korporasi diperlakukan untuk pelanggaran serupa. Sementara remaja menghadapi tuduhan pidana dan denda besar karena mengunduh musik di awal 2000-an, dan Aaron Swartz menghadapi penuntutan federal karena mengunduh makalah akademik, korporasi besar tampaknya hanya menghadapi hukuman perdata.
Dampak finansial potensialnya mencengangkan. Di bawah hukum hak cipta standar, ganti rugi berdasarkan undang-undang berkisar dari 750 hingga 150.000 dolar Amerika Serikat per karya untuk pelanggaran yang disengaja. Dengan 7 juta buku bajakan, Anthropic secara teoritis dapat menghadapi ganti rugi melebihi 1 triliun dolar Amerika Serikat, meskipun para ahli hukum mengharapkan penyelesaian akhir akan jauh lebih rendah.
Hukuman Pelanggaran Hak Cipta
- Ganti rugi standar menurut undang-undang: $750 - $30,000 USD per karya
- Ganti rugi pelanggaran yang disengaja: Hingga $150,000 USD per karya
- Potensi kewajiban maksimum Anthropic: $1,05 triliun USD (7 juta karya × $150,000)
- Tanggal sidang untuk ganti rugi: Desember 2025
Implikasi Seluruh Industri
Kasus ini tampaknya hanya puncak gunung es. Diskusi komunitas menunjukkan bahwa sebagian besar perusahaan AI besar telah mengandalkan konten bajakan untuk data pelatihan, dengan beberapa menunjuk pada praktik serupa di Meta, Google, dan raksasa teknologi lainnya. Putusan ini menetapkan preseden yang jelas: perusahaan dapat melatih model AI pada materi berhak cipta yang mereka miliki secara legal, tetapi mengunduh konten bajakan tetap merupakan pelanggaran hak cipta terlepas dari tujuan penggunaannya.
Keputusan ini juga menyoroti ketegangan yang lebih luas dalam industri teknologi antara inovasi dan etika. Sementara perusahaan berargumen bahwa penegakan hak cipta yang ketat akan menghambat pengembangan AI, kritikus mempertanyakan mengapa beberapa korporasi terkaya di dunia menggunakan pembajakan ketika mereka mampu melisensikan konten dengan benar.
Melihat ke Depan
Persidangan juri yang dijadwalkan pada Desember 2025 akan menentukan ganti rugi sebenarnya yang harus dibayar Anthropic untuk buku-buku bajakan tersebut. Perusahaan telah membeli salinan legal dari buku-buku yang terlibat dalam gugatan, meskipun hakim mencatat ini tidak membebaskan mereka dari pelanggaran masa lalu.
Putusan ini mungkin memaksa perusahaan AI untuk mempertimbangkan kembali strategi akuisisi data mereka. Beberapa pengamat industri menyarankan ini dapat mengarah pada sistem dua tingkat di mana perusahaan yang didanai dengan baik dapat membeli lisensi yang tepat sementara pesaing yang lebih kecil tersingkir dari pasar. Yang lain berharap ini akan mendorong pengembangan praktik pelatihan yang lebih etis dan kompensasi yang lebih baik untuk pencipta konten.
Seiring industri AI terus berkembang, kasus ini berfungsi sebagai pengingat bahwa bahkan teknologi transformatif harus beroperasi dalam batas-batas hukum. Pertanyaannya sekarang adalah apakah perusahaan AI lain akan belajar dari pelajaran mahal Anthropic atau terus menguji batas-batas hukum hak cipta.