Sebuah putusan hukum bersejarah telah memberikan vonis campuran untuk perusahaan AI Anthropic , menetapkan preseden penting tentang bagaimana perusahaan kecerdasan buatan dapat secara legal memperoleh data pelatihan sambil menyoroti ketegangan yang sedang berlangsung antara perlindungan hak cipta dan pengembangan AI.
Pengadilan Menetapkan Preseden Penggunaan Wajar untuk Pelatihan AI
Hakim pengadilan federal San Francisco William Alsup memutuskan pada hari Senin bahwa penggunaan Anthropic atas materi berhak cipta untuk melatih model bahasa besar Claude merupakan penggunaan wajar di bawah hukum hak cipta AS. Hakim tersebut menggambarkan output model AI yang dilatih pada materi berhak cipta sebagai sesuatu yang pada dasarnya transformatif, menarik perbandingan antara sistem AI dan penulis manusia yang belajar dari karya-karya yang sudah ada. Hakim Alsup menulis bahwa model AI Anthropic dilatih pada karya-karya bukan untuk berlomba maju dan mereplikasi atau menggantikannya — tetapi untuk mengambil belokan tajam dan menciptakan sesuatu yang berbeda.
Preseden Hukum Utama
- Putusan penggunaan wajar: Pelatihan AI menggunakan materi berhak cipta dianggap "sangat transformatif"
- Pembedaan pembajakan: Akuisisi legal diperlukan, bahkan untuk tujuan penggunaan wajar
- Pemindaian destruktif: Dapat diterima secara hukum ketika buku dibeli dan langsung dihancurkan
![]() |
---|
Aplikasi " Claude " oleh Anthropic , yang menjadi pusat putusan penggunaan wajar terbaru mengenai data pelatihan AI |
Tuduhan Pembajakan Masih Memerlukan Penyelesaian Hukum
Meskipun meraih kemenangan penggunaan wajar, Anthropic harus kembali ke pengadilan pada bulan Desember untuk menangani tuduhan pelanggaran hak cipta melalui pembajakan. Gugatan yang diajukan oleh penulis Andrea Bartz , Charles Graeber , dan Kirk Wallace Johnson pada Agustus 2024, menuduh bahwa Anthropic mengunduh versi bajakan yang diketahui dari karya-karya Penggugat. Dokumen pengadilan mengungkapkan kekhawatiran internal dari karyawan Anthropic tentang penggunaan buku bajakan untuk tujuan pelatihan. Hakim Alsup jelas dalam hal ini, menyatakan Anthropic tidak memiliki hak untuk menggunakan salinan bajakan untuk perpustakaan utamanya.
Kronologi Hukum
- Agustus 2024: Para penulis mengajukan gugatan terhadap Anthropic
- Februari 2024: Anthropic merekrut Tom Turvey dari Google Books
- Desember 2025: Jadwal sidang untuk tuduhan pembajakan
Perusahaan Beralih ke Strategi Akuisisi Buku yang Mahal
Dokumen hukum mengungkapkan bahwa Anthropic menghabiskan jutaan dolar Amerika untuk memperoleh dan mendigitalkan buku fisik untuk pelatihan AI setelah beralih dari sumber bajakan. Pada Februari 2024, perusahaan mempekerjakan Tom Turvey , yang sebelumnya mengelola kemitraan untuk Google Books , dengan misi untuk memperoleh semua buku di dunia. Perusahaan mengadopsi pendekatan pemindaian destruktif, membeli buku dalam jumlah besar, melepas penjilidan, memindai halaman menjadi file PDF yang dapat dibaca mesin, dan kemudian membuang salinan fisik sepenuhnya.
Dampak Finansial
- Anthropic menghabiskan jutaan USD untuk akuisisi dan digitalisasi buku
- Perusahaan beralih dari sumber bajakan gratis ke alternatif legal yang mahal
- Proses pemindaian destruktif melibatkan pembelian dalam jumlah besar, pemindaian, dan pembuangan
Manuver Hukum Strategis Meniru Pendekatan Google
Perekrutan Turvey oleh Anthropic tampaknya merupakan upaya strategis untuk mereplikasi pembelaan hukum Google yang sukses atas proyek digitalisasi bukunya, yang sebelumnya diputuskan pengadilan sebagai penggunaan wajar. Hakim menetapkan bahwa metode pemindaian Anthropic merupakan penggunaan wajar karena buku-buku tersebut dibeli secara legal, segera dihancurkan setelah pemindaian, dan file digital hanya digunakan secara internal tanpa distribusi eksternal. Digitalisasi penghemat ruang ini dianggap memiliki karakteristik transformatif yang diperlukan untuk perlindungan penggunaan wajar.
Metode Alternatif Ada Namun Masih Kurang Dimanfaatkan
Kasus ini menyoroti bahwa teknologi pemindaian non-destruktif tersedia dengan mudah, seperti yang ditunjukkan oleh organisasi seperti Internet Archive . Awal bulan ini, OpenAI dan Microsoft mengumumkan kolaborasi dengan Harvard University Library untuk melatih AI menggunakan hampir satu juta buku domain publik sambil melestarikan volume asli. Namun, sebagian besar perusahaan AI terus memprioritaskan kecepatan dan efisiensi biaya daripada pelestarian saat memperoleh data pelatihan.
Implikasi yang Lebih Luas untuk Industri AI
Putusan ini datang ketika Data (Use and Access) Bill Inggris baru-baru ini disahkan tanpa amandemen yang akan mengharuskan perusahaan AI untuk menyatakan penggunaan mereka atas materi berhak cipta atau menyediakan ketentuan opt-out untuk pemegang hak cipta. Preseden hukum yang ditetapkan dalam kasus ini dapat mempengaruhi bagaimana perusahaan AI mendekati akuisisi data, menunjukkan bahwa membeli dan mendigitalkan karya berhak cipta dapat memberikan jalur yang lebih aman secara hukum daripada mengandalkan konten online yang tersedia gratis namun berpotensi bajakan.