Hakim Federal Memutuskan Pelatihan AI pada Buku adalah Penggunaan Wajar, Namun Model Open-Weight Menghadapi Masa Depan yang Tidak Pasti

Tim Komunitas BigGo
Hakim Federal Memutuskan Pelatihan AI pada Buku adalah Penggunaan Wajar, Namun Model Open-Weight Menghadapi Masa Depan yang Tidak Pasti

Putusan pengadilan federal yang mendukung Anthropic telah menyatakan bahwa melatih model AI pada buku-buku yang diterbitkan tanpa izin penulis merupakan penggunaan wajar di bawah hukum hak cipta. Namun, keputusan ini telah memicu perdebatan sengit tentang masa depan model AI open-weight dan menimbulkan pertanyaan tentang apa yang memisahkan pelatihan AI yang legal dari pelanggaran hak cipta.

Putusan Hakim William Orrick menetapkan bahwa perusahaan AI dapat secara legal melatih model mereka pada buku-buku berhak cipta, asalkan mereka menerapkan perlindungan yang tepat. Keputusan ini bergantung pada perbedaan yang krusial: meskipun model AI mungkin menghafal bagian substansial dari karya berhak cipta, perusahaan seperti Anthropic dapat menghindari pelanggaran dengan menggunakan filter sisi server untuk mencegah pengguna mengekstrak konten yang dihafal.

Perbedaan Hukum Utama:

  • Melatih model AI menggunakan buku-buku berlisensi hak cipta = Penggunaan wajar (dengan penyaringan yang tepat)
  • Menggunakan salinan bajakan untuk pelatihan = Pelanggaran hak cipta
  • Penyaringan sisi server = Perlindungan hukum untuk model tertutup
  • Model open-weight tanpa penyaringan = Potensi pelanggaran hak cipta

Dilema Model Open-Weight

Putusan ini menciptakan tantangan signifikan bagi model AI open-weight seperti seri Llama milik Meta . Berbeda dengan sistem tertutup yang dapat mengontrol output melalui filter sisi server, model open-weight dapat diunduh dan dijalankan secara lokal tanpa batasan konten apa pun. Ini berarti pengguna berpotensi dapat mengekstrak materi berhak cipta yang dihafal langsung dari bobot model.

Diskusi komunitas teknologi mengungkapkan kekhawatiran yang meningkat bahwa kerangka hukum ini dapat secara efektif menghilangkan model AI open-source yang mampu secara luas. Biaya untuk memperoleh materi pelatihan secara legal untuk sistem AI yang komprehensif dapat memerlukan dukungan senilai jutaan dolar Amerika Serikat, menciptakan hambatan substansial bagi pengembang dan peneliti yang lebih kecil.

Dampak pada Jenis Model AI:

  • Model Tertutup ( ChatGPT , Claude ): Terlindungi oleh penyaringan sisi server, dapat melanjutkan praktik saat ini
  • Model Open-Weight ( Llama , dll.): Menghadapi potensi kepunahan karena ketidakmampuan mengontrol output
  • Biaya Pelatihan: Akuisisi dataset legal dapat menghabiskan biaya jutaan USD untuk model komprehensif

Masalah Pembajakan Tetap Belum Terselesaikan

Meskipun pengadilan memutuskan dengan baik pada aspek pelatihan, Anthropic masih menghadapi persidangan terpisah karena menggunakan salinan bajakan buku selama proses pelatihan awal mereka. Hakim Alsup memperjelas bahwa membeli salinan yang sah setelah kejadian tidak membebaskan perusahaan dari tanggung jawab atas pelanggaran hak cipta asli, meskipun dapat mengurangi ganti rugi menurut undang-undang.

Perbedaan antara metode pelatihan legal dan akuisisi data ilegal ini dapat mengubah cara perusahaan AI mendekati pembuatan dataset. Putusan ini menunjukkan bahwa perusahaan harus memperoleh salinan yang sah dari karya berhak cipta sebelum pelatihan, mirip dengan cara Google Books beroperasi dengan perjanjian lisensi yang tepat.

Implikasi untuk Industri AI

Keputusan ini merupakan kemenangan signifikan bagi perusahaan AI besar sambil berpotensi menciptakan hambatan baru untuk pengembangan open-source. Para ahli komunitas mencatat bahwa putusan ini tidak menetapkan preseden yang mengikat karena berasal dari pengadilan distrik, tetapi memberikan peta jalan bagi hakim lain yang menghadapi kasus serupa.

Model open yang mampu secara luas sedang menuju kehancuran. Biaya untuk memperoleh semua materi pelatihan secara legal akan memerlukan dukungan yang besar.

Putusan ini juga menimbulkan pertanyaan tentang daya saing internasional, karena negara-negara dengan pendekatan penegakan hak cipta yang berbeda dapat memperoleh keuntungan dalam pengembangan AI. Kerangka hukum ini dapat mendorong lebih banyak pengembangan AI menuju yurisdiksi dengan hukum kekayaan intelektual yang lebih permisif.

Kasus ini menyoroti ketegangan yang berkelanjutan antara melindungi hak pencipta dan mendorong inovasi teknologi. Seiring kemampuan AI terus berkembang, pengadilan dan pembuat undang-undang perlu menyeimbangkan kepentingan yang bersaing ini sambil memastikan kompensasi yang adil bagi pencipta konten yang karyanya memungkinkan sistem-sistem yang kuat ini.

Referensi: A federal judge sides with Anthropic in lawsuit over training AI on books without authors' permission