Kemenangan pengadilan Anthropic baru-baru ini telah mengungkap pendekatan yang tidak biasa dalam pelatihan AI yang membagi komunitas teknologi. Perusahaan tersebut secara fisik menghancurkan jutaan buku untuk menciptakan data pelatihan digital bagi Claude, pesaing ChatGPT mereka, dengan menghabiskan jutaan dolar Amerika Serikat dalam prosesnya. Meskipun secara hukum benar, metode ini telah memicu perdebatan sengit tentang tanggung jawab lingkungan dan etika pengembangan AI.
Solusi Hukum Menciptakan Konsekuensi Tak Terduga
Pemusnahan tersebut bukanlah vandalisme acak melainkan strategi hukum yang diperhitungkan. Hukum hak cipta menciptakan situasi aneh di mana membeli buku fisik menawarkan lebih banyak kebebasan daripada melisensikan versi digital. E-book hadir dengan ketentuan lisensi yang membatasi dan perlindungan DRM yang membuat pemrosesan massal berisiko secara hukum. Buku fisik, yang dilindungi oleh doktrin penjualan pertama, dapat dimodifikasi atau dihancurkan setelah dibeli.
Realitas hukum ini memaksa Anthropic mengambil pendekatan yang meragukan secara lingkungan. Mereka mempekerjakan Tom Turvey, mantan Google Books, untuk melaksanakan operasi pemindaian massal yang melibatkan pemotongan jilid buku, pemindaian halaman, dan membuang sisa-sisa kertas. Proses tersebut dianggap sebagai penggunaan wajar oleh Hakim William Alsup, tetapi hanya karena Anthropic membeli buku-buku tersebut secara legal dan menyimpan file digital secara internal.
Perbandingan Kerangka Hukum
Metode | Status Hukum | Tantangan |
---|---|---|
Pemindaian Buku Fisik | Legal berdasarkan doktrin first-sale | Mahal, boros lingkungan |
Lisensi E-book | Memerlukan perjanjian penerbit | Pembatasan DRM, ketersediaan terbatas |
Konten Bajakan | Pelanggaran hak cipta | Tanggung jawab hukum, potensi tuntutan hukum |
Komunitas Terbagi Soal Dampak Lingkungan
Reaksi komunitas teknologi mengungkap kekhawatiran mendalam tentang praktik lingkungan perusahaan AI. Banyak yang melihat pemusnahan buku sebagai pemborosan, terutama ketika perubahan iklim menuntut penggunaan sumber daya yang lebih bertanggung jawab. Kritikus berargumen bahwa metode alternatif ada - The Internet Archive telah memelopori teknik pemindaian non-destruktif yang melestarikan buku fisik sambil menciptakan salinan digital.
Namun, yang lain membela praktik tersebut sebagai daur ulang yang pragmatis. Sebagian besar buku yang dihancurkan adalah volume umum yang dibeli secara massal dari pengecer besar, bukan manuskrip langka. Seperti yang dicatat seorang pengamat, sedikit orang di bawah 30 tahun yang memelihara perpustakaan pribadi lagi, menunjukkan bahwa buku-buku ini mungkin akan berakhir sebagai limbah.
Pendekatan Alternatif
- Internet Archive: Pemindaian non-destruktif melestarikan buku fisik
- Kemitraan Harvard: OpenAI/Microsoft bekerja sama dengan perpustakaan untuk buku domain publik
- Google Books: Menetapkan preseden hukum untuk proyek digitalisasi buku
- The Pile: Meta menggunakan dataset ini tanpa perusakan buku fisik
![]() |
---|
Dikelilingi oleh kertas sobek, sebuah adegan lucu yang mencerminkan kritik terhadap pemborosan dalam praktik pelatihan AI |
Fiksi Ilmiah Menjadi Kenyataan
Situasi ini secara mengerikan mencerminkan novel Vernor Vinge tahun 2006 Rainbow's End, yang menggambarkan dunia tahun 2025 di mana perpustakaan menggunakan mesin raksasa untuk menghancurkan buku sambil memotret fragmen-fragmennya untuk rekonstruksi digital. Beberapa anggota komunitas mencatat paralel ini, menyoroti bagaimana pengembangan AI saat ini menyerupai fiksi distopia.
Ironinya tidak luput dari pengamat bahwa sementara Harvard dengan hati-hati melestarikan manuskrip berusia 600 tahun untuk pelatihan AI, jutaan buku modern direduksi menjadi bahan daur ulang untuk mengajarkan Claude tentang sastra dan penulisan.
Implikasi Lebih Luas untuk Industri AI
Kasus ini mengungkap kelaparan industri AI yang putus asa akan data pelatihan berkualitas tinggi dan hambatan hukum yang mereka hadapi. Perusahaan awalnya beralih ke konten bajakan untuk menghindari kerumitan hukum/praktik/bisnis - negosiasi lisensi yang kompleks dengan penerbit. Ketika tekanan hukum meningkat, mereka mencari alternatif yang lebih aman, bahkan jika merugikan lingkungan.
Situasi ini mengekspos masalah mendasar: hukum hak cipta saat ini membuat pemusnahan fisik lebih menarik secara hukum daripada lisensi digital. Ini menciptakan insentif yang menyimpang di mana perusahaan memilih metode yang boros daripada yang efisien murni untuk perlindungan hukum.
Perdebatan tersebut pada akhirnya mencerminkan pertanyaan yang lebih besar tentang prioritas pengembangan AI. Sementara teknologi tersebut menjanjikan manfaat yang signifikan, metode yang digunakan untuk menciptakannya menimbulkan pertanyaan serius tentang tanggung jawab lingkungan dan manajemen sumber daya di era krisis iklim.
Referensi: Anthropic destroyed millions of print books to build its AI models