Klon Wikipedia Bertenaga AI Ditutup Setelah Scraping Otomatis Menghabiskan Biaya 70 Dolar AS Dalam Semalam

Tim Komunitas BigGo
Klon Wikipedia Bertenaga AI Ditutup Setelah Scraping Otomatis Menghabiskan Biaya 70 Dolar AS Dalam Semalam

Eksperimen seorang developer untuk menciptakan Wikipedia bertenaga AI yang tak terbatas menghadapi hambatan tak terduga. Proyek yang disebut EndlessWiki ini terpaksa menonaktifkan sementara pembuatan halaman baru setelah lalu lintas otomatis menghabiskan biaya inference sebesar 70 dolar AS dalam satu malam.

Sang kreator membangun EndlessWiki sebagai cara interaktif untuk mengeksplorasi pengetahuan yang terkandung dalam model bahasa besar. Berbeda dengan Wikipedia tradisional, setiap halaman di situs ini dibuat secara on-demand oleh AI ketika pengguna mengklik tautan. Konsep ini terinspirasi dari Library of Babel karya Jorge Luis Borges - ide bahwa model bahasa mengandung rangkaian teks yang luas dan menunggu untuk ditemukan.

Dampak Biaya:

  • Biaya Scraping Semalam: $70 USD
  • Jenis Traffic: Bot otomatis yang mengklik tautan
  • Model Biaya Awal: Akses gratis, tidak perlu sign-in
  • Status Saat Ini: Diaktifkan kembali dengan pembatasan rate

Realitas Mahal dari Layanan AI Publik

Yang dimulai sebagai eksperimen tak berdosa dengan cepat menjadi pelajaran mahal tentang realitas internet. Developer awalnya tidak khawatir tentang biaya, dengan asumsi bahwa klik tautan manual akan menjaga penggunaan tetap wajar. Namun, bot otomatis mulai melakukan scraping pada situs tersebut semalaman, menghasilkan halaman demi halaman dan mendorong biaya inference naik.

Respons komunitas menyoroti masalah yang lebih luas dengan layanan web publik. Banyak developer menunjukkan bahwa lalu lintas bot adalah fakta kehidupan untuk situs web publik mana pun. Mesin pencari, scraper, dan berbagai alat otomatis terus-menerus merayapi web, seringkali tanpa memperhatikan biaya komputasi yang mereka bebankan pada operator situs.

Satu pengamatan yang sangat mengena dari komunitas mencatat ironi situasi tersebut:

Ini adalah akhir yang puitis, mengingat bahwa aktivitas scraping yang sama tanpa memperhatikan biaya bagi operator situs adalah cara model-model ini dilatih sejak awal.

Tantangan Teknis dan Langkah Anti-Cheating

Selain masalah biaya, proyek ini menghadapi tantangan teknis yang menarik. Developer mengimplementasikan sistem anti-cheating untuk mencegah pengguna menavigasi secara manual ke halaman tertentu melalui manipulasi URL. Setiap tautan menyertakan parameter origin yang divalidasi di sisi server untuk memastikan pengguna benar-benar mengikuti struktur tautan yang dibuat AI.

Arsitektur itu sendiri tetap relatif sederhana: database MySQL yang menyimpan halaman yang dibuat dan server Golang yang melayani konten yang ada atau menghasilkan halaman baru menggunakan model Kimi K2 melalui layanan inference Groq . Pilihan model yang lebih besar adalah disengaja, karena model yang lebih besar biasanya mengandung lebih banyak pengetahuan faktual yang cocok untuk konten bergaya ensiklopedia.

Arsitektur Teknis:

  • Backend: Server Golang dengan database MySQL
  • Model AI: Awalnya Kimi K2, kemudian beralih ke GPT-OSS-120B
  • Penyedia Inferensi: Groq (dipilih karena kecepatan dan keandalan)
  • Waktu Respons: Beberapa ratus milidetik untuk pembuatan halaman
  • Anti-kecurangan: Sistem validasi slug asal

Skeptisisme Komunitas dan Kekhawatiran Halusinasi

Respons komunitas mengungkapkan perasaan campur aduk tentang konten ensiklopedia yang dibuat AI. Beberapa pengguna menyatakan kekhawatiran tentang potensi informasi yang dihalusinasi, menggambarkannya sebagai jalan licin menuju neraka halusinasi. Yang lain mempertanyakan apakah menghilangkan kontrol editorial manusia - yang banyak orang anggap sebagai kekuatan Wikipedia - merusak seluruh konsep.

Meskipun ada kekhawatiran ini, beberapa anggota komunitas melihat potensi dalam pendekatan tersebut. Mereka menyarankan bahwa dengan fact-checking yang tepat dan verifikasi kutipan, wiki yang dibuat AI berpotensi mencakup jauh lebih banyak topik daripada versi yang diedit manusia, mungkin menjadi 1000 kali lebih besar dari Wikipedia saat ini.

Masa Depan Eksplorasi Pengetahuan Bertenaga AI

Developer sejak itu telah mengaktifkan kembali layanan dengan pembatasan tingkat dan beralih ke model yang berbeda ( GPT-OSS-120B ) untuk mengelola biaya. Insiden ini menyoroti tantangan berkelanjutan dalam membuat layanan AI dapat diakses publik sambil mengelola biaya operasional.

Proyek ini mewakili bagian dari tren yang lebih luas menuju antarmuka non-chat untuk model bahasa. Daripada interaksi tanya-jawab tradisional, EndlessWiki menawarkan pendekatan yang lebih eksploratif untuk penemuan pengetahuan AI, mirip dengan cara orang secara alami menjelajahi Wikipedia dengan mengikuti tautan yang menarik.

Meskipun masa depan langsung EndlessWiki tetap tidak pasti karena tekanan biaya, eksperimen ini telah memberikan wawasan berharga tentang potensi dan jebakan demokratisasi generasi pengetahuan bertenaga AI.

Referensi: Endless Al-generated Wikipedia