Developer Membangun "Pabrik AI" Menggunakan Beberapa Model Claude untuk Menghasilkan dan Memverifikasi Kode Secara Otomatis

Tim Komunitas BigGo
Developer Membangun "Pabrik AI" Menggunakan Beberapa Model Claude untuk Menghasilkan dan Memverifikasi Kode Secara Otomatis

Semakin banyak developer yang bereksperimen dengan alur kerja AI canggih yang menggunakan beberapa model bahasa yang bekerja sama untuk merencanakan, menulis, dan memverifikasi kode secara otomatis. Pendekatan ini, yang dijuluki pabrik AI, menandai pergeseran dari bantuan AI sederhana menjadi pipeline pengembangan otomatis yang kompleks.

Pendekatan Pabrik: Beberapa Model, Peran Khusus

Konsep inti melibatkan penugasan peran spesifik kepada model AI yang berbeda dalam proses pengembangan. Setup seorang developer menggunakan model o3 Claude untuk perencanaan, Sonnet 4 untuk eksekusi, dan kedua model untuk verifikasi. Setiap model berjalan dalam git worktree terpisah, memungkinkan beberapa fitur dikembangkan secara bersamaan tanpa gangguan.

Alur kerja mengikuti proses tiga langkah: pertama, o3 menghasilkan rencana implementasi detail berdasarkan persyaratan tingkat tinggi. Selanjutnya, model eksekusi menulis kode aktual mengikuti rencana ini, membuat commit di setiap langkah untuk rollback yang mudah. Terakhir, model verifikasi memeriksa output terhadap persyaratan asli, dengan masalah apa pun diumpankan kembali ke template perencanaan daripada diperbaiki secara manual.

Git worktrees: Fitur Git yang memungkinkan beberapa direktori kerja dari repositori yang sama, memungkinkan pengembangan paralel pada branch yang berbeda.

Komponen Alur Kerja AI Factory:

  • Model Perencanaan: Claude o3 untuk menghasilkan rencana implementasi dan mengajukan pertanyaan klarifikasi
  • Model Eksekusi: Sonnet 3.7 atau Sonnet 4 untuk menulis kode berdasarkan rencana
  • Model Verifikasi: Sonnet 4 dan o3 untuk memeriksa kode terhadap persyaratan asli
  • Infrastruktur: Git worktrees untuk pengembangan paralel, MCP ( Model Context Protocol ) untuk integrasi alat

Perbaiki Input, Bukan Output: Filosofi Pengembangan Baru

Pergeseran paling signifikan dalam pendekatan ini adalah prinsip tidak pernah mengedit kode yang dihasilkan secara manual. Ketika ada yang salah, developer menyesuaikan prompt, rencana, atau pemilihan model alih-alih menambal output secara langsung. Ini menciptakan sistem yang meningkatkan diri sendiri di mana pelajaran yang dipetik dari kegagalan secara otomatis meningkatkan generasi kode di masa depan.

Diskusi komunitas mengungkapkan pengalaman yang beragam dengan metodologi ini. Beberapa developer melaporkan kesuksesan dengan proyek pribadi dan codebase yang lebih kecil, sementara yang lain kesulitan dengan konsistensi di beberapa agen yang bekerja pada proyek yang sama. Tantangan menjadi sangat jelas dalam sistem produksi yang lebih besar di mana agen AI yang berbeda mungkin memiliki ide arsitektur yang bertentangan.

Keterbatasan Utama yang Diidentifikasi oleh Komunitas:

  • Masalah Konsistensi: Beberapa agen menciptakan keputusan arsitektur yang saling bertentangan
  • Pengelolaan Konteks: File instruksi dapat berkembang hingga ribuan baris, menghabiskan jendela konteks
  • Kesiapan Produksi: Kesulitan dengan debugging kompleks dan integrasi kode warisan
  • Keahlian Domain: Efektivitas terbatas untuk masalah baru yang tidak ada dalam data pelatihan

Kekhawatiran Biaya dan Skalabilitas

Aspek finansial menjalankan beberapa model AI secara bersamaan telah memicu perdebatan yang cukup besar. Sementara beberapa developer melaporkan menghabiskan kurang dari 1 dolar Amerika untuk konsultasi model sekunder melalui layanan seperti OpenRouter, yang lain dengan langganan Claude Max 200 dolar Amerika menemukan diri mereka dengan cepat menghabiskan batas harian saat menjalankan agen paralel.

Pertanyaan skalabilitas meluas melampaui biaya hingga kualitas kode. Beberapa developer berpengalaman mencatat bahwa sementara pabrik AI bekerja dengan baik untuk tugas rutin dan proyek greenfield, mereka kesulitan dengan debugging kompleks, integrasi kode warisan, dan masalah khusus domain yang memerlukan keahlian teknis mendalam.

Perbandingan Biaya untuk Pengembangan AI:

  • Langganan Claude Max : $200 USD/bulan dengan batas penggunaan tinggi
  • Langganan Claude Pro : $20 USD/bulan dengan batas yang lebih ketat
  • API OpenRouter : ~$0.50 USD penggunaan dari kredit $10 USD untuk konsultasi model sekunder
  • Biaya API tradisional: 10x lebih mahal dibandingkan langganan Claude Code untuk penggunaan yang setara

Aplikasi Dunia Nyata dan Keterbatasan

Pengguna awal menemukan kesuksesan dalam kasus penggunaan spesifik. Pendekatan ini menunjukkan janji untuk menghasilkan kode boilerplate, integrasi API, dan dokumentasi. Namun, umpan balik komunitas menunjukkan keterbatasan signifikan ketika berhadapan dengan sistem produksi kompleks, skenario debugging rumit, atau tantangan teknis baru yang tidak terwakili dengan baik dalam data pelatihan.

Sebagian besar hari-hari saya dalam clojure saya cenderung menggunakan sonnet 4 untuk mendapatkan tanda kurung yang benar.

Teknologi ini tampak paling efektif untuk developer yang dapat memberikan panduan arsitektur yang kuat sambil membiarkan AI menangani detail implementasi. Ini menunjukkan bahwa daripada menggantikan programmer, pabrik AI ini mungkin membentuk kembali peran menuju desain sistem tingkat tinggi dan jaminan kualitas.

Perdebatan berlanjut tentang apakah ini mewakili pergeseran fundamental dalam pengembangan perangkat lunak atau hanya evolusi dari alat coding berbantuan AI yang ada. Yang jelas adalah bahwa developer secara aktif bereksperimen dengan alur kerja AI yang semakin canggih, mendorong batas-batas dari apa yang mungkin dengan model bahasa saat ini.

Referensi: Building a Personal AI Factory (July 2025 snapshot)