Komunitas developer sedang bereksperimen dengan framework terstruktur untuk membuat AI Claude lebih produktif dalam tugas-tugas coding. Namun, para early adopter menemukan bahwa sistem-sistem ini mungkin tidak memberikan peningkatan yang dijanjikan, memicu perdebatan tentang apakah model AI saat ini sudah siap untuk pendekatan terstruktur semacam ini.
Context Poisoning Muncul sebagai Kekhawatiran Utama
Banyak developer mempertanyakan apakah menambahkan struktur framework yang ekstensif benar-benar membantu atau justru merugikan performa Claude . Masalah utamanya tampaknya adalah context poisoning - ketika terlalu banyak informasi terkait framework memadati detail tugas aktual yang perlu difokuskan oleh Claude .
Beberapa developer melaporkan bahwa definisi endpoint MCP ( Model Context Protocol ) saja dapat mengonsumsi sekitar 20.000 token ruang konteks. Ini meninggalkan ruang yang lebih sedikit untuk kode spesifik dan persyaratan yang dibutuhkan Claude untuk memahami pekerjaan yang sebenarnya.
MCP ( Model Context Protocol ): Sistem yang menghubungkan Claude ke alat eksternal seperti database, browser, dan test runner
Kekhawatiran Penggunaan Konteks:
- Definisi endpoint MCP : ~20.000 token
- Overhead framework mengurangi ruang untuk informasi tugas yang sebenarnya
- Bahasa yang kurang populer ( Ada , Elixir ) menunjukkan hasil yang buruk
- Bias Python / JavaScript dalam data pelatihan mempengaruhi bahasa lain
Hasil Dunia Nyata Menunjukkan Kesuksesan Terbatas
Developer yang menguji framework ini di lingkungan produksi melaporkan hasil yang beragam. Meskipun beberapa melihat peningkatan dalam proyek greenfield (codebase baru), hasilnya menjadi kurang dapat diandalkan ketika bekerja dengan software enterprise yang sudah ada atau bahasa pemrograman yang kurang populer.
Seorang developer yang bekerja dengan codebase Elixir besar mencatat bahwa Claude berkinerja jauh lebih baik pada fitur-fitur baru dibandingkan dengan tugas refactoring yang kompleks. Namun, mereka menemukan kesuksesan dengan membuat dokumentasi teknis yang detail dan menggunakan agen code review khusus untuk mempertahankan standar kualitas.
Masalah bias bahasa sangat mencolok. Developer yang bekerja dengan bahasa seperti Ada , Elixir , atau teknologi lain yang kurang umum melaporkan bahwa Claude sering menghasilkan sintaks yang valid tetapi benar-benar melewatkan persyaratan aktual atau mengikuti pola yang salah.
Laporan Pengalaman Developer:
- Hasil yang lebih baik pada proyek greenfield dibandingkan brownfield
- Codebase enterprise (500K+ SLOC) menunjukkan kesuksesan yang beragam
- Paket harga tetap ($200 USD Max plan) membantu mengontrol biaya inferensi
- Pemantauan ketat masih diperlukan - AI bekerja sebagai "intern pintar" daripada developer otonom
Kompleksitas Framework vs. Pendekatan Sederhana
Lanskap saat ini mencakup puluhan framework open-source dengan nama seperti BMAD-METHOD , Agent OS , dan Symphony . Masing-masing menjanjikan untuk menyelesaikan koordinasi antara beberapa agen AI, mengelola konteks dengan lebih baik, atau menyediakan alur kerja terstruktur.
Namun, beberapa developer berpengalaman berargumen untuk pendekatan yang lebih sederhana. Daripada sistem multi-agen yang kompleks, mereka menyarankan untuk fokus pada konteks yang tepat dan minimal yang langsung menangani tugas yang ada.
Saya akan berargumen bahwa kita membutuhkan lebih sedikit context poisoning dengan informasi yang tidak berguna. Berikan model informasi yang paling tepat untuk pekerjaan aktual yang harus dilakukan dan iterasi berdasarkan itu.
Proyek Greenfield: Proyek pengembangan software yang dimulai dari nol tanpa batasan kode yang sudah ada
Kategori Framework Utama:
- Manajemen Tugas: Backlog Markdown , spesifikasi teks terstruktur, tiket GitHub Issues / Jira
- Koordinasi Agen: Simulasi peran ( PM , arsitek, developer, tester), paralelisme swarm, artefak repo-native
- Manajemen Sesi: Orkestrasi terminal, worktree paralel, kontainer terisolasi
- Integrasi Tool: Server MCP , skrip shell kustom, aksessor database, hook pengujian
Pertanyaan Otonomi Tetap Tidak Terjawab
Tantangan utama adalah menentukan tingkat otonomi yang tepat untuk asisten coding AI. Sebagian besar developer masih mendapati diri mereka memantau dengan ketat pekerjaan Claude dan sering melakukan intervensi ketika ia keluar jalur. Ini menunjukkan bahwa model saat ini bekerja lebih baik sebagai intern yang cerdas daripada anggota tim yang independen.
Framework mencoba mengatasi ini dengan menambahkan lebih banyak struktur, peran, dan langkah validasi. Tetapi kompleksitas tambahan ini mungkin bekerja melawan pelatihan model daripada bersamanya.
Melihat ke Depan
Perdebatan ini mencerminkan pertanyaan yang lebih luas tentang alat pengembangan AI: haruskah kita membangun sistem yang rumit di sekitar keterbatasan AI saat ini, atau fokus pada pendekatan yang lebih sederhana yang bekerja dengan cara model-model ini benar-benar berfungsi?
Saat model yang lebih baru seperti Claude 4 menunjukkan peningkatan, beberapa developer melaporkan hasil yang lebih baik dengan framework yang sama. Ini menunjukkan bahwa masalahnya mungkin sebagian tentang kemampuan model daripada desain framework saja.
Konsensus komunitas tampaknya muncul di sekitar jalan tengah - menggunakan beberapa struktur untuk memandu perilaku AI sambil menghindari kompleksitas berlebihan yang mengacaukan jendela konteks. Pendekatan yang paling sukses tampaknya menggabungkan definisi tugas yang jelas dengan guardrail yang minimal tetapi efektif.
Referensi: Claude Code Framework Wars