HelixDB Meluncurkan Database Graf-Vektor Baru dengan Klaim Performa 1000x Lebih Baik dari Neo4j

BigGo Editorial Team
HelixDB Meluncurkan Database Graf-Vektor Baru dengan Klaim Performa 1000x Lebih Baik dari Neo4j

Lanskap database open-source memiliki pesaing baru dengan peluncuran HelixDB, sebuah database graf-vektor yang ditulis dalam bahasa Rust yang dirancang khusus untuk RAG (Retrieval Augmented Generation) dan aplikasi AI. Yang menarik perhatian komunitas adalah klaim performa yang berani dan pendekatannya yang unik dalam menggabungkan fungsionalitas graf dan vektor.

Halaman GitHub untuk HelixDB ini menampilkan strukturnya sebagai database graf-vektor open-source untuk aplikasi AI
Halaman GitHub untuk HelixDB ini menampilkan strukturnya sebagai database graf-vektor open-source untuk aplikasi AI

Klaim Performa Menimbulkan Pertanyaan

Para pengembang HelixDB mengklaim database mereka 1000x lebih cepat daripada Neo4j dan 100x lebih cepat daripada TigerGraph sambil setara dengan Qdrant untuk vektor. Pernyataan ini mendorong anggota komunitas untuk meminta bukti, dengan satu pengguna secara langsung meminta tolok ukur untuk mendukung klaim tersebut. Tim HelixDB mengakui mereka telah menjalankan tolok ukur ini tetapi belum mempublikasikannya sebelum mengumumkan proyek tersebut, dan berjanji untuk menambahkan data performa terperinci ke dokumentasi mereka.

Fitur Utama HelixDB

  • Cepat & Efisien: Mengklaim 1000x lebih cepat dari Neo4j, 100x lebih cepat dari TigerGraph, dan setara dengan Qdrant untuk vektor
  • RAG-First: Dukungan native untuk tipe data graf dan vektor
  • Integrasi Graf-Vektor: Mendukung hubungan antara node, vektor, atau node DAN vektor
  • Penyimpanan: Didukung oleh LMDB (Lightning Memory-Mapped Database)
  • ACID Compliant: Menjamin integritas dan konsistensi data
  • Dimensi Vektor: Saat ini tidak ada batasan, batas di masa depan kemungkinan sekitar 64.000 dimensi
  • Bahasa Kueri: DSL khusus dengan keamanan tipe
  • Lisensi: AGPL (Affero General Public License)

Kemampuan Vektor dan Dimensi

Database ini tampaknya memiliki dukungan vektor yang kuat, dengan pengembang mengonfirmasi saat ini tidak ada batasan pada dimensi vektor. Mereka menyebutkan kemungkinan akan menerapkan batasan sekitar 64.000 dimensi di masa depan, mirip dengan database vektor lain seperti Qdrant dan Pinecone. Tim juga mengungkapkan rencana untuk menerapkan kuantisasi biner dalam beberapa bulan mendatang untuk meningkatkan performa dengan vektor berdimensi lebih tinggi, menunjukkan kesadaran tentang pertukaran performa yang terlibat dalam operasi vektor.

Integrasi Graf-Vektor Menjadikannya Berbeda

Yang membedakan HelixDB dari pesaing seperti KuzuDB adalah pendekatannya dalam mengintegrasikan fungsionalitas graf dan vektor. Menurut para pengembang, HelixDB mendukung pengindeksan inkremental pada vektor, memungkinkan pembaruan tanpa memerlukan pengindeksan ulang lengkap dari semua vektor. Ini mengatasi titik kesulitan dengan beberapa solusi yang ada di mana indeks vektor sepenuhnya terpisah dari struktur graf, yang memerlukan pengindeksan ulang penuh ketika pembaruan terjadi.

Kurang lebih sama seperti yang Anda lakukan dengan database graf lainnya, dengan manfaat tambahan dapat memperlakukan vektor sebagai node dengan membuat hubungan eksplisit di antara mereka.

Bahasa Kueri Kustom Memicu Diskusi

Bahasa kueri kustom HelixDB telah menghasilkan reaksi beragam. Beberapa pengguna menyatakan kekhawatiran tentang harus mempelajari bahasa domain-spesifik (DSL) baru, terutama mengenai kemampuan untuk menggunakannya dengan LLM untuk pembuatan kueri. Para pengembang membela pilihan ini, menjelaskan bahwa tidak ada bahasa yang ada yang secara tepat mencakup fungsionalitas graf dan vektor, dan mereka ingin membuat bahasa kueri yang type-safe. Mereka menyebutkan bahwa mereka sedang mengintegrasikan tata bahasa mereka ke dalam kode LLaMa CPP untuk memastikan LLM dapat menghasilkan kueri yang benar secara tata bahasa dalam bahasa mereka.

Kompatibilitas Browser dan Penggunaan Embedded

Beberapa pengguna menanyakan tentang menjalankan HelixDB di browser melalui WebAssembly (WASM) untuk aplikasi yang berfokus pada privasi dan tentang menggunakannya sebagai database embedded mirip dengan SQLite. Tim mengakui bahwa LMDB, mesin penyimpanan mereka saat ini, adalah hambatan untuk kompatibilitas browser, tetapi menyebutkan mereka memiliki rencana untuk mengembangkan mesin penyimpanan mereka sendiri dengan dukungan WASM. Untuk saat ini, HelixDB tidak dapat berjalan sebagai database embedded, yang membatasi beberapa kasus penggunaan potensial.

Item Peta Jalan

  • Memperluas kemampuan tipe data vektor untuk aplikasi RAG
  • Meningkatkan bahasa kueri dengan pemeriksaan tipe yang lebih kuat
  • Mengimplementasikan rangkaian pengujian untuk pengujian kueri end-to-end
  • Membangun mesin pengujian simulasi deterministik
  • Menambahkan kuantisasi biner untuk performa yang lebih baik
  • Mengimplementasikan BM25 untuk pencarian sparse
  • Mengembangkan mesin penyimpanan grafik-vektor internal (untuk menggantikan LMDB)
  • Membuat protokol jaringan & pustaka serialisasi internal

Pengembangan Masa Depan dan Roadmap

Tim HelixDB telah menguraikan beberapa fitur mendatang, termasuk pencarian sparse menggunakan BM25, dengan beberapa anggota komunitas menyarankan pertimbangan model SPLADE untuk kemampuan pencarian yang ditingkatkan. Roadmap mereka juga mencakup memperluas kemampuan vektor, meningkatkan bahasa kueri, menerapkan suite pengujian, membangun mesin pengujian simulasi deterministik, dan akhirnya mengembangkan mesin penyimpanan graf-vektor mereka sendiri untuk menggantikan LMDB.

Saat HelixDB memasuki ruang database vektor dan graf yang semakin kompetitif, klaim performa dan pendekatan uniknya dalam menggabungkan fungsionalitas ini telah menarik perhatian. Komunitas tampaknya optimis dengan hati-hati, dengan banyak yang menyatakan minat untuk mencoba database ini dan memberikan umpan balik. Bagaimana HelixDB akan membedakan dirinya dalam jangka panjang dari pemain mapan dan pendatang baru lainnya masih harus dilihat, tetapi fokusnya pada pengalaman pengembang dan performa untuk aplikasi AI tampaknya mendapat sambutan dari pengguna potensial.

Referensi: HelixDB/helix-db