NVIDIA telah memperkenalkan Tilus, sebuah bahasa pemrograman kernel GPU tingkat tile baru yang menjanjikan penyederhanaan pemrograman GPU dengan granularitas tingkat thread-block dan kontrol memori eksplisit. Namun, peluncuran ini telah memicu diskusi sengit di komunitas developer tentang motivasi strategis NVIDIA dan pertempuran berkelanjutan untuk dominasi ekosistem pemrograman GPU.
Fitur Utama Tilus:
- Granularitas tingkat thread-block dengan tensor sebagai tipe data utama
- Kontrol eksplisit atas shared memory dan register tensor
- Tipe presisi rendah dengan bit-width arbitrer (1 hingga 8 bit)
- Kemampuan tuning dan caching otomatis
- Antarmuka Pythonic untuk kemudahan penggunaan
Respons Strategis Terhadap Ancaman Cross-Platform Triton
Waktu dan desain Tilus tampaknya merupakan respons langsung NVIDIA terhadap popularitas Triton yang terus meningkat, bahasa pemrograman GPU dari OpenAI yang mendukung hardware NVIDIA dan AMD. Para pengamat komunitas mencatat bahwa dorongan terbaru NVIDIA untuk tools pengembangan yang mengutamakan Python, termasuk CUDA Python tingkat rendah dan Tilus tingkat tinggi, merupakan upaya terkalkulasi untuk mencegah developer bermigrasi ke alternatif cross-platform.
Kekhawatiran ini berpusat pada lock-in ekosistem. Jika developer mengadopsi Triton untuk kemampuan cross-platform-nya, keunggulan kompetitif NVIDIA akan melemah secara signifikan. Tilus menawarkan konsep pemrograman berbasis tile yang serupa dengan Triton namun tetap terikat pada ekosistem NVIDIA, berpotensi menjaga developer tetap berada dalam lingkup pengaruh NVIDIA.
Perjuangan Berkelanjutan AMD dan Intel
Diskusi ini mengungkapkan frustrasi mendalam terhadap ketidakmampuan AMD dan Intel untuk menantang dominasi NVIDIA meskipun telah memiliki waktu bertahun-tahun untuk mengembangkan alternatif yang kompetitif. ROCm dari AMD dan SYCL dari Intel, meskipun bersifat open-source, secara paradoks menawarkan pengalaman instalasi dan dukungan hardware yang lebih buruk dibandingkan toolkit CUDA proprietary dari NVIDIA.
AMD telah memiliki waktu untuk mengejar ketertinggalan--satu dekade bahkan. Mereka tidak memahami: dukungan software yang robust memerlukan investasi signifikan dari pihak mereka.
Komunitas menunjuk pada kesalahpahaman fundamental tentang apa yang membuat CUDA sukses. Bukan hanya bahasa pemrograman atau performa - tetapi ekosistem lengkap termasuk library ekstensif, integrasi IDE, debugger grafis, dan dukungan polyglot yang diandalkan peneliti dan developer setiap hari.
Posisi Teknis dan Realitas Pasar
Tilus membedakan dirinya dari pemrograman GPU tradisional dengan beroperasi pada tingkat workgroup daripada tingkat thread individual. Pendekatan ini memungkinkan developer bekerja dengan nilai vektor dan matriks besar sementara compiler menangani distribusi di seluruh sumber daya hardware. Bahasa ini juga mendukung tipe presisi rendah arbitrer dari 1 hingga 8 bit, menargetkan permintaan yang terus meningkat untuk inferensi AI yang efisien.
Namun, pertanyaan tetap ada tentang hubungan Tilus dengan proyek internal NVIDIA seperti cuTile dan Warp. Sifat terfragmentasi dari upaya penelitian NVIDIA menunjukkan bahwa tools ini mungkin tidak mewakili strategi terkoordinasi tetapi lebih merupakan inisiatif tim independen yang kemudian diintegrasikan ke dalam ekosistem yang lebih luas.
Penyedia Cloud sebagai Pengubah Permainan Potensial
Subplot menarik dalam diskusi ini melibatkan penyedia cloud besar yang mengembangkan akselerator AI mereka sendiri. TPU dari Google, chip Inferentia dan Trainium dari AWS, dan upaya serupa dari raksasa cloud lainnya mewakili tantangan paling kredibel terhadap dominasi NVIDIA. Perusahaan-perusahaan ini memiliki sumber daya dan motivasi untuk membebaskan diri dari kekuatan penetapan harga NVIDIA.
Pengembangan OpenXLA, yang didukung oleh pemain besar termasuk Alibaba, Amazon, AMD, Apple, Google, Intel, Meta, dan bahkan NVIDIA sendiri, menunjukkan upaya terkoordinasi untuk mengkomoditisasi lapisan akselerasi GPU. Ini pada akhirnya bisa terbukti lebih mengancam lock-in NVIDIA daripada alternatif bahasa pemrograman tunggal mana pun.
Ekosistem Pemrograman GPU yang Bersaing:
- NVIDIA: CUDA, CUDA Python, Tilus, cuTile, Warp
- Lintas platform: Triton ( OpenAI ), SYCL, OpenXLA
- AMD: ROCm (sumber terbuka tetapi dukungan perangkat keras terbatas)
- Penyedia Cloud: Google TPUs, AWS Inferentia/Trainium, akselerator khusus
Melihat ke Depan
Peluncuran Tilus menyoroti ketegangan berkelanjutan antara inovasi dan kontrol pasar dalam ruang komputasi GPU. Sementara NVIDIA terus mendorong batas-batas kemungkinan dengan pemrograman GPU, komunitas tetap terbagi tentang apakah kemajuan ini melayani kepentingan developer atau terutama melindungi posisi pasar NVIDIA. Ujian utama akan menjadi apakah Tilus mendapat adopsi genuine berdasarkan merit teknisnya atau tetap menjadi alat lain dalam arsenal defensif NVIDIA melawan alternatif cross-platform.
Referensi: Tilus: A Tile-Level GPU Kernel Programming Language