Claude 4 Sonnet Mengungguli GPT-5 dalam Benchmark Coding Internal Microsoft
Pembelajaran Mesin
1 minggu yang lalu
Claude 4 Sonnet Mengungguli GPT-5 dalam Benchmark Coding Internal Microsoft
Riset OpenAI Mengungkap Mengapa Model Bahasa Berhalusinasi dan Mengusulkan Solusi
Pemrosesan Bahasa Alami
1 minggu yang lalu
Riset OpenAI Mengungkap Mengapa Model Bahasa Berhalusinasi dan Mengusulkan Solusi
Matematika SMA Sudah Cukup untuk Memahami Cara Kerja LLM, Klaim Developer
Pembelajaran Mesin
2 minggu yang lalu
Matematika SMA Sudah Cukup untuk Memahami Cara Kerja LLM, Klaim Developer
SpaCy Menghadapi Tantangan Baru saat Developer Memperdebatkan Masa Depan NLP Tradisional Melawan LLM
Pemrosesan Bahasa Alami
3 minggu yang lalu
SpaCy Menghadapi Tantangan Baru saat Developer Memperdebatkan Masa Depan NLP Tradisional Melawan LLM
Komunitas Riset AI Memperdebatkan Kualitas Konten yang Dihasilkan LLM saat Metode DeepConf Menunjukkan Harapan
Pemrosesan Bahasa Alami
4 minggu yang lalu
Komunitas Riset AI Memperdebatkan Kualitas Konten yang Dihasilkan LLM saat Metode DeepConf Menunjukkan Harapan
Model AI Unggul dalam Matematika Olimpiade tetapi Gagal dalam Aritmatika Dasar dan Tic-Tac-Toe
Pemrosesan Bahasa Alami
1 bulan yang lalu
Model AI Unggul dalam Matematika Olimpiade tetapi Gagal dalam Aritmatika Dasar dan Tic-Tac-Toe
Komunitas Teknologi Memperdebatkan Apakah LLM Benar-Benar "Memahami" atau Hanya Meniru Kecerdasan Melalui Pencocokan Pola
Pemrosesan Bahasa Alami
1 bulan yang lalu
Komunitas Teknologi Memperdebatkan Apakah LLM Benar-Benar "Memahami" atau Hanya Meniru Kecerdasan Melalui Pencocokan Pola
Peneliti AI Berselisih Mengenai Apakah Penalaran Chain-of-Thought Itu Nyata atau Hanya Pencocokan Pola
Pembelajaran Mesin
1 bulan yang lalu
Peneliti AI Berselisih Mengenai Apakah Penalaran Chain-of-Thought Itu Nyata atau Hanya Pencocokan Pola
Perdebatan Determinisme LLM: Mengapa Reproduktibilitas Sempurna Tetap Sulit Dicapai Meskipun Menggunakan Pengaturan Suhu Nol
Pemrosesan Bahasa Alami
1 bulan yang lalu
Perdebatan Determinisme LLM: Mengapa Reproduktibilitas Sempurna Tetap Sulit Dicapai Meskipun Menggunakan Pengaturan Suhu Nol
GPT-5 Menunjukkan Kemajuan Besar pada Pertanyaan Tantangan ChatGPT Asli dari Knuth
Pemrosesan Bahasa Alami
1 bulan yang lalu
GPT-5 Menunjukkan Kemajuan Besar pada Pertanyaan Tantangan ChatGPT Asli dari Knuth
Attention Sinks: Mekanisme Tersembunyi yang Mencegah Model Bahasa dari Keruntuhan
Pemrosesan Bahasa Alami
1 bulan yang lalu
Attention Sinks: Mekanisme Tersembunyi yang Mencegah Model Bahasa dari Keruntuhan
Model Bahasa Kecil yang Disetel Halus Tantang Raksasa dengan Pengurangan Biaya 5-30 Kali Lipat
Pemrosesan Bahasa Alami
1 bulan yang lalu
Model Bahasa Kecil yang Disetel Halus Tantang Raksasa dengan Pengurangan Biaya 5-30 Kali Lipat
LLM Menunjukkan Performa Buruk dalam Benchmark Identifikasi Font, Memunculkan Pertanyaan tentang Kemampuan Model
Pemrosesan Bahasa Alami
1 bulan yang lalu
LLM Menunjukkan Performa Buruk dalam Benchmark Identifikasi Font, Memunculkan Pertanyaan tentang Kemampuan Model