LLM Diam-diam Memecahkan Teka-teki Level Karakter, Memicu Debat tentang Kecerdasan Sejati
Pemrosesan Bahasa Alami
3 minggu yang lalu
LLM Diam-diam Memecahkan Teka-teki Level Karakter, Memicu Debat tentang Kecerdasan Sejati
Model Kecil 7 Juta Parameter Diklaim Mengungguli Large Language Model dalam Tugas Penalaran Kompleks
Pemrosesan Bahasa Alami
1 bulan yang lalu
Model Kecil 7 Juta Parameter Diklaim Mengungguli Large Language Model dalam Tugas Penalaran Kompleks
Claude 4 Sonnet Mengungguli GPT-5 dalam Benchmark Coding Internal Microsoft
Pembelajaran Mesin
1 bulan yang lalu
Claude 4 Sonnet Mengungguli GPT-5 dalam Benchmark Coding Internal Microsoft
Riset OpenAI Mengungkap Mengapa Model Bahasa Berhalusinasi dan Mengusulkan Solusi
Pemrosesan Bahasa Alami
1 bulan yang lalu
Riset OpenAI Mengungkap Mengapa Model Bahasa Berhalusinasi dan Mengusulkan Solusi
Matematika SMA Sudah Cukup untuk Memahami Cara Kerja LLM, Klaim Developer
Pembelajaran Mesin
2025-09-07
Matematika SMA Sudah Cukup untuk Memahami Cara Kerja LLM, Klaim Developer
SpaCy Menghadapi Tantangan Baru saat Developer Memperdebatkan Masa Depan NLP Tradisional Melawan LLM
Pemrosesan Bahasa Alami
2025-08-27
SpaCy Menghadapi Tantangan Baru saat Developer Memperdebatkan Masa Depan NLP Tradisional Melawan LLM
Komunitas Riset AI Memperdebatkan Kualitas Konten yang Dihasilkan LLM saat Metode DeepConf Menunjukkan Harapan
Pemrosesan Bahasa Alami
2025-08-25
Komunitas Riset AI Memperdebatkan Kualitas Konten yang Dihasilkan LLM saat Metode DeepConf Menunjukkan Harapan
Model AI Unggul dalam Matematika Olimpiade tetapi Gagal dalam Aritmatika Dasar dan Tic-Tac-Toe
Pemrosesan Bahasa Alami
2025-08-16
Model AI Unggul dalam Matematika Olimpiade tetapi Gagal dalam Aritmatika Dasar dan Tic-Tac-Toe
Komunitas Teknologi Memperdebatkan Apakah LLM Benar-Benar "Memahami" atau Hanya Meniru Kecerdasan Melalui Pencocokan Pola
Pemrosesan Bahasa Alami
2025-08-15
Komunitas Teknologi Memperdebatkan Apakah LLM Benar-Benar "Memahami" atau Hanya Meniru Kecerdasan Melalui Pencocokan Pola
Peneliti AI Berselisih Mengenai Apakah Penalaran Chain-of-Thought Itu Nyata atau Hanya Pencocokan Pola
Pembelajaran Mesin
2025-08-14
Peneliti AI Berselisih Mengenai Apakah Penalaran Chain-of-Thought Itu Nyata atau Hanya Pencocokan Pola
Perdebatan Determinisme LLM: Mengapa Reproduktibilitas Sempurna Tetap Sulit Dicapai Meskipun Menggunakan Pengaturan Suhu Nol
Pemrosesan Bahasa Alami
2025-08-13
Perdebatan Determinisme LLM: Mengapa Reproduktibilitas Sempurna Tetap Sulit Dicapai Meskipun Menggunakan Pengaturan Suhu Nol
GPT-5 Menunjukkan Kemajuan Besar pada Pertanyaan Tantangan ChatGPT Asli dari Knuth
Pemrosesan Bahasa Alami
2025-08-10
GPT-5 Menunjukkan Kemajuan Besar pada Pertanyaan Tantangan ChatGPT Asli dari Knuth
Attention Sinks: Mekanisme Tersembunyi yang Mencegah Model Bahasa dari Keruntuhan
Pemrosesan Bahasa Alami
2025-08-08
Attention Sinks: Mekanisme Tersembunyi yang Mencegah Model Bahasa dari Keruntuhan
Model Bahasa Kecil yang Disetel Halus Tantang Raksasa dengan Pengurangan Biaya 5-30 Kali Lipat
Pemrosesan Bahasa Alami
2025-08-06
Model Bahasa Kecil yang Disetel Halus Tantang Raksasa dengan Pengurangan Biaya 5-30 Kali Lipat
LLM Menunjukkan Performa Buruk dalam Benchmark Identifikasi Font, Memunculkan Pertanyaan tentang Kemampuan Model
Pemrosesan Bahasa Alami
2025-08-04
LLM Menunjukkan Performa Buruk dalam Benchmark Identifikasi Font, Memunculkan Pertanyaan tentang Kemampuan Model