Psikologi telah menghadapi kenyataan pahit dalam beberapa tahun terakhir. Banyak temuan paling terkenal di bidang ini - dari power posing hingga marshmallow test - telah runtuh di bawah pengawasan ilmiah. Ketika peneliti mencoba mengulangi eksperimen terkenal ini, mereka tidak bisa mendapatkan hasil yang sama. Hal ini telah memicu perdebatan sengit tentang keandalan penelitian psikologi dan dampaknya terhadap masyarakat.
Masalahnya lebih dalam dari sekadar beberapa studi yang buruk. Diskusi komunitas mengungkapkan bahwa psikologi telah berjuang dengan praktik statistik yang buruk selama puluhan tahun. Bidang ini telah mengembangkan budaya di mana peneliti memanipulasi data untuk mendapatkan hasil yang dapat dipublikasikan, praktik yang dikenal sebagai p-hacking. Ini tidak selalu karena kurangnya keterampilan, tetapi lebih kepada kebiasaan yang mengakar yang memprioritaskan publikasi daripada mendapatkan hasil yang akurat.
Masalah Statistik yang Mendalam
Inti masalahnya terletak pada bagaimana penelitian psikologi dilakukan dan dianalisis. Tidak seperti eksperimen teknik yang terkontrol dengan pengukuran yang tepat, psikologi berurusan dengan perilaku manusia - sesuatu yang jauh lebih kompleks dan bervariasi. Orang mengubah tindakan mereka berdasarkan konteks dan apa yang mereka pikir sedang diukur oleh peneliti. Hal ini membuat sangat sulit untuk merancang eksperimen yang benar-benar valid, bahkan untuk ilmuwan berpengalaman.
Metode statistik yang umum diajarkan dan digunakan di departemen psikologi sering mendorong masalah-masalah ini. Peneliti mempelajari teknik yang memudahkan untuk menemukan pola dalam data, bahkan ketika pola tersebut mungkin hanya noise acak. Tekanan untuk mempublikasikan temuan baru yang menarik daripada mereplikasi karya yang sudah ada telah menciptakan sistem di mana hasil yang mencolok tetapi tidak dapat diandalkan mendapat lebih banyak perhatian daripada sains yang solid dan dapat direproduksi.
Kegagalan Terkenal di Berbagai Bidang
Daftar replikasi yang gagal mencakup hampir setiap area psikologi. Psikologi sosial telah terpukul sangat keras, dengan tingkat replikasi serendah 37%. Studi yang mengklaim bahwa memikirkan uang membuat orang menjadi egois, atau bahwa paparan kata-kata terkait lansia membuat orang berjalan lebih lambat, semuanya gagal bertahan di bawah pemeriksaan yang lebih ketat.
Bahkan studi yang tampaknya memiliki aplikasi praktis telah runtuh. Teori ego depletion, yang menyarankan bahwa kemauan bekerja seperti baterai yang terkuras sepanjang hari, tidak dapat direproduksi dalam upaya replikasi skala besar. Demikian pula, intervensi berdasarkan teori growth mindset - mengajarkan siswa bahwa kecerdasan dapat ditingkatkan melalui usaha - telah menunjukkan hasil yang beragam.
Berdasarkan pengalaman singkat saya melakukan pekerjaan data dalam penelitian psikologi, di antara banyak masalah lainnya mereka SANGAT BURUK dalam statistik. Dan ini bukan masalah keterampilan sebanyak masalah budaya.
Tingkat Replikasi berdasarkan Bidang Psikologi:
- Psikologi Sosial: 37%
- Psikologi Kognitif: 42%
- Psikologi Klinis: 44%
- Psikologi Kepribadian: 55%
Konsekuensi di Dunia Nyata
Replikasi yang gagal ini bukan hanya keingintahuan akademis - mereka telah memengaruhi kebijakan dan keputusan nyata. Penelitian stereotype threat, yang mengklaim bahwa mengingatkan wanita tentang stereotip negatif merusak kinerja matematika mereka, digunakan untuk membenarkan berbagai intervensi pendidikan. Ketika studi seperti itu gagal direplikasi, hal ini menimbulkan pertanyaan tentang kebijakan yang dibangun di atas fondasi ilmiah yang goyah.
Dunia bisnis juga telah terpengaruh. Perusahaan menghabiskan uang untuk program pelatihan berdasarkan penelitian power posing, percaya bahwa posisi tubuh tertentu dapat meningkatkan kepercayaan diri dan kinerja. Departemen SDM berinvestasi dalam tes kepribadian dan alat lain berdasarkan teori psikologi yang mungkin tidak dapat diandalkan.
Replikasi yang Gagal dan Terkenal:
- Efek Ego Depletion - Kekuatan kehendak sebagai sumber daya yang dapat habis ( Baumeister et al. 1998 )
- Power Posing - Postur tubuh memengaruhi hormon dan kepercayaan diri ( Carney, Cuddy & Yap 2010 )
- Tes Marshmallow - Kontrol diri masa kanak-kanak memprediksi hasil hidup ( Shoda, Mischel, & Peake 1990 )
- Efek Mozart - Musik klasik sementara meningkatkan kecerdasan ( Rauscher, Shaw, & Ky 1993 )
- Stereotype Threat - Stereotip negatif mengganggu kinerja ( Spencer, Steele, & Quinn 1999 )
Jalan ke Depan
Meskipun ada masalah-masalah ini, komunitas psikologi telah mulai menangani krisis replikasi dengan serius. Banyak peneliti sekarang melakukan pra-registrasi studi mereka, yang berarti mereka berkomitmen pada metode dan analisis tertentu sebelum mengumpulkan data. Hal ini membuat jauh lebih sulit untuk memanipulasi hasil setelah fakta.
Beberapa menyarankan bahwa setiap PhD psikologi harus diwajibkan untuk mereplikasi studi yang sudah ada sebagai bagian dari pelatihan mereka. Ini akan menciptakan lebih banyak insentif untuk pekerjaan replikasi sambil mengajarkan siswa metode penelitian yang tepat. Yang lain mengusulkan bahwa jurnal harus memerlukan replikasi independen sebelum mempublikasikan hasil.
Bidang ini masih menghasilkan wawasan berharga - tes IQ, misalnya, tetap menjadi salah satu temuan psikologi yang paling dapat diandalkan dan tereplikasi dengan baik. Tantangan sekarang adalah memisahkan sains yang solid dari noise statistik, dan membangun budaya yang menghargai akurasi daripada kebaruan.
Referensi: Famous Cognitive Psychology Experiments that Failed to Replicate