Model pembelajaran hewan (dan manusia) yang berusia puluhan tahun sedang diserang | 31left

Tdia berdengung pemberitahuan atau ding email mungkin menginspirasi kegembiraan — atau ketakutan. Dalam eksperimen terkenal, Ivan Pavlov (foto) menunjukkan bahwa anjing dapat diajari untuk mengeluarkan air liur dengan ketukan metronom atau suara harmonium. Hubungan sebab akibat ini—dikenal sebagai pembelajaran asosiatif, atau penguatan—merupakan inti dari cara sebagian besar hewan berurusan dengan dunia.

Sejak awal 1970-an, teori dominan tentang apa yang sedang terjadi adalah bahwa hewan belajar dengan mencoba-coba. Mengaitkan isyarat (metronom) dengan hadiah (makanan) terjadi sebagai berikut. Saat isyarat datang, hewan memprediksi kapan hadiah akan terjadi. Kemudian, menunggu untuk melihat apa yang datang. Setelah itu, menghitung selisih antara prediksi dan hasil—kesalahan. Terakhir, ia menggunakan estimasi kesalahan tersebut untuk memperbarui berbagai hal guna membuat prediksi yang lebih baik di masa mendatang.

Keyakinan akan pendekatan ini sendiri diperkuat pada akhir abad ke-20 oleh dua hal. Salah satunya adalah penemuan bahwa ia juga pandai memecahkan masalah teknik yang berkaitan dengan kecerdasan buatan (AI). Jaringan saraf dalam belajar dengan meminimalkan kesalahan dalam prediksi mereka.

Pengamatan penguat lainnya adalah makalah yang diterbitkan di Sains pada tahun 1997. Tercatat bahwa fluktuasi kadar dopamin di otak, zat kimia yang membawa sinyal antara beberapa sel saraf dan diketahui terkait dengan pengalaman penghargaan, tampak seperti sinyal prediksi-kesalahan. Sel-sel penghasil dopamin lebih aktif ketika hadiah datang lebih cepat dari yang diharapkan atau tidak diharapkan sama sekali, dan dihambat ketika hadiah datang kemudian atau tidak sama sekali — tepatnya apa yang akan terjadi jika memang sinyal seperti itu.

Sebuah cerita yang bagus, kemudian, tentang bagaimana sains bekerja. Tetapi jika makalah baru, juga diterbitkan di Sainsternyata benar, itu salah.

Para peneliti telah lama mengetahui bahwa beberapa aspek aktivitas dopamin tidak konsisten dengan model prediksi-kesalahan. Namun, sebagian karena ini bekerja sangat baik untuk melatih agen buatan, masalah ini telah disembunyikan. Sampai sekarang. Studi baru, oleh Huijeong Jeong dan Vijay Namboodiri dari University of California, San Francisco, dan tim kolaborator, telah mengubah dunia ilmu saraf. Ini mengusulkan model pembelajaran asosiatif yang menunjukkan bahwa para peneliti telah membuat hal-hal mundur. Selain itu, saran mereka didukung oleh serangkaian eksperimen.

Model lama melihat ke depan, mengasosiasikan sebab dengan akibat. Yang baru melakukan sebaliknya. Ini mengasosiasikan akibat dengan sebab. Mereka berpikir bahwa ketika seekor hewan menerima hadiah (atau hukuman), ia mengingat kembali melalui ingatannya untuk mencari tahu apa yang mungkin mendorong peristiwa ini. Peran Dopamin dalam model ini adalah menandai peristiwa yang cukup berarti untuk bertindak sebagai penyebab kemungkinan hadiah atau hukuman di masa depan.

Melihat hal-hal seperti ini berkaitan dengan dua hal yang selalu mengganggu model lama. Salah satunya adalah kepekaan terhadap skala waktu. Yang lainnya adalah traktabilitas komputasi.

Masalah skala waktu adalah sebab dan akibat dapat dipisahkan oleh milidetik (menyalakan bola lampu dan mengalami penerangan), menit (minum dan merasa mabuk) atau bahkan berjam-jam (makan sesuatu yang buruk dan keracunan makanan). Melihat ke belakang, Dr Namboodiri menjelaskan, memungkinkan penyelidikan daftar panjang kemungkinan penyebab yang sewenang-wenang. Melihat ke depan, tanpa selalu mengetahui terlebih dahulu seberapa jauh untuk melihat, jauh lebih rumit.

Ini mengarah ke masalah kedua. Pengalaman indrawi kaya, dan semua yang ada di dalamnya berpotensi memprediksi hasil. Membuat prediksi berdasarkan setiap isyarat yang mungkin akan berada di antara sulit dan tidak mungkin. Jauh lebih sederhana, ketika peristiwa yang bermakna terjadi, untuk melihat ke belakang melalui peristiwa lain yang berpotensi bermakna untuk suatu sebab.

Namun dalam praktiknya, sulit untuk membedakan secara eksperimental antara kedua model tersebut. Dan itu terutama benar jika Anda bahkan tidak mau repot-repot untuk melihat—yang, sampai sekarang, tidak dimiliki orang. Dr Jeong dan Dr Namboodiri telah melakukannya. Mereka merancang dan melakukan 11 percobaan yang melibatkan tikus, pendengung, dan tetes larutan gula yang dirancang khusus untuk tujuan tersebut. Selama ini mereka mengukur, secara real time, jumlah dopamin yang dilepaskan oleh nukleus accumbens, wilayah otak tempat dopamin terlibat dalam pembelajaran dan kecanduan. Semua eksperimen bermuara pada model baru.

Perputaran 180° dalam berpikir—dari prospektif ke retrospektif—yang tersirat dari eksperimen ini menyebabkan kehebohan di dunia ilmu saraf. Ini “memprovokasi pemikiran dan mewakili arah baru yang merangsang,” kata Ilana Witten, seorang ahli saraf di Universitas Princeton yang tidak terlibat dengan makalah tersebut.

Eksperimen lebih lanjut akan diperlukan untuk mengkonfirmasi temuan baru. Tetapi jika konfirmasi datang, itu akan memiliki konsekuensi di luar ilmu saraf. Ini akan menyarankan cara itu AI bekerja tidak, seperti yang dikatakan saat ini, bahkan memiliki hubungan yang lemah dengan cara kerja otak, tetapi sebenarnya merupakan tebakan yang beruntung.

Tapi itu mungkin juga menyarankan cara yang lebih baik untuk dilakukan AI. Dr Namboodiri berpendapat demikian, dan sedang menjajaki kemungkinannya. Evolusi memiliki waktu ratusan juta tahun untuk mengoptimalkan proses pembelajaran. Jadi belajar dari alam bukanlah ide yang buruk.

admin

Leave a Reply

Your email address will not be published. Required fields are marked *