Boğaziçi Üniversitesi Robot Öğretmen Projesiyle Robotlar Hayvan Eğitecek

Boğaziçi Üniversitesi Davranışsal Sinirbilim Laboratuvarı makine öğrenmesinde çığır açmayı hedefleyen yeni bir model üzerinde çalışıyor. Geliştirilen yeni yapay zeka modeliyle hayvan ve robotların birbirlerinden öğrenmesi mümkün hale gelecek.

Boğaziçi Üniversitesi Davranışsal Sinirbilim Laboratuvarı Direktörü ve projenin yürütücüsü Dr. Öğr. Üyesi Güneş Ünal, Bilgisayar Mühendisliği Bölümü’nden Dr. Öğr. Üyesi Emre Uğur ve Bilişsel Bilim Yüksek Lisans öğrencisi Oğuzcan Nas yeni yapay zeka modeliyle hayvan ve robotların birbirinden öğrenmesini sağlayacak proje için çalışıyorlar. Oluşturdukları çok disiplinli proje, edimsel koşullanma paradigmaları ile yapay zeka algoritmalarını birleştirerek robotlar ve hayvanlar arasında “karşılıklı öğrenmeyi” mümkün hale getirecek. Bu sayede robotlar tarafından eğitilen hayvanların arama-kurtarma ve mayın temizliği gibi görevlerde daha etkili şekilde görev almaları sağlanabilecek. Dr. Öğr. Üyesi Güneş Ünal, Dr. Öğr. Üyesi Emre Uğur ve Oğuzcan Nas ile yaptıkları çalışmayı “Sıçanlar ve robotlar aynı anda hem öğretmen hem öğrenci olacak” diyerek şöyle anlatıyor:

Yaptığımız çalışma en genel tanımıyla bir robot-hayvan etkileşim çalışması. Yaklaşık iki yıl sürmesini bekliyoruz. Mevcut literatürde bu konuda çalışmalar var. Örneğin robotların laboratuvar hayvanlarına (sıçanlara) bir görevi yapmayı öğrettiği ya da onlarla sosyalleştiği çalışmalar mevcut; fakat bu klasik çalışmalar hep tek yönlü. Ya robotlar hayvanlara bir işi öğretiyor ya da robotlar hayvanları gözlemleyerek kendileri öğreniyor, yani “makine öğrenmesi” oluşuyor. Bu çalışmaların hiçbirinde robot ile deney hayvanı birbiriyle etkileşime geçerek aynı anda birbirlerinin hem öğretmeni hem de öğrencisi olmuyor.

İlk defa bir edimsel koşullanma düzeneğinde, sıçanlar ve robotların aynı anda hem “öğretmen” hem de “öğrenci” olacağı bir ortam oluşturacağız. Bu çalışma, hem psikolojideki öğrenme literatürüne önemli bir katkı sunacak hem de çeşitli makine öğrenmesi algoritmalarının sınanması için yeni bir platform oluşturacak. Daha da önemlisi, tüm bu çabaların sonunda hayvan ve robot etkileşimi kullanan farklı uygulamalarda kullanılabilecek bir “karşılıklı öğrenme” modeli geliştirilecek.

Robot Arkadaş Olmak İstiyor

Deney düzeneğine bir robot ve bir sıçan aynı anda konuluyor. İkisinin de ulaşmak istedikleri farklı amaçlar var. Sıçanın motivasyonu sevdiği bir yemeği ödül olarak almak. Bu doğal bir “yemek arama davranışı” yaratıyor. Robotun amacı ise hayvanla arkadaş olmak. Robot için sıçanla arkadaş olmayı, sıçanı mümkün olduğunca kendi etrafında tutmak olarak belirliyoruz. Genel olarak, robotun verdiği iki sinyal var. Bunlardan biri “ödül sinyali.” Robot bu sinyali verdiğinde -örneğin sol kolunu havaya kaldırdığında- eğer sıçan kendisine yaklaşırsa, deney düzeneğinin ödül köşesinde hayvanın sevdiği yiyecek beliriyor. Yani robot belirli bir sinyal verdiğinde ve sıçan bu sinyali anlayıp robota yaklaştığında, robotumuz deney kutusunun uzak bir noktasında sıçana ödül vermiş oluyor. Tabii sıçanın ödülü almak için bu olumlu sinyalin anlamını ve ödülün verildiği noktayı zaman içinde öğrenip, o köşeye gitmesi gerekiyor.

Buraya kadar anlattıklarımız kendi başına basit bir edimsel koşullanma deneyidir. Ancak robot sadece ödül vermiyor, bazen de olumsuz bir sinyal ile bir çeşit ceza veriyor. Örneğin sol değil, sağ kolunu kaldırdığında ödül köşesinden yem gelmiyor. Sıçanın bu olumsuz sinyali, olumlu sinyalden ayırt etmesi gerekiyor. Sıçan bunu da öğreniyor. İşin ilginç tarafı bu süreçte, robot da kendi verdiği sinyallerin ne işi yaradığını öğreniyor. Robot deneye olumlu ve olumsuz sinyalleri rastgele vererek başlıyor. Ödül sinyalinin özelliği sıçanı robota yaklaştırması. Robot sadece bu sinyali verdiğinde sıçan kendisine yaklaşırsa, ödül köşesinden sıçan yemi geliyor. Robot olumsuz sinyal verdiğinde sıçan robota yaklaşsa da herhangi bir ödül alamıyor. Robotun motivasyonu sıçanın kendisine yaklaşması (sıçanla arkadaş olmak) olarak tanımlandığı için, robot da zaman içinde sadece bir sinyalin sıçanı kendisine yaklaştırdığını öğreniyor. Sonuçta, zaman içinde “mükemmel karşılıklı öğrenme” gerçekleşiyor. Kısacası deney iki taraf için de mutlu sonla bitiyor.

Robotların Eğittiği Hayvanlar Hayat Kurtarabilir

Bu projeyle hayvan-robot etkileşiminin artırılması hedefleniyor. Bu bilişsel ve davranışsal etkileşim daha üst bir düzeye taşındığında, robotların eğittiği hayvanları arama-kurtarma çalışmaları ve mayın temizliği gibi önemli görevlerde daha etkin olarak kullanmak mümkün hale gelebilecek.

Yukarıda özetlenen bu sisteme farklı modüller eklenerek, robot-hayvan etkileşimini çeşitlendirilecek ve böylece farklı modellerin hayvanın ve robotun öğrenmesini nasıl etkilediğini araştırılacak. Robotlar aracılığıyla hayvanlara öğretilebilecek şeylerin sınırı, hayvanların nöronal kapasiteleri ile sınırlı. Uygun yöntem ile bir robot, insan dâhil herhangi bir hayvana birçok şey öğretebilir. Robot-hayvan-insan ilişkisi, genel anlamda makine-hayvan-insan etkileşimine göre önemli bir avantaja da sahip. Bu avantaj robotların bize veya sıçanlara, yani etkileşim içinde oldukları türe fiziksel ve davranışsal olarak benzeyebilmelerinden geliyor. Antropomorfik robotların bilimkurgu alanındaki başarısını ve popülaritesini düşünün! Sıçana benzeyen bir robot, karmaşık bir labirentte sıçanlara kılavuzluk edebilir. Onlara kendi başlarına, hatta bir simülatör yardımı ile çok uzun sürede öğrenecekleri bir haritayı, çok daha kolay öğretebilir. Eğitilmiş hayvanlar hâlihazırda arama kurtarma ve mayın temizliği gibi önemli alanlarda kullanılıyor. Bu tip eğitim süreçlerinin robotlar aracılığıyla kolaylaştırılması ve hızlandırılması büyük önem taşıyor.