Robotët e futbollit kanë pasur një përmirësim. Robotët me dy këmbë të trajnuar duke përdorur mësimin e përforcimit të thellë, i cili drejtohet nga inteligjenca artificiale, mund të ecin, të kthehen për të goditur një top dhe të ngrihen pasi të bien më shpejt se robotët që punojnë nga mësimet e shkruara.
Guy Lever në Google DeepMind dhe kolegët e tij vendosën robotë Robotis OP3 me bateri, të cilët janë rreth 50 centimetra të gjatë dhe kanë 20 nyje, përmes 240 orësh mësimi të thellë përforcues.
Kjo teknikë kombinon dy parime kryesore të trajnimit të AI: të mësuarit përforcues i sheh agjentët që fitojnë aftësi përmes provës dhe gabimit, me një objektiv për t’u shpërblyer për zgjedhjen e duhur më shpesh sesa zgjedhjen e gabuar, ndërsa mësimi i thellë përdor shtresa të rrjeteve nervore – përpjekje për të imituar njeriun truri – për të analizuar modelet brenda të dhënave që tregohet AI.
Studiuesit krahasuan robotët e tyre me robotët që punojnë me aftësi të paracaktuara. Ata të trajnuar me të mësuarit e përforcimit të thellë mund të ecnin 181 për qind më shpejt, të ktheheshin 302 për qind më shpejt, të gjuanin një top 34 për qind më fort dhe të ngriheshin 63 për qind më shpejt pasi ranë në një lojë një kundër një se të tjerët. “Këto sjellje janë shumë të vështira për t’u dizajnuar dhe shkruar me dorë,” thotë Lever.
Hulumtimi përparon fushën e robotikës, thotë Jonathan Aitken në Universitetin e Sheffield, MB. “Një nga problemet më të rëndësishme që trajtohet në këtë punim është mbyllja e hendekut sim-to-real,” thotë ai. Kjo është ajo ku aftësitë e mësuara në simulime nuk transferohen domosdoshmërisht mirë në mjediset e jetës reale.
Zgjidhja e propozuar nga ekipi i Google DeepMind – përdorimi i një motori fizik për të simuluar rastet e trajnimit në vend që roboti të provojë vazhdimisht gjërat në jetën reale dhe ta përdorë atë si të dhëna trajnimi të analizuara nga rrjeti nervor – është një zgjidhje e dobishme, thotë ai.
Por “robotët që luajnë futboll nuk janë qëllimi përfundimtar”, thotë anëtari i ekipit Tuomas Haarnoja.
“Qëllimi i kësaj pune nuk është të prodhojë robotë humanoidë që luajnë në Premier League në çdo kohë së shpejti,” thotë Aitken, “por të kuptojmë se si mund të ndërtojmë shpejt aftësi komplekse robotësh, duke përdorur metodologji sintetike trajnimi për të ndërtuar aftësi që mund të me shpejtësi dhe më e rëndësishmja në mënyrë të fuqishme, të transferuara në aplikacione reale të punës.”
Temat: