× mbyll
Megjithëse studimi aktual testoi algoritmin e AI vetëm në robotë të simuluar, studiuesit kanë zhvilluar NoodleBot për testimin e ardhshëm të algoritmit në botën reale. Kredia: Northwestern University
Inxhinierët e Universitetit Northwestern kanë zhvilluar një algoritëm të ri të inteligjencës artificiale (AI) të krijuar posaçërisht për robotikën inteligjentë. Duke i ndihmuar robotët të mësojnë shpejt dhe me besueshmëri aftësi komplekse, metoda e re mund të përmirësojë ndjeshëm prakticitetin dhe sigurinë e robotëve për një sërë aplikacionesh, duke përfshirë makinat vetë-drejtuese, dronët e dorëzimit, asistentët e shtëpisë dhe automatizimin.
I quajtur Mësimi i Përforcimit Maksimal të Difuzionit (MaxDiff RL), suksesi i algoritmit qëndron në aftësinë e tij për të inkurajuar robotët që të eksplorojnë mjediset e tyre sa më rastësisht të jetë e mundur në mënyrë që të fitojnë një sërë përvojash të ndryshme.
Kjo “rastësi e projektuar” përmirëson cilësinë e të dhënave që robotët mbledhin në lidhje me mjedisin e tyre. Dhe, duke përdorur të dhëna me cilësi më të lartë, robotët e simuluar demonstruan mësim më të shpejtë dhe më efikas, duke përmirësuar besueshmërinë dhe performancën e tyre të përgjithshme.
Kur u testuan kundër platformave të tjera të inteligjencës artificiale, robotët e simuluar duke përdorur algoritmin e ri të Northwestern ia kalonin vazhdimisht modelet më të fundit. Algoritmi i ri funksionon aq mirë, në fakt, sa robotët mësuan detyra të reja dhe më pas i kryen ato me sukses brenda një përpjekjeje të vetme – duke e bërë atë siç duhet herën e parë. Kjo bie fare në kontrast me modelet aktuale të AI, të cilat mundësojnë mësim më të ngadaltë përmes provave dhe gabimeve.
Hulumtimi, i titulluar “Mësimi maksimal i përforcimit të difuzionit”, është publikuar në revistë Inteligjenca e makinës së natyrës.
“Kornizat e tjera të AI mund të jenë disi jo të besueshme,” tha Thomas Berrueta nga Northwestern, i cili drejtoi studimin. “Ndonjëherë ata do të gozhdojnë plotësisht një detyrë, por, herë të tjera, ata do të dështojnë plotësisht. Me kornizën tonë, për sa kohë që roboti është i aftë të zgjidhë detyrën fare, sa herë që ndizni robotin tuaj, mund të prisni që ai të bëjë pikërisht ajo që i është kërkuar të bëjë Kjo e bën më të lehtë interpretimin e sukseseve dhe dështimeve të robotëve, gjë që është thelbësore në një botë gjithnjë e më shumë të varur nga AI.
Berrueta është anëtare presidenciale në Northwestern dhe Ph.D. kandidat për inxhinieri mekanike në Shkollën e Inxhinierisë McCormick. Eksperti i robotikës Todd Murphey, një profesor i inxhinierisë mekanike në McCormick dhe këshilltar i Berrueta, është autori kryesor i gazetës. Berrueta dhe Murphey bashkëautor të punimit me Allison Pinosky, gjithashtu një Ph.D. kandidat në laboratorin e Murphy.
Shkëputja e patrupëzuar
Për të trajnuar algoritmet e mësimit të makinerive, studiuesit dhe zhvilluesit përdorin sasi të mëdha të dhënash të mëdha, të cilat njerëzit i filtrojnë dhe kurojnë me kujdes. AI mëson nga këto të dhëna trajnimi, duke përdorur prova dhe gabime derisa të arrijë rezultate optimale.
Ndërsa ky proces funksionon mirë për sistemet pa trup, si ChatGPT dhe Google Gemini (ish Bard), ai nuk funksionon për sistemet e trupëzuara të AI si robotët. Robotët, në vend të kësaj, mbledhin të dhëna vetë – pa luksin e kuratorëve njerëzorë.
“Algoritmet tradicionale nuk janë të pajtueshme me robotikën në dy mënyra të ndryshme,” tha Murphey.
“Së pari, sistemet pa trup mund të përfitojnë nga një botë ku ligjet fizike nuk zbatohen. Së dyti, dështimet individuale nuk kanë pasoja. Për aplikimet e shkencës kompjuterike, e vetmja gjë që ka rëndësi është që të ketë sukses shumicën e kohës. Në robotikë, një dështim mund të jetë katastrofike”.
Për të zgjidhur këtë shkëputje, Berrueta, Murphey dhe Pinosky synuan të zhvillonin një algoritëm të ri që siguron që robotët të mbledhin të dhëna me cilësi të lartë në lëvizje.
Në thelbin e tij, MaxDiff RL urdhëron robotët të lëvizin më rastësisht në mënyrë që të mbledhin të dhëna të plota dhe të larmishme rreth mjediseve të tyre. Duke mësuar përmes përvojave të rastësishme të vetë-kuruara, robotët fitojnë aftësitë e nevojshme për të përmbushur detyra të dobishme.
Duke e bërë të drejtë herën e parë
Për të testuar algoritmin e ri, studiuesit e krahasuan atë me modelet aktuale, më të fundit. Duke përdorur simulime kompjuterike, studiuesit kërkuan robotë të simuluar të kryenin një sërë detyrash standarde. Në të gjithë tabelën, robotët që përdorin MaxDiff RL mësuan më shpejt se modelet e tjera. Ata gjithashtu kryenin detyrat në mënyrë korrekte shumë më të qëndrueshme dhe më të besueshme se të tjerët.
Ndoshta edhe më mbresëlënëse: Robotët që përdorin metodën MaxDiff RL shpesh kanë arritur të kryejnë saktë një detyrë në një përpjekje të vetme. Dhe kjo është edhe kur ata filluan pa njohuri.
“Robotët tanë ishin më të shpejtë dhe më të shkathët – të aftë për të përgjithësuar në mënyrë efektive atë që mësuan dhe për ta zbatuar atë në situata të reja,” tha Berrueta. “Për aplikacionet e botës reale ku robotët nuk mund të përballojnë kohë të pafund për prova dhe gabime, ky është një përfitim i madh.”
Meqenëse MaxDiff RL është një algoritëm i përgjithshëm, ai mund të përdoret për një sërë aplikacionesh. Studiuesit shpresojnë që ai të trajtojë çështjet themelore që pengojnë fushën, duke hapur në fund rrugën për vendimmarrje të besueshme në robotikën inteligjentë.
“Kjo nuk duhet të përdoret vetëm për automjetet robotike që lëvizin”, tha Pinosky. “Ai mund të përdoret gjithashtu për robotë të palëvizshëm – si një krah robotik në një kuzhinë që mëson se si të ngarkojë lavastoviljen. Ndërsa detyrat dhe mjediset fizike bëhen më të komplikuara, roli i mishërimit bëhet edhe më vendimtar për t’u marrë parasysh gjatë procesit të të mësuarit. Ky është një hap i rëndësishëm drejt sistemeve reale që kryejnë detyra më të komplikuara, më interesante.”
Më shumë informacion:
Mësimi maksimal i përforcimit të difuzionit, Inteligjenca e makinerisë së natyrës (2024). DOI: 10.1038/s42256-024-00829-3
Informacioni i revistës:
Inteligjenca e makinës së natyrës