Gara për modelet e përshtatura mjekësore të AI po nxehet. Google dhe DeepMind sapo kanë publikuar një dokument të ri që përshkruan Med-Gemini, një grup modelesh të avancuara të AI që synojnë aplikacionet e kujdesit shëndetësor. Autorët pretendojnë se Med-Gemini po i kalon modelet konkurruese si GPT-4 e OpenAI. Megjithatë, kjo e fundit nuk mbetet pas as në fushën e mjekësisë, duke zgjeruar së fundmi bashkëpunimin me kompaninë e madhe farmaceutike Moderna.
Hapi i mrekullueshëm përpara i Med-Gemini, nëse vërtetohet në mjediset e botës reale, është aftësia e tij për të kapur kontekstin dhe përkohshmërinë; një kurth i njohur në modelet ekzistuese të inteligjencës artificiale të lidhura me shëndetin. Është e vërtetë, ne, mjekët, jemi të njohur për shkurtesat tona dhe mungesën e uniformitetit në dokumentacion. Megjithatë, sfida e vërtetë në trajnimin e algoritmeve mjekësore nuk është kompleksiteti tekstual – por më tepër konai tekstual.
Një shembull i thjeshtë për këtë është ai që çdo prind për një fëmijë të vogël e di mirë: duhet të vizitoni një pediatër për ethet dhe skuqjen e të riut tuaj. Mjeku gjithmonë do të pyesë: çfarë erdhi e para – ishte ethet apo skuqja? U përhap nga koka poshtë apo nga këmbët lart? Këto karakteristika të thjeshta mund të dallojnë një sëmundje të lehtë dhe vetëkufizuese, si Roseola, nga një sëmundje potencialisht kërcënuese për jetën, si meningjiti meningokokal. Këto pyetje në dukje të drejtpërdrejta, me karakteristikat e tyre shumëdimensionale dhe të serive kohore, mund ta heqin plotësisht një model AI me pasaktësinë më të vogël.
Ky kontekst i saktë duket se është trajtuar nga Med-Gemini duke u shkëputur nga sipërmarrja masive e ndërtimit të një modeli të përgjithshëm mjekësor gjithëpërfshirës. Në vend të kësaj, zhvilluesit e Google kanë adoptuar një qasje vertikale nga vertikale të modeleve të lidhura, të referuara si një “familje” modelesh, secila duke optimizuar një domen ose skenar specifik mjekësor. Kjo thuhet se ka rezultuar në saktësi të përmirësuar dhe të nuancuar, dhe një arsyetim më transparent, duke ofruar disa reagime të interpretueshme, si për shembull pse një diagnozë e sugjeruar është më e mundshme.
Meqenëse mjekët pritet të mbajnë krah për krah kërkimet e fundit, Google duket se e mban Med-Gemini me të njëjtin standard. Modeli i ri përfshin gjithashtu një shtresë të rëndësishme shtesë – një kërkim të bazuar në ueb të informacionit të përditësuar, duke lejuar shtimin e të dhënave me njohuri të jashtme, duke integruar rezultatet online në model.
Megjithëse Med-Gemini ka shfrytëzuar burime të ndryshme të dhënash, të tilla si fragmente nga të dhënat shëndetësore, rrezet X, fotot e lezioneve të lëkurës, pyetjet e përgatitjes së provimit mjekësor dhe të tjera – është ende e rëndësishme të mbani mend se çfarë duhet të ndodhë ende: një perspektivë, real- vërtetimi botëror mbi të dhënat aktuale të nivelit të prodhimit.
Pa dyshim, modelet multimodale kanë sjellë erën e progresit me përparimet shëndetësore të fuqizuara nga AI. Megjithatë, barra e provës duhet të demonstrohet ende në mjediset klinike të jetës reale.