Qeliza apo ose kancer? Algoritmi që gabon një në tre melanoma dhe fshin pacientët me lëkurë të errët

Ángela Bernardo
26 min lexim
Lajme
Qeliza apo ose kancer? Algoritmi që gabon një në tre melanoma dhe fshin pacientët me lëkurë të errët

Koha është para. Sidomos për melanomë, kanceri më i rrezikshëm i lëkurës: diagnoza e këtij tumori sa më shpejt të jetë e mundur është më vendimtare për të shpëtuar jetë se në çdo kancer tjetër. Në Spanjë, vlerësohet se në vitin 2025 do të ketë rreth 9,400 raste të melanomës, një kancer shumë agresiv që mund të përhapet shpejt dhe të metastazojë në vetëm disa muaj. Kur kjo ndodh, parashikimi zakonisht është i dobët, kështu që gabimet në zbulim mund të jenë fatale.

Kjo urgjencë është pikërisht ajo që ka bërë që Katalonia të angazhohet për intellegjencë artificiale. Në vitin 2025, sistemi shëndetësor i Katalonisë, Osakidetza, po punon për përfshirjen e Quantus Skin, një algoritëm i dizajnuar për të diagnozuar rrezikun e kancerit të lëkurës, duke përfshirë melanomën, në klinikat dhe spitalet kryesore të shëndetit. Në teori, ai premton të përshpejtojë procesin: mjekët e përgjithshëm do të mund të dërgojnë imazhe të lezioneve të dyshimta në shërbimin dermatologjik të spitalit, së bashku me vlerësimin e algoritmit për të qenë malinj. Ideja e qeverisë së Katalonisë është që Quantus Skin, i cili aktualisht po testohet, do të ndihmojë në prioritizimin e pacientëve për trajtim.

Një kontratë publike prej 1.6 milion euro për Asisa

Në vitin 2022, Shërbimi Shëndetësor Bask, Osakidetza, dha një kontratë prej 1.6 milion euro për Transmural Biotech për të zbatuar “algoritme të inteligjencës artificiale në imazherinë mjekësore,” e cila kërkonte arritjen e një ndjeshmërie dhe specifikimi prej “të paktën 85%.” Kompania, e cila u krijua si një spin-off nga Universiteti i Barcelonës dhe Spitali Clínic, përket kompanisë private të sigurimeve Asisa. Edhe pse specifikimet përfshinin disa lloje të kancerit dhe sëmundje të tjera, Osakidetza zgjodhi vetëm dy algoritme, duke përfshirë Quantus Skin, për shkak të “ndikimit më të madh në kujdesin shëndetësor” dhe për të “arritur një kthim më të lartë në shëndet.” Vendimi, për më tepër, u mor në mënyrë unilaterale, pa konsultuar specialistë, mësoi Civio. Në shkurt, Osakidetza deklaroi se Quantus Skin kishte kaluar “fazën e validimit” dhe ishte në “fazën e integrimit.” Në një përgjigje më të fundit ndaj pyetjeve nga Civio, shërbimi tani thotë se vazhdon testimin e algoritmit dhe do të marrë vendime “duke marrë parasysh rezultatet që kemi arritur.” Megjithatë, shërbimi nuk trajtoi faktin që rezultatet klinike të publikuara të Quantus Skin (69.1% ndjeshmëri dhe 80.2% specifikim) janë nën pragun prej 85% të vendosur nga kontrata publike. Përveç çmimit në Bask, Transmural Biotech ka vetëm një kontratë publike tjetër, në Kataloni, për një shumë shumë më të vogël (25,000 euro) për të certifikuar algoritmet e inteligjencës artificiale në radiologji.

Megjithatë, të dhënat janë shqetësuese. Transmural Biotech, kompania që tregton Quantus Skin, kryen një studim fillestar me rezultate premtuese, por kishte kufizime të rëndësishme: u krye plotësisht online dhe nuk u publikua në ndonjë revistë shkencore, që do të thotë se nuk iu nënshtrua kontrollit të zakonshëm të cilësisë që kërkohet në shkencë.

Më vonë, dermatologë nga Spitali Ramón y Cajal dhe profesorë nga Universiteti Complutense në Madrid kryen një studim të dytë, i cili u publikua, për të vlerësuar efektivitetin klinik aktual të Quantus Skin. Ky studim, i cili mori financim dhe ndihmë teknike nga Transmural Biotech, tregoi rezultate më të këqija: algoritmi humbet një nga tre melanoma. Sensitiviteti i tij është 69.1%, që do të thotë se ai humbet 31% të rasteve të vërteta të këtij kanceri potencialisht vdekjeprurës.

Kur Civio kontaktoi CEO-n e Transmural Biotech, David Fernández Rodríguez, ai u përgjigj shmangshëm me email: “Nuk e di çfarë është tani.” Pas insistimit në telefon, ai ndryshoi tregimin e tij: “Ajo që po bënim ishte testimi,” për të zbuluar probleme të mundshme të zbatimit. Dhe, në fund të telefonatës, Fernández Rodríguez pranoi se Quantus Skin “nuk ndaloi së punuari, thjesht punoi shumë më keq, por na duhej të kuptonim pse.”

Fernández Rodríguez i atribuon këto rezultate më të dobëta defekteve në kapjen e imazheve për shkak të mos ndjekjes së udhëzimeve të Quantus Skin. Kjo është diçka që ata kanë parë gjithashtu në provat në Basqekinë: “Mjekët e kujdesit parësor nuk janë të trajnuar mirë për të marrë imazhet,” thotë ai, gjë që nënkupton nevojën për “të trajnuar mjekët.” Megjithatë, studimi i dytë përfshiu dermatologë që specializohen pikërisht në fotografimin e lezioneve të dyshimta për diagnozën e mëvonshme. Sipas Fernández Rodríguez, besueshmëria përmirësohet pas “përdorimit të duhur të prerjes së imazheve” sepse “ato nuk po ndiqnin udhëzimet saktësisht.”

Burime të pavarura kritikojnë mjetin diagnostikues

“Për kancerin e lëkurës, të pasurit sensitivitet prej 70% është shumë i keq. Është shumë i dobët. Nëse i jep këtë dikujt për të bërë një foto dhe të thotë nëse mund të jetë një melanoma dhe ata gabojnë në një nga tre raste, është e papranueshme për shërbimin e kontrollit të kancerit të lëkurës në një nivel primar. Duhet të kërkoni më shumë,” shpjegon Dr Josep Malvehy Guilera, drejtor i Njësisë së Kancerit të Lëkurës në Spitalin Clínic në Barcelonë. “Një normë fals-negative prej 31% tingëllon e rrezikshme të paktën,” thotë Dr Rosa Taberner Ferrer, dermatologe në Spitalin Son Llàtzer në Mallorca dhe autore e Dermapixel: “Si një test shërbimi është i dobët.”

Megjithatë, Fernández Rodríguez përpiqet të minimizojë problemin duke u fokusuar vetëm në të dhënat që favorizojnë produktin e tij, duke shmangur përmendjen e ndjeshmërisë së ulët të Quantus Skin. Quantus Skin dështon në dy mënyra: sipas të njëjtës studim, specifiteti i tij nënkupton një normë gabimi pozitive prej 19.8%, pra ai gabon një në pesë molë beninje si melanoma. Kjo mund të çojë në një referim të panevojshëm për rreth 20% të pacientëve të skanuar.

Në studim, autorët – dermatologë në Spitalin Ramón y Cajal në Madrid dhe profesorë të optikës në Universitetin Complutense të Madridit – argumentojnë se është më e preferueshme që Quantus Skin të ketë një specifitet më të lartë (më pak gabime pozitive) edhe në koston e një ndjeshmërie më të ulët (më shumë gabime negative) sepse ai nuk përdoret për diagnoza përfundimtare. Ai është thjesht një mjet skanimi, për të referuar raste nga kujdesi primar. Ata supozojnë se kjo mund të parandalojë mbingarkesën e konsultave specialistike, duke ulur kohën e pritjes dhe ulur kostot mjekësore.

“Nëse gabimisht diagnozon melanoma në lezione me rrezik potencial të rritjes së shpejtë dhe madje shkakton vdekjen e pacientit, atëherë unë duhet të jem shumë intolerant. Duhet të kërkoj ndjeshmëri prej së paku 92%, 93%, 94%.”

Dr. Josep Malvehy Guilera, Drejtor i Njësisë së Kancerit të Lëkurës në Spitalin Clínic të Barcelonës

Specialistët e konsultuar nga Civio nuk pajtohen. Edhe pse nuk ekziston një standard ideal për diagnozën e kancerit – pjesërisht sepse varet nga agresiviteti i çdo tumori – ajo që ka arritur Quantus Skin është larg të qenit e pranueshme. “Nëse gabimisht diagnozon melanoma në lezione me rrezik potencial të rritjes së shpejtë dhe potencialisht edhe shkakton vdekjen e pacientit, atëherë unë duhet të jem shumë intolerant. Pres ndjeshmëri prej së paku 92%, 93%, 94%,” thotë dermatologu Malvehy Guilera nga Spitali Clínic në Barcelonë.

“Nëse ata synojnë ta përdorin për skanimin, atëherë sistemi duhet të ketë një ndjeshmëri shumë të lartë në kurriz të një specifiteti pak më të ulët,” shpjegon Taberner Ferrer. Me fjalë të tjera, është më e preferueshme që një algoritëm i tillë të jetë tepër i kujdesshëm: më mirë të gabojë pak duke gjeneruar alarmime false tek njerëzit e shëndetshëm sesa të humbasë një rast të vërtetë kanceri.

Lëkura e errët, diagnoza e pasigurtë

Problemet me Quantus Skin shkojnë përtej ndjeshmërisë së ulët të tij. Artikulli vetëm vlerësoi efikasitetin e tij në diagnostikimin e melanomës, por nuk u fokusua në kanceret e tjera më të zakonshme por më pak agresive të lëkurës, si karcinoma e bazës së qimeve dhe karcinoma e qelizave squamous, ku Quantus Skin gjithashtu mund të aplikohet. Autorët gjithashtu nuk studiuan se si ngjyra e lëkurës ndikon në performancën e algoritmit, edhe pse pranojnë se kjo është një nga kufizimet kryesore të kërkimit të tyre.

Diversiteti që Quantus Skin injoron

Në fillim të vitit 2025, Rajoni i Baskisë kishte 316,942 persona me origjinë të huaj, sipas të dhënave nga Observatori i Imigracionit Baskë Ikuspegi. Më shumë se 60,000 prej tyre vinin nga Magrebi dhe Afrika nën-Sahariane, ndërsa pothuajse 164,000 njerëz vinin nga Amerika Latine, ku ka një variabilitet të madh të ngjyrave të lëkurës. Kjo nuk përfshin njerëzit e lindur në Spanjë me prejardhje të huaj që jetojnë në Rajonin e Baskisë, siç janë futbollistët e njohur Iñaki dhe Nico Williams.

Quantus Skin, bazuar në rrjete nervore, ka mësuar të njohë kancerin e lëkurës pothuajse ekskluzivisht tek njerëzit e bardhë. Algoritmi u ushqye fillimisht vetëm me mbi 56,000 imazhe nga Kollaborimi Ndërkombëtar i Imagemimit të Lëkurës (ISIC), një depo publik i fotografive mjekësore të mbledhura kryesisht nga spitalet perëndimore, ku shumica e pacientëve kanë lëkurë të ndritshme. Më pas, Quantus Skin u trajnuar përsëri duke përdorur imazhe të 513 pacientëve nga Spitali Ramón y Cajal në Madrid, të gjithë të bardhë.

Seti i të dhënave të përdorura për të trajnuar Quantus Skin përfshin imazhe “të meshkujve dhe femrave kaukazianë,” thotë Fernández Rodríguez. “Nuk dua të merrem me çështjen e minoriteteve etnike dhe gjithçkaje tjetër, sepse mjeti përdoret nga Kultura Baske, nga Osakidetza. Ajo që po ofroj është një mjet, me kufizimet e tij,” thotë Fernández Rodríguez. Pavarësisht mungesës së trajnimit në lëkurë më të errët, qeveria baske thotë se nuk është e nevojshme të “zbatohet” ndonjë masë “për të promovuar barazinë dhe mosdiskriminimin,” siç është pohuar në dosjen e Quantus Skin në katalogun e Korpusit Bask të algoritmeve dhe sistemeve të inteligjencës artificiale. Megjithatë, pasi rrjetet nervore janë trajnuar pothuajse ekskluzivisht me imazhe të njerëzve të bardhë, ato janë të prirura të dështojnë edhe më shumë në lëkurë më të errët, si individët e etnisë Roma ose migrantët nga Amerika Latine dhe Afrika.

“Algoritmet janë aq lehtë të mashtrohen.”

Adewole Adamson, profesor i Dermatologjisë në Universitetin e Teksasit

“Algoritmet janë aq lehtë mashtrues,” thotë Adewole Adamson, profesor i dermatologjisë në Universitetin e Teksasit, i cili paralajmëroi në vitin 2018 për diskriminimin që inteligjenca artificiale mund të shkaktojë nëse nuk zhvillohet në një mënyrë gjithëpërfshirëse dhe të ndryshme.

Parashikimet e tij janë konfirmuar. Në dermatologji, kur algoritmet ushqehen kryesisht me imazhe të pacientëve të bardhë, “besueshmëria diagnostike në lëkurë të errët zvogëlohet,” thotë Taberner Ferrer. Saktësia e Algoritmit të Kërkimit të Imazhit të Lëkurës, nga kompania suedeze First Derm, i trajnuar kryesisht me foto të lëkurës së bardhë, u ul nga 70% në 17% kur u testua në njerëz me lëkurë të errët. Kërkimet më të fundit kanë konfirmuar se të tilla algoritme performojnë më keq në njerëzit me ngjyrë të zezë, gjë që nuk është për shkak të problemeve teknike, por për shkak të mungesës së diversitetit në të dhënat e trajnimit.

Megjithëse melanoma është një kancer shumë më i zakonshëm tek njerëzit e bardhë, njerëzit me lëkurë të errët kanë një normë më të ulët të mbijetesës së përgjithshme. Inxhinieri amerikan Avery Smith e njeh mirë këto shifra. Gruaja e tij, Latoya Smith, u diagnostikua me melanoma vetëm një vit e gjysmë pasi u martuan. “U befasova shumë nga normat e mbijetesës të listuara për njerëzit me të njëjtën diagnozë si gruaja ime, dhe nga mënyra se si ato varen nga raca. Unë dhe gruaja ime jemi të dy Amerikanë të zi dhe ishim në fund të normës së mbijetesës. Nuk e dija deri sa më goditi si një autobus. Kjo është shumë e frikshme,” i tregon Civio. Pak kohë pas diagnozës, në fund të vitit 2011, Latoya vdiq.

Që atëherë, Smith ka punuar për ta bërë dermatologjinë më gjithëpërfshirëse dhe për të siguruar që algoritmet mos e rritin pabarazinë. Për të na kujtuar ndikimin që mund të kenë, veçanërisht mbi grupet e vulnerueshme, Smith refuzon të flasë për inteligjencën artificiale si një “mjet,” sikur të ishte thjesht një gërshërë: “Është një term marketingu. Është një mënyrë për t’i bërë njerëzit ta kuptojnë që nuk janë teknikë. Por është shumë më tepër se thjesht një mjet.”

Eksperti ligjor Anabel K. Arias, zëdhënëse për Federatën e Konsumatorëve dhe Përdoruesve (CECU), gjithashtu flet për këto efekte: “Kur mendohet për përdorimin e saj për të bërë një diagnozë të hershme, mund të ketë një pjesë të popullsisë që është nën-reprezentuar, dhe në atë rast, mund të jetë e gabuar dhe të ketë ndikim në shëndetin e personit. Madje mund ta quani edhe dëm.”

Pacientët e padukshëm në sy të një algoritmi

“Njerëzit kanë tendencë të kenë shumë besim tek inteligjenca artificiale, i atribuojnë asaj cilësi objektiviteti që nuk janë reale,” thotë Helena Matute Greño, profesore e psikologjisë eksperimentale në Universitetin e Deusto. Çdo AI përdor informacionin që merr për të marrë vendime. Nëse të dhënat hyrëse janë të këqija ose të paplota, është e mundur që të dështojë. Kur ato janë në mënyrë sistematike të gabuara, algoritmi bën gabime që i quajmë parregullsi. Nëse ato ndikojnë më shumë në një grup të caktuar njerëzish sesa të tjerët – për shkak të origjinës së tyre, ngjyrës së lëkurës, gjinisë ose moshës – i quajmë parregullsi diskriminuese.

Një review publikuar në Revista e Epidemiologjisë Klinike tregoi se vetëm 12% e studimeve mbi AI në mjekësi kërkonin përparësi. Dhe kur e bënin, parregullsia më e zakonshme ishte parregullsia racore, e ndjekur nga gjinia dhe mosha, me shumicën dërrmuese që preknin grupet që historikisht kanë pësuar diskriminim. Këto gabime mund të ndodhin nëse të dhënat e trajnimit nuk janë të mjaftueshme të ndryshme dhe të balancuara: nëse algoritmet mësojnë vetëm nga pjesë e popullsisë, ato performojnë më keq në grupe të ndryshme ose minoritare.

Gabimet nuk janë të kufizuara vetëm në ngjyrën e lëkurës. Teknologjitë tregtare të njohjes së fytyrës dështojnë më shpesh në klasifikimin e grave të zeza sepse ato janë trajnuar historikisht me imazhe të burrave të bardhë. Në mënyrë të ngjashme, algoritmet që analizojnë radiografitë e kraharorit ose parashikojnë sëmundjet kardiovaskulare performojnë më keq në gratë nëse të dhënat e trajnimit janë jopërballueshme. Ndërkohë, një nga setet e dhënash më të përdorura për parashikimin e sëmundjes së mëlçisë është aq i pjesshëm – 75% e setit të trajnimit është mashkull – sa algoritmet që e përdorin dështojnë shumë më keq në gratë. Në Mbretërinë e Bashkuar, algoritmi për prioritizimin e transplantimeve të organeve diskriminonte ju moshë më të re. Arsyeja? Ai ishte trajnuar me të dhëna të kufizuara, të cilat mbanin parasysh vetëm mbijetesën gjatë pesë viteve të ardhshme, dhe jo jetën potencialisht shumë më të gjatë që pacientët që marrin një organ të ri mund të fitojnë.

“Të dhënat e përdorura për trajnimin duhet të përfaqësojnë të gjithë popullatën në të cilën do të përdoren,” shpjegon Nuria Ribelles Entrena, zëdhënëse për Shoqatën Spanjolle të Onkologjisë Mjekësore (SEOM) dhe onkologe në Spitalin Universitar Virgen de la Victoria në Malaga: “Nëse e trajnoj vetëm me një grup të caktuar pacientësh, do të jetë shumë efektiv në atë grup, por jo në të tjerët.”

Paragjykimi i moshës është veçanërisht problematik në pediatri. “Fëmijët nuk janë të vegjël të rritur. Ata kanë fiziologji dhe procese patologjike plotësisht të ndryshme,” paralajmërojnë autorët e një artikull në revistë. Meqenëse fëmijët zakonisht nuk marrin pjesë në kërkime klinike, situata është “një dramë,” sipas Antonio López Rueda, zëdhënës i Shoqatës Spanjolle të Radiologjisë Mjekësore (SERAM) dhe radiolog në Spitalin Universitar Bellvitge në Barcelonë.

Ignasi Barber Martínez de la Torre, zëdhënës i Shoqatës Spanjolle të Radiologjisë Pediatrike (SERPE) dhe kreu i radiologjisë pediatrike në Spitalin Sant Joan de Déu, ilustron këtë me një përvojë personale. Ekipi i tij përpiqet të vërtetojë një model të radiografisë së kraharorit të trajnuar në të rritur në popullatën pediatrike. “Shpejt kuptuam se ai bënte shumë më shumë gabime. Ndjeshmëria dhe specifikiteti ishin plotësisht të ndryshëm,” thotë ai. Një nga gabimet ishte identifikimi i timusit, një gjëndër shumë e madhe në fëmijët e vegjël që zhduket në moshë të rritur, si një i dyshuar. E njëjta gjë vlen për skeletin, i cili në fëmijët e vegjël ka “pjesë të pa ossifikuara” që mund të gabohen për fraktura.

Zgjidhja për të shmangur paragjykimin ekziston: “Seti i të dhënave të trajnimit duhet të jetë sa më i madh,” shpjegon López Rueda. Por të dhënat nuk janë gjithmonë të disponueshme për analizë të pavarur. Deri tani, shumica e sistemeve të inteligjencës artificiale të zbatuara në Spanjë që përdorin imazhe mjekësore nuk publikojnë zakonisht të dhënat e trajnimit. Kjo është rasti me dy sisteme dermatologjike – të cilat as emrat e tyre nuk janë madje publike – të cilat do të testohen së pari në zonën shëndetësore Caudal dhe më pas do të zgjerojnë në të gjithë Principatën e Asturias. Aplikimi komercial ClinicGram, për zbulimin e ulcerave të këmbës diabetike, në përdorim në Spitalin Universitar të Vic pranë Barcelonës; dhe disa sisteme private radiologjike, si Gleamer BoneView dhe ChestView dhe Lunit, të cilat operojnë në Komunitetin e Madridit, Principatën e Asturias dhe Komunitetin e Valencias gjithashtu nuk publikojnë të dhënat e tyre të trajnimit.

Ku janë të disponueshme të dhënat e trajnimit, një pengesë tjetër është se ato nuk mbledhin metadata, të tilla si origjina, gjinia, mosha ose lloji i lëkurës, të cilat do të na lejonin të kontrollonim nëse të dhënat janë gjithëpërfshirëse dhe të balancuara. Në dermatologji, shumica e të dhënave publike nuk zakonisht shënojnë origjinën e pacientëve ose tonin e lëkurës së tyre. Kur kjo informacion përfshihet, studimet tregojnë në mënyrë të qëndrueshme se popullsia e zezë është shumë nën-reprezentuar. “Ka pasur një ndërgjegjësim në rritje për këtë problem dhe zhvilluesit e algoritmeve kanë përpjekur të adresojnë këto mangësi. Megjithatë, ende ka punë për të bërë për të krijuar të dhëna trajnimi përfaqësuese për algoritmet,” thotë Adamson.

Cilësia dhe sasia e të dhënave të disponueshme përcakton gjithashtu sa mirë funksionojnë algoritmet. “Ajo që na bëri të përmirësonim efikasitetin tonë diagnostikues ishte përdorimi i burimeve tona të imazhit,” thotë Julián Conejo-Mir, profesor dhe kryetar i dermatologjisë në Spitalin Universitar Virgen del Rocío në Sevilje. Conejo-Mir dhe kolegët zhvilluan një algoritëm të inteligjencës artificiale për diagnostikimin e kancerit të lëkurës dhe për të identifikuar thellësinë e melanoma , një parametër që është i lidhur me agresivitetin e këtyre tumoreve.

Baza e të dhënave të saj, e cila përfshin imazhe të gati një mijë pacientësh nga spitali në Sevilje dhe fotografi nga depo të tjera, është përdorur për të dizajnuar një algoritëm, aktualisht nën hulumtim, me një normë saktësie prej 90%. Por edhe në sisteme të dukshme të suksesshme si ky, është e vështirë të trajnohet algoritme për të njohur raste më pak të shpeshta. Kjo është pikërisht ajo që ndodh me melanoma akrale lentiginous, kanceri më i zakonshëm i lëkurës në popullatën e zezë dhe ai që vdiq Bob Marley, kur ishte vetëm 36 vjeç. Ky tumor është veçanërisht mashtrues sepse shfaqet në zona ku njerëzit rrallë kërkojnë për lezione të dyshimta, si pëllëmbët e duarve dhe këmbëve ose nën thonjtë, ashtu si ndodhi me Marley.

Çdo vit, shërbimi i dermatologjisë në Spitalin Universitar Virgen del Rocío në Sevilje diagnostikon rreth 150 raste melanoma, prej të cilëve vetëm 2 ose 3 janë lezione akrale. “Na duhej ta hiqnim nga trajnimi, sepse kishim shumë pak raste dhe, nëse e bashkonim me të tjerët, dështonte; nëse e veçonim, nuk kishim një numër të mjaftueshëm imazhesh,” thotë José Juan Pereyra Rodríguez, kreu i seksionit në Spitalin Universitar Virgen del Rocío në Sevilje.

Kjo inteligjencë artificiale, e cila nuk përdoret për skanimin klinik por për qëllime kërkimore, nuk mund të aplikohet në raste të melanoma akrale lentiginous sepse ata nuk kishin të dhëna të mjaftueshme për këtë lloj kanceri për të trajnuar besueshëm algoritmin. Për ta arritur këtë, ata do të kishin nevojë për rreth 50 vjet të dhëna lokale të disponueshme, vlerëson Pereyra Rodriguez. “Në rastin tonë, është aq e thjeshtë sa të thuash: ‘Mos përdorni algoritmin për lezione akrale, në përgjithësi, sepse nuk e kam trajnuar për këtë.’ Kjo është; është një kufizim,” thotë ai.

“Kjo teori thotë se nëse 90% e popullsisë sime” përkon me lëkurat e bardha, “duhet të trajnoj” me ato lloje “sepse prevalenca është gjithashtu e rëndësishme kur bëhet fjalë për marrjen e vendimeve. Duhet të trajnohem në mjedisin tim,” thotë Pereyra Rodríguez. Në rastin e sistemeve të zhvilluara jashtë vendit, spitalet duhet të vlerësojnë në mënyrë ideale performancën e algoritmeve në grupet e tyre të pacientëve. López-Rueda gjithashtu kërkon “ri-trajnimin me të dhëna lokale” përpara se të zbatojë çdo inteligjencë artificiale: “Është shumë e shtrenjtë për të dyja, kompaninë dhe spitalin, por kjo është ajo që do të funksiononte vërtet.”

“Algoritmet e paragjykuara i vjedhin pacientët nga përfitimet potenciale të kësaj teknologjie revolucionare.”

Adewole Adamson, Profesori i Dermatologjisë në Universitetin e Teksasit

Edhe në Spanjë, karakteristikat e popullsisë gjithashtu ndryshojnë në varësi të kodit postar. “Nëse unë zhvilloj softuer në Spitalin Clínic [në qendër të Barcelonës] dhe e zbatoj atë në Bellvitge [në periferinë], nuk do të funksionojë për mua. Nëse e bëj të kundërtën, gjithashtu nuk do të funksionojë,” thotë López-Rueda. Pasojat e paragjykimeve algoritmike mund të jenë vërtet katastrofike: pacientët mund të dëmtohen nga një diagnozë e gabuar. “Algoritmet e paragjykuara i vjedhin pacientët nga përfitimet potenciale të kësaj teknologjie revolucionare,” thotë Adamson, i cili tregon burimin e problemit: “Problemi nuk është me algoritmin, por me mendimin dhe kujdesin që shkon në projektimin dhe zhvillimin e algoritmeve.”

Metodologjia

Ky është artikulli i parë shëndetësor në seri të transparencës algoritmike. Shpejt do të publikojmë informacione të reja mbi përdorimin e algoritmeve në Sistemin Kombëtar të Shëndetësisë. Eva Belmonte dhe David Cabo bashkëpunuan në këtë hetim, ndërsa Ter García, Javier de Vega, Olalla Tuñas dhe Ana Villota ndihmuan në rishikimin e tekstit.

Civio ka konfirmuar përfshirjen e algoritmeve dhe sistemeve të AI të përmendura në artikull përmes burimeve të ndryshme:

1) Në rastin e Vendit të Baskëve, përmes një kërkese publike për informacion nëpërmjet Ligjit për Transparencën dhe tre përgjigjeve të mëvonshme nga zyra e shtypit e Shërbimit Shëndetësor të Baskëve (Osakidetza), të cilat, në kohën e shkrimit, nuk janë përgjigjur ende në pyetjet tona më të fundit rreth Quantus Skin. Ne zgjeruam hetimin tonë për të përfshirë kontratën e kontratën, katalogun e algoritmeve dhe sistemeve të AI-së së Vendit të Baskëve, medRxiv paraprinë nga punonjësit e Trasmural Biotech, e cila nuk është shqyrtuar nga kolegët, dhe në vazhdim artikull i shqyrtuar nga kolegët në Revistën Ndërkombëtare të Kërkimeve Mjedisore dhe Shëndetit Publik (MDPI) duke vlerësuar Quantus Skin, i publikuar nga dermatologët në Spitalin Ramón y Cajal në Madrid dhe hulumtuesit e optikës në Universitetin Complutense të Madridit. Ne gjithashtu intervistuam CEO-n e Trasmural Biotech, i cili iu referua një metri të favorshëm për Quantus Skin, të njohur si vlera negative parashikuese (NPV), një parametr që nuk përgjigjet të njëjtës pyetje si ndjeshmëria, por tregon probabilitetin që, nëse një test është negativ, ai është vërtet negativ. Siç shpjegohet në artikull, ndjeshmëria fokusohet në nëse sistemi do të zbulojë të gjithë pacientët që kanë melanoma. Në fjalë të tjera, këto metrika nuk kundërshtojnë njëra-tjetrën, por matjnë gjëra të ndryshme. Për më tepër, edhe pse kompania lavdëron paraprinë, dhe publikon të dhëna nga paraprina në faqen e saj të internetit, duke përfshirë NPV-në, vetë manuskripti shprehet se “përdorimi i imazheve online nuk përbën një studim klinik” dhe se gjetjet duhet të verifikohen në një popullatë të vërtetë.

2) Në Principatën e Asturias, edhe pse qeveria rajonale fillimisht na tha se “nuk ka aktualisht asnjë sistem në sektorin shëndetësor që përdor inteligjencën artificiale,” zyra e shtypit e Ministrisë Rajonale të Shëndetësisë më vonë konfirmoi lansimin e disa sistemeve radiologjike, si dhe përfshirjen e ardhshme në dy sisteme dermatologjike.

3) Në Komunitetin e Madridit, Departamenti i Digitalizimit fillimisht raportoi shtatë projekte të AI në Shërbimin Shëndetësor të Madridit, një shifër që më vonë u rrit në 70, siç konfirmuam përmes një kërkese për informacion. Në tekst, përmendim vetëm disa nga këto sisteme, të cilat janë zbatuar në disa spitale në rajon.

4) Në Komunitetin Valencian, të cilit Ministria Rajonale e Shëndetësisë fillimisht iu përgjigj kërkesës tonë për akses duke deklaruar se ende nuk kishte vendosur për përfshirjen e sistemeve të AI. Më vonë, konfirmuam, falë GVA Confía, Regjistrin e Algoritmeve të Valencias, që në të vërtetë ekzistojnë tre sisteme aktive.

Për të përgatitur këtë raport, ne kërkuam në literaturën shkencore, kryesisht përmes PubMedGoogle Scholar dhe depozitat e para-shtypjeve si medRxivbioRxiv dhe arXiv. Gjithashtu kemi konsultuar raporte të vlerësimit të teknologjisë shëndetësore, siç është ky dokument për aplikimin e AI në skanimin e kancerit të gjirit, libra të specializuar si ky i botuar nga CSIC, dokumente të tjera të specializuara si ky raport nga aktivistja Júlia Keserű për Fondacionin Mozilla, dhe kemi marrë pjesë gjithashtu në ngjarje si konferenca mbi AI dhe mjekësinë e organizuar nga Federata e Shoqatave Shkencore Mjekësore Spanjolle (FACME). Gjithashtu kemi konsultuar disa regjistra publike ekzistuese mbi algoritmet dhe sistemet e inteligjencës artificiale, si ato të nisura në Basque Country dhe Komuniteti Valencian.

Përveç burimeve dokumentare të mësipërme, dhe burimeve të cituar në tekst, ne kontaktuam me shumë burime ekspertësh dhe dëshirojmë t'i falënderojmë ata: avokatët Estrella Gutiérrez David dhe Guillermo Lazcoz Moratinos, dermatologen Tania Díaz Corpas, dhe matematicien dhe statistikien Anabel Forte Deltell, të cilët na ndihmuan të bëjmë vizualizimin e parë sa më të qartë dhe të saktë.

Ne kërkuam gjithashtu prova mbi shpërndarjen e llojeve të ndryshme të lëkurës në Spanjë. Një studimActa Dermato-Venereologica tregoi se popullsia spanjolle zakonisht klasifikohet si fototipa II dhe III, të cilat i konfirmuam me ndihmën e disa specialistëve të dermatologjisë, të cilët gjithashtu na ndihmuan të përcaktonim se cilat grupe të popullsisë mund të përfshihen në fototipat më të lehtë dhe më të errët.

Sa i përket katalogëve të imazheve mjekësore në dermatologji dhe kufizimeve të shënimeve të tonit të lëkurës në fotografi, kërkuam prova në literaturën shkencore dhe, përveç një Lancet Digital Health rishikim sistematik, të dhënat e të cilit i përdorëm për vizualizimin e tretë, gjithashtu u mbështetëm në një Journal of the American Academy of Dermatology rishikim sistematik, një JAMA Dermatology rishikim skopues, dhe një Proceedings of the ACM on Human Computer Interaction analizë.

Për të identifikuar kontratat publike të dhëna kompanisë Transmural Biotech S.L. (B65084675), kërkuam në Platformën e Kontratave të Sektorit Publik.

Sa i përket vizualizimit të parë (sensitiviteti dhe specifiteti i algoritmeve):

Për të krijuar një përfaqësim vizual edukativ të rezultateve të efikasitetit të algoritmit Quantus Skin në fund të artikullit, përafruam shpërndarjet e probabilitetit të të dy popullsive (e shëndetshme dhe e sëmurë) duke përdorur kurba Gaussiane.

Për ta bërë këtë, bazuar në të dhënat aktuale nga studimi (55 raste melanome, prej të cilave 38 ishin të vërteta pozitive dhe 17 të pavërteta negative; 177 raste të shëndetshme, prej të cilave 142 ishin të vërteta negative dhe 35 të pavërteta pozitive, me një prag diagnostik prej 67.33%), llogaritëm matematikisht parametrat e dy shpërndarjeve normale që riprodhuan saktë sensitivitetin (69.1%) dhe specifitetin (80.2%) të vëzhguar.

Rezultatet e studimit të efikasitetit të Quantus Skin 

Këto kurba, edhe pse të thjeshtuara, na lejojnë të vizualizojmë në mënyrë intuitive se si algoritmi dallon midis dy popullatave dhe si reagojnë llojet e ndryshme të goditjeve dhe gabimeve diagnostikuese (pozitive të rreme dhe negative të rreme) ndaj kufijve të ndryshëm diagnostikues, duke treguar balancën midis të dy metrikeve në një mënyrë të thjeshtë dhe vizuale.

Është e rëndësishme të theksohet se këto përfaqësime grafike janë afërsi për qëllime vetëm informuese.

Sa i përket vizualizimit të dytë, përsa i përket nën-reprezentimit të lëkurës së errët në katalogun më të madh të imazheve dermatologjike:

Për të dizajnuar shkallën Fitzpatrick (shkallën e ngjyrës së tonit të lëkurës) në mënyrë arsimore, kemi përdorur vlerat RGB nga Tabela 1 publikuar në vitin 2017 në librin Melanoma i lëkurës: Etiologjia dhe terapia nga Codon Publications.

Zgjedhja e personaliteteve nga botët e sportit dhe muzikës si shembuj është kontrolluar me specialistë të dermatologjisë. Autorët e fotove të përdorura janë (CC BY-SA 3.0):

Në vizualizim, çdo katror është ekuivalent me rreth 100 imazhe të mbledhura në ISIC.

Përsa i përket vizualizimit të tretë, mbi kodimin e kufizuar të tonit të lëkurës në shumicën e bazave të të dhënave mjekësore:

Çdo grup përbëhet nga 10,695 rrethe, secila duke përfaqësuar dhjetë imazhe dermatologjike të përfshira në një Rishikim sistematik systematik. Përqindjet e përdorura në vizualizime mund të gjenden në përmbledhjen e publikimit. Nga informacionet klinike të ndryshme të mbledhura në rishikimin sistematik, ne zgjodhëm tre që menduam se ishin më relevante dhe më të përshtatshme për kërkimin.

Të tre vizualizimet u zhvilluan me D3.js dhe Svelte.js.

Burimi origjinal: https://civio.es/sanidad/2025/07/03/mole-or-cancer-the-algorithm-that-gets-one-in-three-melanomas-wrong-and-erases-patients-with-dark-skin/

Postimi Mole apo kancer? Algoritmi që gabon një në tre melanoma dhe fshin pacientët me lëkurë të errët u shfaq së pari në Rrjeti Evropian i Gazetarisë së të Dhënave - EDJNet.

Informacion mbi burimin dhe përkthimin

Ky artikull është përkthyer automatikisht në shqip duke përdorur teknologjinë e avancuar të inteligjencës artificiale.

Burimi origjinal: www.europeandatajournalism.eu

Ndajeni këtë artikull