Si po revolucionon Big Data shkencat shoqërore

Nonna Mayer, Directrice de recherche au CNRS/Centre d'études européennes, Sciences Po
8 min lexim
Politikë
Si po revolucionon Big Data shkencat shoqërore
Që nga lindja e Uebit, dy vizione janë kundërvënë, njëri duke parë në epokën e të dhënave të mëdha fundin e teorive shpjeguese në shkencat humane, tjetri duke menduar kundër kësaj se ajo ofron një mundësi për t’i rinovuar duke i kombinuar me shkencën e të dhënave. Nico El Nino/Shutterstock

Vërejtjet që lënë individët në internet dhe në rrjetet sociale përbëjnë një burim të madh të të dhënave digjitale, të mëdha të dhënat. Disa kishin parashikuar vdekjen e shkencave shoqërore me shfaqjen e këtyre të dhënave masive. Përkundrazi, duket se shkencat shoqërore po transformohen dhe po përmirësojnë metodat e tyre të hetimit falë të dhënave digjitale. Megjithatë, kujdesi mbetet i nevojshëm, për shkak të mos-reprezentativitetit të mostrave të përdorura dhe të errësirës së algoritmeve – pa përmendur shkeljet e privatësisë lidhur me kapjen e të dhënave.


Vërejtjet që lëmë në motorët e kërkimit, rrjetet sociale, faqet e blerjeve online, si dhe rritja e numrit të objekteve të lidhura (smartphone, orë, kamera, termostate, altoparlantë, sensore), ushqejnë një burim të jashtëzakonshëm të të dhënave digjitale. Ato ndriçojnë deri në detajet më të vogla sjelljet tona të përditshme, lëvizjet tona, mënyrat tona të konsumit, shëndetin tonë, kohën e lirë, interesat tona, rrjetet tona shoqërore, mendimet politike dhe fetare, pa qenë gjithmonë të vetëdijshëm për to. Digitalizimi i shpejtë i arkivave dhe dokumenteve, të cilat deri tani ishin të paarritshme, i kryer nga administratat, kompanitë, partitë, gazetat, bibliotekat gjithashtu kontribuon në këtë.

Këto rezultojnë në të dhëna jashtëzakonisht të mëdha për nga volumi, larmia dhe shpejtësia (të njohura si « 3V »), të quajtura zakonisht « të dhëna të mëdha ». Dhe mjetet për t’i nxjerrë, koduar, kuantifikuar dhe analizuar me disa klikime janë zhvilluar së bashku, falë përparimeve të inteligjencës artificiale (IA). Siç thekson Dominique Boullier në librin e tij të fundit ky proces po revolucionarizon peizazhin e shkencave shoqërore, për të mirë dhe për të keqe.

Në këtë drejtim, dy tezë kundërshtojnë njëra-tjetrën që nga lindja e Web-it. Në një artikull me titull provokues, «Fund i Teorisë: Përmbytja e të Dhënave Bën Teorinë Shkencore Obsolete», Chris Anderson, redaktor kryesor i revistës Wired të dedikuar për teknologjitë e reja, e sheh vdekjen e planifikuar të shkencave shoqërore. Lidhjet do të zëvendësojnë shkakun, nuk është nevoja për model shpjegues ose teori të unifikuar dhe «numrat flasin vetë». Në kundërshtim të plotë, kërkues si Burt Monroe ose Gary King e përshëndesin potencialin e rinovimit të teorive dhe metodave që sjellin këto të dhëna dhe mbështesin hibridizimin e shkencave shoqërore dhe të «shkencës së të dhënave».

Në të njëjtën linjë, do të jap disa shembuj që ilustrojnë kontributin e të dhënave të mëdha, veçanërisht për tema të ndjeshme si racizmi ose seksualiteti, të vështira për t'u kuptuar në anketat ose intervistat për shkak të paragjykimeve të «dëshirës shoqërore», ose tundimit ndaj kërkuesit ose kërkuese për të fshehur mendimin e tyre nëse ai nuk është në përputhje me normat shoqërore në fuqi.

Të dhëna të mëdha dhe kërkimi mbi racizmin

Fusha e kërkimeve mbi racizmin, veçanërisht racizmin kundër të zi, është veçanërisht e zhvilluar në Shtetet e Bashkuara dhe disa anketa me sondazh natyrshëm kanë dashur të maten ndikimin e saj potencial mbi votat në favor të Barack Obama në zgjedhjet presidenciale të vitit 2008 dhe 2012. Ato nuk japin rezultate të konfirmuara dhe një kërkues, Seth Stephens-Davidowitz, kishte idenë për të përdorur një tregues të pasaktë të racizmit, përqindjen e kërkimeve në Google që përmbajnë fjalën «nigger(s)» («i zi(i)») gjatë katër viteve para zgjedhjeve, të cilën e lidhte me votat për Obama në 2008 dhe 2012, shtet pas shteti. Pavarësisht ndalimit që vlen për këtë term, ai gjen se «Fjala N» është kërkuar në Google mesatarisht 7 milionë herë në vit. Vetëm përballë ekranit të tij, personi nuk ka asnjë arsye për të censuruar veten. Rezultatet, pas kontrollit, janë pa diskutim. Ata tregojnë se shtetet ku ky term kërkohet më shpesh në Google tejkalojnë gjerësisht kufijtë e shteteve të Jugut tradicionalisht më raciste. Dhe përdorimi i fjalës është negativisht i korreluar me votën për Obama, duke i kushtuar mesatarisht katër pikë përqindjeje në të dy zgjedhjet. Racizmi kundër të zi është mirë i raportuar në anketat me sondazh, dhe ka pasur një ndikim të konsiderueshëm në zgjedhjet. Një fenomen që, deri tani, ishte i pa dukshëm për radarët.

Në Francë, Komisioni Kombëtar Konsultativ për të Drejtat e Njeriut (CNCDH) bën çdo vit një raport tek kryeministri mbi gjendjen e racizmit, antisemitizmit dhe ksenofobisë, duke u mbështetur kryesisht në Barometrin e Racizmit për opinionet, statistikat e siguruara nga ministritë përkatëse për veprimet. Por fjalimet e urrejtjes në rrjetet sociale mbeteshin jashtë fushës së saj të vështrimit. Prandaj vendosi, në vitin 2020, t’i kërkonte Médialab të Sciences Po, të lidhur me Qendrën për Studime Evropiane dhe Politikë të Krahasuar (Sciences Po) dhe Laboratorin Ndërdisiplinor Sciences-inovations-societies (Lisis, Universiteti Gustave-Eiffel) të niste një studim mbi antisemitizmin në internet.

Ekipi vendosi të analizojë për një vit komentet e postuara në kanalet kryesore të lajmeve dhe të informacioneve që gjenden në YouTube, me gjithsej 628. Një korpus prej gati dy milionë komentesh është nxjerrë dhe një algoritëm i trajnuar për të zbuluar antisemitizmin, përfshirë edhe në format më të nënkuptuara. Shpërndarja e fjalimeve antisemitike duket të jetë relativisht e ulët (0, 65 % e totalit të komenteve). Janë kanalet e së djathtës ekstreme ato që përmbajnë më shumë nga këto, të ndjekura nga kanalet e kundër-informacionit dhe të shëndetit alternativ. Temat e komplotit dhe judëofobisë shfaqen më të pranishme se anti-sionizmi. Këto rezultate e nuancojnë teorinë e një « antisemitizmi të ri » të bazuar në anti-sionizëm që zëvendëson atë të vjetrin dhe që ka kaluar nga e djathta ekstreme në të majtën ekstreme. Hetimi është zgjeruar që prej atëherë edhe në forma të tjera të racizmit, përfshirë antimuslimanët, në maskilizëm dhe në konspiracionizëm.

Big data dhe kërkimi mbi seksualitetin

Big data është gjithashtu i vlefshëm për të trajtuar çështjet e gjinisë dhe të seksualitetit. Rregullisht, universiteti francez paraqitet si i infektuar nga studimet mbi gjininë dhe ndërkorshmërinë, përfshirë edhe nga ministrat.

Hetimi i hollësishëm i kryer nga sociologu Étienne Ollion dhe kolegët e tij tregon se nuk është kështu. Duke analizuar vendin që zë çështja e gjinisë në 120 revista shkencash shoqërore gjatë një çerek shekulli, ose një korpus prej 58,000 përmbledhjesh të artikujve, falë një modeli të inteligjencës artificiale (Model i Madh i Gjuhës), artikulli tregon se ajo është rritur nga 9 % në vitin 2001 në 11,4 % të totalit në vitin 2022. Nga një disiplinë në tjetrën, rezultatet janë kontradiktore, përqindja e artikujve që trajtojnë gjininë u rrit nga 33,7 % në 36,6 % në revistat e demografisë në kuptimin e gjerë, por nga 3,3 % në 5,8 % në shkencat politike. Dhe ato janë ende kryesisht veprat e grave. Ndërsa qasjet ndërkulturore që ndërthurin gjininë dhe racën dhe/ose klasën mbeten të rralla (4 % në fund të periudhës).

Marie Bergström, sociologe në Ined, ka përdorur të dhëna të mëdha (big data) për të ndriçuar shkëndijat e diferencës së moshës që vihet re në çiftet heteroseksuale, ku burri është zakonisht më i moshuar se gruaja. Duke ndërthurur rezultatet e hetimit «Studimi i rrugëve individuale dhe bashkëshortore» (Epic), të kryer nga Ined dhe Insee në vitet 2012-2014 me 7,800 persona të pyetur mbi preferencat e tyre për diferencën e moshës, me të dhëna nga faqja e takimeve Meetic (400,000 profile dhe 25 milionë emaile) që informojnë për praktikat e efektshme, ajo thekson diferencën midis asaj që thuhet dhe asaj që bëhet dhe ndryshimet sipas gjinisë.

Në nivel deklarativ, gratë janë më të lidhura me një diferencë moshe në favor të partnerit mashkull, sidomos kur janë të reja, ndërsa burrat thonë se janë indiferentë ndaj moshës. Kështu, 79 % prej tyre thonë se do të pranonin një grua më të moshuar, ndërsa vetëm 53 % e grave do të mendonin për një partner më të ri. Por në faqen e takimeve, është një histori tjetër, diferenca është veçanërisht e dukshme tek meshkujt, qartë dashamirës të grave më të reja, sidomos kur ata plakën.

Rreziqet e të dhënave të mëdha

Rreziqet e të dhënave të mëdha janë po aq të mëdha: jo-reprezentativiteti dhe paqëndrueshmëria e mostrave të pa ndërtuara për nevojat e kërkimit, errësira dhe dështimi i algoritmeve dhe modeleve, vështirësitë në qasjen tek të dhënat, çështjet etike, shkeljet e privatësisë, problemet e sigurisë (vjedhjet, keqpërdorimi i të dhënave), kostot e larta energjetike, dominimi politik i Veriut mbi Jugun, dhe Shtetet e Bashkuara mbi pjesën tjetër të planetit. Kujdesi është i nevojshëm dhe nevoja për rregullore është evidente. Por nuk mund të heqësh dorë nga ky burim i pasur. Dhe gjeneratat e reja të doktorantëve menjëherë e kanë marrë përsipër.

Një numër në rritje i doktorantëve përdorin sot të dhënat e mëdha për temën e tyre të disertacionit dhe bëjnë imitues. Qoftë duke u interesuar për pozicionimin e partive evropiane mbi klimën ose mbi imigracionin, tek politikën energjetike evropiane ose tek kornizën mediatike të grupeve-target, ata arrijnë të ndërtojnë korpusë të mëdhenj me miliona tekste (raporte, tekste legjislative, postime në rrjetet sociale, imazhe, artikuj lajmesh, fjalime parlamentare, komunikata), duke mbuluar disa vende dhe gjatë periudhave të gjata. Për t'i analizuar, ata përdorin Mësimin e Mbikëqyrur (Supervised Learning), duke trajnuar modele të AI-së për të koduar këto tekste në bazë të pyetjes së tyre të kërkimit dhe supozimeve. Kjo u jep atyre mundësinë të rivizitojnë objekte tradicionale të shkencës politike me një sy të ri dhe në një shkallë krejt tjetër, duke u përshtatur në rrjedhën në rritje të shkencave shoqërore të përmirësuara.


_Ky artikull ofrohet në partneritet me kolokumin « Propagimet, një paradigëm i ri për shkencat shoqërore? » (në Cerisy (Manche), nga 25 korrik deri më 31 korrik 2025).

The Conversation

Informacion mbi burimin dhe përkthimin

Ky artikull është përkthyer automatikisht në shqip duke përdorur teknologjinë e avancuar të inteligjencës artificiale.

Burimi origjinal: theconversation.com

Ndajeni këtë artikull