Ce înseamnă Big Data şi cum ne va afecta viaţa această tehnologie?

marți, 28 septembrie 2021, 01:51
1 MIN
 Ce înseamnă Big Data şi cum ne va afecta viaţa această tehnologie?

Big Data înseamnă procesare, analiză şi predicţie având la dispoziţie capacităţi imense de stocare a datelor din mediul digital. Aceste date sunt frecvent descrise de o componentă a informaticii numită Artificial Intelligence – AI (inteligenţă artificială), mai exact de un domeniu al AI numit „învăţare automatizată” care, mai pe înţelesul tuturor, înseamnă matematică aplicată în procesarea unui volum mare de date pentru a obţine probabilităţi. 

În anul 2019, a fost descoperit un nou virus gripal, o combinaţie de elemente de la viruşii care provoacă gripa aviară şi cea porcină. Să ne reamintim de A(H1N1), după cum a fost denumit noul virus gripal, şi de teama autorităţilor medicale de atunci în faţa declanşării unei pandemii. La data de 1 iunie 2009, un număr de 62 tari raportaseră oficial 17.410 cazuri de gripă A(H1N1) varianta 2009 soldate cu 115 decese.

În România, primul caz de gripă A(H1N1) s-a înregistrat pe data de 27 mai 2009. Câteva zile mai târziu, au mai apărut câteva cazuri de persoane infectate cu acest virus gripal, venite din SUA unde au contactat acest virus gripal1. Dar nu despre viruşi mi-am propus să vorbesc în articolul din această săptămână, ci despre Big Data, o tehnologie prin care gigantul american Google a prezis mult mai rapid decât statistica sistemului medical din SUA aria de răspândire a virusului gripal A(H1N1).

Inginerii de la Google au analizat ce anume caută oamenii pe Internet (cca. 3 miliarde de căutări zilnice), luând în calcul 50 de milioane de termeni cel mai des întâlniţi în aceste căutări, pe care le-au comparat cu datele furnizate de Centrul pentru răspândirea gripei sezoniere între 2003 şi 2008. Ideea (ipoteza de lucru) era că oamenii infectaţi cu virusul gripal puteau fi identificaţi după căutările pe Internet (medicamente, consiliere medicală, cabinete medicale, programare la medici ş.a.). Rezultatele cercetării au fost publicate sub forma unui articol în cunoscuta revistă Nature2.

Algoritmul Google a căutat corelaţii între frecvenţa anumitor căutări şi răspândirea gripei în timp şi spaţiu, procesând un număr de 450 de milioane de modele matematice diferite pentru a testa termenii de căutare şi comparând predicţiile acestora cu cazurile reale de la Centrul pentru Controlul şi Prevenirea Bolilor. În acest fel, softul a găsit o combinaţie de 45 de termeni care, utilizaţi într-un model matematic, creau o corelaţie de 97% între predicţia lor şi datele oficiale. Atunci când s-a declanşat criza A(H1N1) din 2009, algoritmul Google a redus decalajul de raportare faţă de statistica medicală care se bazează pe datele privind vizitele pacienţilor la medici. Acest lucru a fost posibil prin procesarea şi analizarea unui volum enorm de date (Big Data). De atunci am intrat într-o eră nouă a tehnologiei digitale despre care nu ştim exact ce consecinţe va avea asupra vieţii noastre.

În esenţă, Big Data se referă la ştiinţa/ metoda/ abilitatea de a prelucra un volum mare (uriaş) de date, de a le analiza instantaneu şi uneori de a trage concluzii surprinzătoare. Potrivit lui V. Mayer-Schönberger şi K. Cukier, Big Data reprezintă „o revoluţie comparabilă cu Internetul”3, care va schimba fundamental modul în care trăim şi gândim: educaţia, cercetarea, afacerile, sănătatea şi, nu în ultimul rând, politica. Ceea ce a reprezentat tiparul, microscopul, telescopul în istoria umanităţii, tot aşa şi Big Data va marca definitiv viaţa oamenilor. De exemplu, pe baza procesării şi analizei profilurilor afişate pe reţelele de socializare şi a căutărilor pe platformele online, algoritmii vor putea identifica persoanele care prezintă un potenţial infracţional/ criminogen şi, eventual, cineva va putea decide să le sancţioneze preventiv.

Orice urmă digitală rezultată din accesarea unui dispozitiv informatic conectat la Internet este stocată şi analizată pentru a servi unor scopuri diverse: comerciale, politice, militare şi de alt gen. Tehnologia Big Data permite analiştilor, cercetătorilor şi utilizatorilor să ia decizii mai bune şi mai rapide, utilizând date care anterior erau inaccesibile sau inutilizabile:

  • date de pe dispozitive inteligente sau senzori (de la o maşină la alta, senzori digitali, etichete de identificare a frecvenţei radio etc.);
  • date de geolocalizare rezultate din utilizarea dispozitivelor portabile conectate prin telefoane mobile, conexiuni wireless sau GPS;
  • date furnizate de accesarea reţelelor de socializare (reţele sociale, bloguri, site-uri web de partajare a conţinutului multimedia);
  • date generate de tranzacţiile bancare, comerciale, alte date web deschise.

Big Data înseamnă procesare, analiză şi predicţie având la dispoziţie capacităţi imense de stocare a datelor din mediul digital. Aceste date sunt frecvent descrise de o componentă a informaticii numită Artificial Intelligence AI (inteligenţă artificială), mai exact de un domeniu al AI numit „învăţare automatizată” care, mai pe înţelesul tuturor, înseamnă matematică aplicată în procesarea unui volum mare de date pentru a obţine probabilităţi. Compania Amazon utilizează AI pentru a ne recomanda cele mai bune cărţi, Google determină cele mai relevante site-uri web în funcţie de profilul şi căutările noastre anterioare, Facebook ştie ce ne place pentru că atunci când ne conectăm pe această reţea de socializare vizualizăm anumite postări şi dăm like-uri, iar LinkedIn ghiceşte pe cine cunoaştem ţinând cont de profilul şi interesele profesionale afişate.

Cu siguranţă, statistica oficială, domeniul în care activez în prezent, va fi profund marcat de aplicaţiile Big Data. În momentul în care bazele de date provenite din surse administrative vor fi interconectate şi în România, vor începe să ruleze şi aplicaţiile de tip Big Data. În unele domenii se întâmplă deja acest lucru. Introducerea acestor aplicaţii va însemna sfârşitul utilizării eşantioanelor în cercetările statistice. Să luăm ca exemplu ancheta statistică „indicii preţurilor de consum”. Conform metodologiei INS, observarea şi înregistrarea preţurilor se realizează de către operatori statistici în cele 42 de oraşe reşedinţă de judeţ din care sunt selectate 68 de centre de cercetare, în eşantion fiind cuprinse cca. 7200 de unităţi economice. Tehnologia Big Data nu are nevoie de eşantion, nici de operatori statistici, întrucât permite culegerea şi analiza datelor despre toate preţurile la bunurile alimentare, mărfurile nealimentare şi servicii afişate în mediul online.

Big Data înseamnă nu numai estimări de calitate, reducerea timpului de lucru pentru procesare, analiză şi diseminare de date, ci şi reducerea personalului. În era Big Data, a Inteligenţei Artificiale, a algoritmilor şi Machine Learning-urilor, multe meserii vor dispare şi odată cu acestea locurile de muncă. Nu degeaba Elon Musk, CEO-ul Tesla, propune instituirea unui venit universal de bază în contextul în care roboţii şi maşinile inteligente vor lăsa oamenii fără ocupaţii.

 

1 Institutul de Virusologie „Stefan S. Nicolau” al Academiei Romane, Date privind epidemia de gripă A(H1N1) varianta 2009.

2 Jeremy Ginsburg et al., „Detecting influenza epidemics using search engine query data”, Nature, vol. 457/ 2009.

3 Victor Mayer-Schönberger & Kenneth Cukier, Big Data. O revoluţie care va transforma felul în care trăim, muncim şi gândim, Editura Pact şi Politon, Bucureşti, 2018.

 

Ciprian Iftimoaei este director adjunct la Direcţia Judeţeană de Statistică Iaşi şi lector asociat doctor la Facultatea de Filosofie şi Ştiinţe Social-Politice a Universităţii „Al. I. Cuza” din Iaşi

Comentarii