Kas renka didelius duomenis ir kodėl?

2019 metų rudenį įsiplieskė skandalas dėl „Apple Card“ paslaugos: registruodamasi ji išdavė skirtingus kredito limitus vyrams ir moterims. Net Steve'ui Wozniakui nepasisekė:

Metais anksčiau buvo atskleista, kad „Netflix“ platformoje vartotojams rodomi skirtingi plakatai ir anonsai, atsižvelgiant į jų lytį, amžių ir tautybę. Už tai tarnyba buvo apkaltinta rasizmu.

Galiausiai Markas Zuckerbergas nuolat sulaukia priekaištų už tai, kad „Facebook“ tariamai rinko, pardavė ir manipuliavo savo vartotojų duomenimis. Bėgant metams jis buvo apkaltintas ir net bandytas manipuliuoti per Amerikos rinkimus, pagalba Rusijos specialiosioms tarnyboms, neapykantos ir radikalių pažiūrų kurstymas, netinkama reklama, vartotojų duomenų nutekinimas, trukdymas tyrimams prieš pedofilus.

„Facebook“ įrašas, kurį sukūrė zuck

Tuo pat metu internetinė paslauga „Pornhub“ kasmet skelbia ataskaitas apie tai, kokios pornografijos ieško skirtingų tautybių, lyties ir amžiaus žmonės. Ir kažkodėl tai niekam netrukdo. Nors visos šios istorijos yra panašios: kiekvienoje iš jų susiduriame su dideliais duomenimis, kurie XNUMX amžiuje buvo vadinami „nauja nafta“.

Kas yra dideli duomenys

Dideli duomenys – jie taip pat yra dideli duomenys (angl. Big Data) arba metaduomenys – yra duomenų rinkinys, gaunamas reguliariai ir dideliais kiekiais. Jie renkami, apdorojami ir analizuojami, todėl gaunami aiškūs modeliai ir modeliai.

Ryškus pavyzdys yra duomenys iš didelio hadronų greitintuvo, kuris gaunamas nuolat ir dideliais kiekiais. Su jų pagalba mokslininkai išsprendžia daugybę problemų.

Tačiau dideli žiniatinklio duomenys yra ne tik mokslinių tyrimų statistika. Jie gali būti naudojami norint sekti, kaip elgiasi skirtingų grupių ir tautybių vartotojai, į ką jie atkreipia dėmesį ir kaip sąveikauja su turiniu. Kartais tam duomenys renkami ne iš vieno šaltinio, o iš kelių, lyginant ir identifikuojant tam tikrus modelius.

Apie tai, kokie svarbūs dideli duomenys tinkle, jie pradėjo kalbėti tada, kai jų buvo tikrai daug. 2020 metų pradžioje pasaulyje buvo 4,5 milijardo interneto vartotojų, iš kurių 3,8 milijardai buvo registruoti socialiniuose tinkluose.

Kas turi prieigą prie didelių duomenų

Apklausų duomenimis, daugiau nei pusė mūsų šalių mano, kad jų duomenimis tinkle naudojasi trečiosios šalys. Tuo pačiu metu daugelis socialiniuose tinkluose ir programose skelbia asmeninę informaciją, nuotraukas ir net telefono numerį.

Kas renka didelius duomenis ir kodėl?
Kas renka didelius duomenis ir kodėl?
Kas renka didelius duomenis ir kodėl?
Kas renka didelius duomenis ir kodėl?

Čia reikia paaiškinti: pirmasis asmuo yra pats vartotojas, kuri talpina savo duomenis bet kuriame išteklyje ar programoje. Kartu jis sutinka (sutartyje pažymi varnelę) su šių duomenų tvarkymu antroji šalis – tai ištekliaus savininkai. Trečioji šalis yra ta, kuriai išteklių savininkai gali perduoti arba parduoti vartotojo duomenis. Dažnai tai parašyta vartotojo sutartyje, bet ne visada.

Trečioji šalis yra vyriausybinės agentūros, įsilaužėliai ar įmonės, perkančios duomenis komerciniais tikslais. Pirmieji duomenis gali gauti teismo ar aukštesnės institucijos sprendimu. Piratai, žinoma, nenaudoja jokių leidimų – tiesiog įsilaužia į serveriuose saugomas duomenų bazes. Įmonės (pagal įstatymą) gali prieiti prie duomenų tik tuo atveju, jei patys juos leidote – pažymėdami langelį po sutartimi. Priešingu atveju tai yra neteisėta.

Kodėl įmonės naudoja „Big Data“?

Didieji duomenys komercinėje srityje buvo naudojami dešimtmečius, tik jie nebuvo tokie intensyvūs kaip dabar. Tai, pavyzdžiui, stebėjimo kamerų įrašai, GPS navigatorių duomenys ar mokėjimai internetu. Dabar, tobulėjant socialiniams tinklams, internetinėms paslaugoms ir programoms, visa tai galima sujungti ir susidaryti kuo išsamesnį vaizdą: kur gyvena potencialūs klientai, ką mėgsta žiūrėti, kur atostogauja ir kokios markės automobilį turi.

Iš aukščiau pateiktų pavyzdžių aišku, kad didžiųjų duomenų pagalba įmonės, visų pirma, nori nukreipti skelbimus. Tai yra, siūlyti produktus, paslaugas ar individualias galimybes tik reikiamai auditorijai ir netgi pritaikyti produktą konkrečiam vartotojui. Be to, reklama „Facebook“ ir kitose didelėse platformose vis brangsta, o ją rodyti visiems iš eilės visiškai neapsimoka.

Informaciją apie potencialius klientus iš atvirų šaltinių aktyviai naudoja draudimo bendrovės, privačios klinikos ir darbdaviai. Pavyzdžiui, pirmieji gali pakeisti draudimo sąlygas, jei mato, kad dažnai ieškote informacijos apie tam tikras ligas ar vaistus, o darbdaviai gali įvertinti, ar esate linkęs į konfliktus ir asocialų elgesį.

Tačiau yra ir kita svarbi užduotis, su kuria pastaraisiais metais sunkiai sekasi – priartėti prie mokiausios publikos. Tai padaryti nėra taip paprasta, nors užduotį gerokai palengvina mokėjimo paslaugos ir elektroniniai čekiai per vieną OFD (fiskalinių duomenų operatorių). Siekdamos kuo arčiau priartėti, įmonės net nuo vaikystės stengiasi susekti ir „auklėti“ potencialius klientus.: per internetinius žaidimus, interaktyvius žaislus ir švietimo paslaugas.

Kaip tai veikia?

Didžiausias duomenų rinkimo galimybes suteikia pasaulinės korporacijos, kurios vienu metu valdo kelias paslaugas. „Facebook“ dabar turi daugiau nei 2,5 milijardo aktyvių vartotojų. Tuo pat metu įmonei priklauso ir kitos paslaugos: „Instagram“ – daugiau nei 1 mlrd., „WhatsApp“ – daugiau nei 2 mlrd. ir kt.

Tačiau „Google“ turi dar didesnę įtaką: „Gmail“ naudojasi 1,5 milijardo žmonių pasaulyje, dar 2,5 milijardo – „Android“ mobiliosios OS, daugiau nei 2 milijardai – „YouTube“. Ir tai neskaičiuojant „Google“ paieškos ir „Google“ žemėlapių programų, „Google Play“ parduotuvės ir „Chrome“ naršyklės. Belieka prisegti savo internetinį banką – ir „Google“ apie jus žinos viską. Beje, „Yandex“ šiuo atžvilgiu jau yra žingsniu priekyje, tačiau ji apima tik rusakalbę auditoriją.



???? Pirmiausia įmonės domisi, ką mes skelbiame ir mėgstame socialiniuose tinkluose. Pavyzdžiui, jei bankas pamatys, kad esate vedęs ir aktyviai mėgstate merginas „Instagram“ ar „Tinder“, greičiausiai pritarsite vartojimo paskolai. Ir dingo būsto paskola šeimai.

Taip pat svarbu, kokius skelbimus spustelėjate, kaip dažnai ir kokiu rezultatu.

(T.y Kitas žingsnis – privačios žinutės: jose daug daugiau informacijos. Žinutės buvo nutekintos per „VKontakte“, „Facebook“, „WhatsApp“ ir kitus momentinius pasiuntinius. Anot jų, beje, geografinę vietą žinutės išsiuntimo metu atsekti nesunku. Tikrai pastebėjote: kai su kuo nors diskutuojate apie pirkimą ar tiesiog užsisakę picą, sklaidos kanale iš karto atsiranda aktuali reklama.

🚕 Didelius duomenis aktyviai naudoja ir „nutekina“ pristatymo ir taksi paslaugos. Jie žino, kur tu gyveni ir dirbi, ką mėgsti, kokios tavo apytikslės pajamos. Pavyzdžiui, „Uber“ rodo didesnę kainą, jei važiuojate namo iš baro ir akivaizdžiai persistengėte. O kai telefone turėsi krūvą kitų agregatorių, priešingai, jie pasiūlys pigesnius.

(T.y Yra paslaugų, kurios naudoja nuotraukas ir vaizdo įrašus, kad surinktų kuo daugiau informacijos. Pavyzdžiui, kompiuterinės vizijos bibliotekos – „Google“ tokią turi. Jie nuskaito jus ir jūsų aplinką, kad sužinotų, kokio dydžio ar ūgio esate, kokius prekės ženklus dėvite, kokį automobilį vairuojate, ar turite vaikų ar augintinių.

(T.y Tie, kurie teikia SMS žinutes bankams savo laiškams, gali stebėti jūsų pirkinius kortelėje – žinant paskutinius 4 skaitmenis ir telefono numerį – ir tada parduoti šiuos duomenis kam nors kitam. Taigi visas šis šlamštas su nuolaidomis ir pica kaip dovana.

🤷️️ Galiausiai mes patys nutekiname savo duomenis į kairiąsias paslaugas ir programas. Prisiminkite tą ažiotažą apie Getcontact, kai visi mielai užpildė savo telefono numerį, kad sužinotų, kaip jį parašė kiti. O dabar suraskite jų sutikimą ir perskaitykite, kas jame parašyta apie jūsų duomenų perdavimą (spoileris: savininkai gali perduoti juos trečiosioms šalims savo nuožiūra):

Kas renka didelius duomenis ir kodėl?

Korporacijos gali sėkmingai rinkti ir net parduoti naudotojų duomenis ilgus metus, kol iškeliauja byla – kaip atsitiko su tuo pačiu „Facebook“. O tuomet lemiamą vaidmenį suvaidino įmonės padarytas GDPR – įstatymo ES, kuris riboja duomenų naudojimą daug griežčiau nei amerikietiškas – pažeidimas. Kitas nesenas pavyzdys – antivirusinis „Avast“ skandalas: viena iš antrinių įmonės paslaugų rinko ir pardavė duomenis nuo 100 iki 400 milijonų vartotojų.

Bet ar visa tai mums turi kokių nors pranašumų?

Kaip dideli duomenys padeda mums visiems?

Taip, yra ir šviesioji pusė.

Dideli duomenys padeda sugauti nusikaltėlius ir užkirsti kelią teroristiniams išpuoliams, rasti dingusius vaikus ir apsaugoti juos nuo pavojų.

Su jų pagalba mes sulaukiame šaunių pasiūlymų iš bankų ir asmeninių nuolaidų. Jų dėka mes mes nemokame už daugybę paslaugų ir socialinių tinklų, kurie uždirba tik iš reklamos. Priešingu atveju vien „Instagram“ mums kainuotų kelis tūkstančius dolerių per mėnesį.

Vien „Facebook“ turi 2,4 milijardo aktyvių vartotojų. Tuo pačiu metu jų pelnas 2019 m. siekė 18,5 mlrd. Pasirodo, įmonė per reklamą iš kiekvieno vartotojo uždirba iki 7,7 USD per metus.

Galiausiai, kartais tai tiesiog patogu: kai tarnybos jau žino, kur esate ir ko norite, ir jums nereikia patiems ieškoti reikalingos informacijos.

Kita perspektyvi didžiųjų duomenų taikymo sritis yra švietimas.

Viename iš Amerikos universitetų Virdžinijoje buvo atliktas tyrimas, kurio metu buvo surinkti duomenys apie vadinamosios rizikos grupės studentus. Tai tie, kurie prastai mokosi, praleidžia pamokas ir ruošiasi mesti studijas. Faktas yra tas, kad valstijose kasmet atimama apie 400 žmonių. Tai blogai ir universitetams, kuriems mažinami reitingai ir mažinamas finansavimas, ir patiems studentams: daugelis ima mokslui paskolas, kurias atskaičius vis tiek teks grąžinti. Jau nekalbant apie prarastą laiką ir karjeros perspektyvas. Didžiųjų duomenų pagalba galima laiku atpažinti atsilikusius ir pasiūlyti jiems kuratorių, papildomus užsiėmimus ir kitą tikslinę pagalbą.

Tai, beje, tinka ir mokykloms: tada sistema praneš mokytojams ir tėvams – sako, vaikas turi problemų, padėkime jam kartu. „Big Data“ taip pat padės suprasti, kurie vadovėliai veikia geriau, o kurie mokytojai lengviau paaiškina medžiagą.

Kitas teigiamas pavyzdys – karjeros profiliavimas.: tai yra tada, kai paaugliams padedama apsispręsti dėl būsimos profesijos. Čia dideli duomenys leidžia rinkti informaciją, kurios negalima gauti naudojant tradicinius testus: kaip vartotojas elgiasi, į ką atkreipia dėmesį, kaip sąveikauja su turiniu.

Toje pačioje JAV veikia profesinio orientavimo programa – SC ACCELERATE. Jame, be kita ko, naudojama „CareerChoice“ GPS technologija: jie analizuoja duomenis apie mokinių prigimtį, jų polinkius į dalykus, stipriąsias ir silpnąsias puses. Tada duomenys naudojami siekiant padėti paaugliams pasirinkti jiems tinkamas kolegijas.


Prenumeruokite ir sekite mus Yandex.Zen – technologijos, inovacijos, ekonomika, švietimas ir bendrinimas viename kanale.

Palikti atsakymą