Priimkite panašius duomenis: kaip įmonės mokosi gauti naudos iš didelių duomenų

Analizuodamos didelius duomenis, įmonės išmoksta atskleisti paslėptus modelius, pagerindamos savo verslo rezultatus. Kryptis madinga, tačiau ne visi gali pasinaudoti dideliais duomenimis, nes trūksta darbo su jais kultūros

„Kuo dažnesnis žmogaus vardas, tuo didesnė tikimybė, kad jis sumokės laiku. Kuo daugiau aukštų jūsų namas, tuo labiau statistiškai esate geresnis skolininkas. Zodiako ženklas beveik neturi įtakos pinigų grąžinimo tikimybei, tačiau psichotipas – reikšmingai“, – apie netikėtus skolininkų elgesio modelius sako „Home Credit Bank“ analitikas Stanislavas Dužinskis. Daugelio šių dėsningumų jis nesiima aiškinti – juos atskleidė dirbtinis intelektas, apdorojęs tūkstančius klientų anketų.

Tai yra didžiųjų duomenų analitikos galia: išanalizuodama didžiulį kiekį nestruktūrizuotų duomenų, programa gali atrasti daugybę koreliacijų, apie kurias išmintingiausias žmogaus analitikas net nežino. Bet kuri įmonė turi didžiulį kiekį nestruktūrizuotų duomenų (big data) – apie darbuotojus, klientus, partnerius, konkurentus, kuriuos galima panaudoti verslo naudai: pagerinti akcijų efektą, pasiekti pardavimų augimą, sumažinti darbuotojų kaitą ir pan.

Pirmosios su dideliais duomenimis pradėjo dirbti didelės technologijų ir telekomunikacijų įmonės, finansų įstaigos ir mažmeninė prekyba, komentuoja Rafailas Miftakhovas, Deloitte technologijų integravimo grupės, NVS, direktorius. Dabar tokiais sprendimais susidomėjo daugelis pramonės šakų. Ką įmonės pasiekė? Ir ar didelių duomenų analizė visada veda prie vertingų išvadų?

Nelengva apkrova

Bankai naudoja didžiųjų duomenų algoritmus pirmiausia siekdami pagerinti klientų patirtį ir optimizuoti išlaidas, taip pat valdyti riziką ir kovoti su sukčiavimu. „Pastaraisiais metais didelių duomenų analizės srityje įvyko tikra revoliucija“, - sako Dužinskis. „Mašininio mokymosi naudojimas leidžia daug tiksliau prognozuoti paskolos nevykdymo tikimybę – mūsų banke nusikalstamumas siekia tik 3,9 proc. Palyginimui, 1 m. sausio 2019 d. paskolų su pradelstais mokėjimais daugiau nei 90 dienų dalis fiziniams asmenims išduotose paskolose, Centrinio banko duomenimis, buvo 5 proc.

Net mikrofinansų organizacijas glumina didelių duomenų tyrimas. „Šiandien teikti finansines paslaugas neanalizuojant didelių duomenų yra tarsi matematika be skaičių“, – sako Andrejus Ponomarevas, internetinės skolinimo platformos Webbankir generalinis direktorius. „Pinigus išduodame internetu nematydami nei kliento, nei jo paso ir, skirtingai nei tradicinis skolinimas, turime ne tik įvertinti asmens mokumą, bet ir identifikuoti jo asmenybę.

Dabar įmonės duomenų bazėje saugoma informacija apie daugiau nei 500 tūkstančių klientų. Kiekviena nauja programa yra analizuojama pagal šiuos duomenis apie 800 parametrų. Programa atsižvelgia ne tik į lytį, amžių, šeimyninę padėtį ir kredito istoriją, bet ir į įrenginį, iš kurio žmogus pateko į platformą, kaip jis elgėsi svetainėje. Pavyzdžiui, nerimą gali kelti tai, kad potencialus skolininkas nepasinaudojo paskolos skaičiuokle arba nepasiteiravo apie paskolos sąlygas. „Išskyrus kelis stabdymo veiksnius – tarkime, mes neišduodame paskolų jaunesniems nei 19 metų asmenims – nė vienas iš šių parametrų savaime nėra priežastis atsisakyti ar sutikti išduoti paskolą“, – aiškina Ponomarevas. Svarbu yra veiksnių derinys. 95% atvejų sprendimas priimamas automatiškai, nedalyvaujant draudimo skyriaus specialistams.

Teikti finansines paslaugas neanalizuojant didelių duomenų šiandien prilygsta matematikai be skaičių.

Didžiųjų duomenų analizė leidžia mums išvesti įdomius modelius, dalijasi Ponomarevas. Pavyzdžiui, iPhone vartotojai pasirodė drausmingesni skolininkai nei Android įrenginių savininkai – pirmieji paraiškų patvirtinimą gauna 1,7 karto dažniau. „Tai, kad kariškiai paskolų negrąžina beveik ketvirtadaliu rečiau nei vidutinis skolininkas, nenustebino“, – sako M. Ponomarevas. „Tačiau paprastai nesitikima, kad studentai bus įpareigoti, tačiau tuo tarpu kredito įsipareigojimų nevykdymo atvejai yra 10% mažiau paplitę nei bazinis vidurkis.

Didžiųjų duomenų tyrimas leidžia įvertinti balus ir draudikams. 2016 m. įkurta IDX užsiima nuotoliniu identifikavimu ir dokumentų tikrinimu internetu. Šios paslaugos yra paklausios tarp krovinių draudikų, kurie domisi kuo mažiau prekių praradimu. Prieš apdrausdamas krovinių gabenimą, draudikas, vairuotojui sutikus, patikrina patikimumą, – aiškina IDX komercijos direktorius Janas Sloka. Kartu su partneriu – Sankt Peterburgo įmone „Risk Control“ – IDX sukūrė paslaugą, leidžiančią patikrinti vairuotojo tapatybę, paso duomenis ir teises, dalyvavimą incidentuose, susijusiuose su krovinio praradimu ir kt. vairuotojų duomenų bazėje įmonė nustatė „rizikos grupę“: dažniausiai kroviniai prarandami tarp 30–40 metų vairuotojų, turinčių ilgą vairavimo stažą, kurie pastaruoju metu dažnai keičia darbą. Taip pat paaiškėjo, kad krovinius dažniausiai vagia automobilių, kurių eksploatacijos laikas viršija aštuonerius metus, vairuotojai.

Paieškoje

Mažmenininkams tenka kita užduotis – identifikuoti pirkėjus, kurie pasiruošę pirkti, ir nustatyti efektyviausius būdus, kaip juos atvesti į svetainę ar parduotuvę. Tuo tikslu programos analizuoja klientų profilį, duomenis iš jų asmeninės paskyros, pirkimų istoriją, paieškos užklausas ir bonuso taškų panaudojimą, elektroninių krepšelių, kuriuos jie pradėjo pildyti ir atsisakė, turinį. Duomenų analizė leidžia segmentuoti visą duomenų bazę ir nustatyti potencialių pirkėjų grupes, kurios gali susidomėti konkrečiu pasiūlymu, sako M.Video-Eldorado grupės duomenų biuro direktorius Kirilas Ivanovas.

Pavyzdžiui, programa identifikuoja klientų grupes, kurių kiekviena mėgsta skirtingas rinkodaros priemones – paskolą be palūkanų, pinigų grąžinimą ar nuolaidos reklamos kodą. Šie pirkėjai el. paštu gauna naujienlaiškį su atitinkama akcija. Tikimybė, kad žmogus, atsivertęs laišką, pateks į įmonės internetinį puslapį, tokiu atveju gerokai išauga, pastebi Ivanovas.

Duomenų analizė taip pat leidžia padidinti susijusių produktų ir priedų pardavimą. Sistema, apdorojusi kitų klientų užsakymų istoriją, pateikia pirkėjui rekomendacijas, ką pirkti kartu su pasirinkta preke. Išbandžius šį darbo metodą, Ivanovo teigimu, užsakymų su priedais skaičius išaugo 12%, o priedų apyvarta – 15%.

Mažmenininkai nėra vieninteliai, kurie siekia gerinti paslaugų kokybę ir didinti pardavimus. Praėjusią vasarą „MegaFon“ pristatė „išmaniojo“ pasiūlymo paslaugą, pagrįstą milijonų abonentų duomenų apdorojimu. Ištyręs jų elgesį, dirbtinis intelektas išmoko kiekvienam klientui sudaryti asmeninius pasiūlymus pagal tarifus. Pavyzdžiui, jei programa pažymi, kad asmuo savo įrenginyje aktyviai žiūri vaizdo įrašą, paslauga jam pasiūlys išplėsti mobiliojo ryšio srautą. Atsižvelgdama į vartotojų pageidavimus, bendrovė suteikia abonentams neribotą srautą mėgstamam laisvalaikiui internete – pavyzdžiui, naudojantis momentiniais pasiuntiniais ar klausytis muzikos transliacijos paslaugose, kalbėtis socialiniuose tinkluose ar žiūrėti televizijos laidas.

„Mes analizuojame abonentų elgesį ir suprantame, kaip keičiasi jų interesai“, – aiškina Vitalijus Ščerbakovas, „MegaFon“ didelių duomenų analizės direktorius. „Pavyzdžiui, šiemet „AliExpress“ srautas, palyginti su praėjusiais metais, išaugo 1,5 karto, o apskritai apsilankymų internetinėse drabužių parduotuvėse skaičius auga: 1,2–2 kartus, priklausomai nuo konkretaus resurso.

Kitas operatoriaus, turinčio didelius duomenis, darbo pavyzdys – platforma „MegaFon Poisk“, skirta dingusių vaikų ir suaugusiųjų paieškai. Sistema analizuoja, kurie žmonės galėtų būti šalia dingusio asmens, ir siunčia jiems informaciją su dingusio žmogaus nuotrauka bei ženklais. Operatorius kūrė ir išbandė sistemą kartu su Vidaus reikalų ministerija ir Lisa Alert organizacija: per dvi minutes nuo orientacijos į dingusį asmenį gauna daugiau nei 2 tūkstančius abonentų, o tai žymiai padidina sėkmingo paieškos rezultato tikimybę.

Neik į PUB

Didelių duomenų analizė taip pat buvo pritaikyta pramonėje. Čia galite prognozuoti paklausą ir planuoti pardavimus. Taigi Cherkizovo įmonių grupėje prieš trejus metus buvo įdiegtas SAP BW pagrindu sukurtas sprendimas, leidžiantis saugoti ir apdoroti visą pardavimo informaciją: kainas, asortimentą, prekių kiekius, akcijas, platinimo kanalus“, – sako CIO Vladislavas Beliajevas. grupės "Čerkizovo". Sukauptos 2 TB informacijos analizė ne tik leido efektyviai formuoti asortimentą ir optimizuoti prekių portfelį, bet ir palengvino darbuotojų darbą. Pavyzdžiui, kasdienei pardavimų ataskaitai parengti prireiktų daugelio analitikų darbo dienos – po du kiekvienam produkto segmentui. Dabar šią ataskaitą rengia robotas, visiems segmentams skirdamas tik 30 minučių.

„Pramonėje dideli duomenys efektyviai veikia kartu su daiktų internetu“, – sako Stanislavas Meshkovas, „Umbrella IT“ generalinis direktorius. „Remiantis įrangoje įrengtų jutiklių duomenų analize, galima nustatyti jos veikimo nukrypimus ir išvengti gedimų bei numatyti našumą.

„Severstalyje“ pasitelkus didžiuosius duomenis bandoma spręsti ir gana nebanalias užduotis – pavyzdžiui, sumažinti traumų skaičių. 2019 metais darbo saugos gerinimo priemonėms įmonė skyrė apie 1,1 mlrd. „Severstal“ tikisi sužalojimų skaičių sumažinti 2025 proc., 50 (palyginti su 2017 m.). „Jei tiesioginis vadovas – meistras, aikštelės vadovas, cecho viršininkas – pastebėjo, kad darbuotojas nesaugiai atlieka tam tikras operacijas (gamybinėje aikštelėje lipdamas laiptais nesilaiko už turėklų arba nedėvi visų asmeninių apsaugos priemonių), išrašo. speciali pastaba jam – PAB (iš „elgesio saugumo audito“)“, – sako įmonės duomenų analizės skyriaus vadovas Borisas Voskresenskis.

Išanalizavę duomenis apie PAB skaičių viename iš padalinių, bendrovės specialistai nustatė, kad dažniausiai saugos taisykles pažeidinėja tie, kurie jau anksčiau turėjo keletą pastabų, taip pat tie, kurie prieš pat buvo nedarbingumo atostogose ar atostogauja. Incidentas. Pažeidimai pirmą savaitę po grįžimo iš atostogų ar nedarbingumo buvo dvigubai didesni nei vėlesniu laikotarpiu: 1, palyginti su 0,55 proc. Bet darbas naktinėje pamainoje, kaip paaiškėjo, PAB statistikai įtakos neturi.

Atsiribojęs nuo realybės

Didžiųjų duomenų apdorojimo algoritmų kūrimas nėra pati sunkiausia darbo dalis, teigia įmonės atstovai. Kur kas sunkiau suprasti, kaip šias technologijas galima pritaikyti kiekvieno konkretaus verslo kontekste. Čia slypi Achilo kulnas įmonių analitikų ir net išorinių tiekėjų, kurie, atrodytų, yra sukaupę kompetenciją didžiųjų duomenų srityje.

„Dažnai sutikdavau didžiųjų duomenų analitikus, kurie buvo puikūs matematikai, bet neturėjo reikiamo verslo procesų supratimo“, – sako Sergejus Kotikas, „GoodsForecast“ plėtros direktorius. Jis prisimena, kaip prieš dvejus metus jo įmonė turėjo galimybę dalyvauti federalinio prekybos tinklo paklausos prognozavimo konkurse. Buvo pasirinktas bandomasis regionas, kurio visoms prekėms ir parduotuvėms dalyviai darė prognozes. Tada prognozės buvo palygintos su faktiniais pardavimais. Pirmąją vietą užėmė vienas Rusijos interneto gigantų, garsėjantis mašininio mokymosi ir duomenų analizės kompetencija: savo prognozėse jis rodė minimalų nukrypimą nuo faktinių pardavimų.

Tačiau kai tinklas pradėjo išsamiau tyrinėti jo prognozes, paaiškėjo, kad verslo požiūriu jos yra visiškai nepriimtinos. Bendrovė pristatė modelį, pagal kurį pardavimų planai buvo sistemingai nuvertinami. Programa sugalvojo, kaip sumažinti prognozių klaidų tikimybę: saugiau neįvertinti pardavimų, nes maksimali paklaida gali būti 100% (neigiamų pardavimų nėra), tačiau perspėjimo kryptimi ji gali būti savavališkai didelė, Kotikas paaiškina. Kitaip tariant, bendrovė pristatė idealų matematinį modelį, kuris realiomis sąlygomis lemtų pustuštes parduotuves ir didžiulius nuostolius dėl per mažo pardavimo. Dėl to konkursą laimėjo kita įmonė, kurios skaičiavimus buvo galima pritaikyti praktiškai.

„Galbūt“ vietoj didelių duomenų

Didžiųjų duomenų technologijos yra aktualios daugeliui pramonės šakų, tačiau jų aktyvus diegimas vyksta ne visur, pažymi Meshkovas. Pavyzdžiui, sveikatos priežiūros srityje yra duomenų saugojimo problema: sukaupta daug informacijos ir ji nuolat atnaujinama, tačiau didžioji dalis šių duomenų dar nėra suskaitmeninti. Duomenų daug ir valstybinėse įstaigose, tačiau jie nėra sujungti į bendrą klasterį. Šią problemą siekiama išspręsti kuriant vieningą Nacionalinės duomenų valdymo sistemos (NKVS) informacinę platformą, teigia ekspertas.

Tačiau mūsų šalis toli gražu nėra vienintelė šalis, kurioje daugumoje organizacijų svarbūs sprendimai priimami remiantis intuicija, o ne didžiųjų duomenų analize. Praėjusių metų balandį „Deloitte“ atliko apklausą, kurioje dalyvavo daugiau nei tūkstantis stambių Amerikos kompanijų (kuriose dirba 500 ir daugiau darbuotojų) vadovų ir išsiaiškino, kad 63% apklaustųjų yra susipažinę su didžiųjų duomenų technologijomis, bet neturi visų reikalingų. infrastruktūrą jais naudotis. Tuo tarpu iš 37% įmonių, turinčių aukštą analitinės brandos lygį, beveik pusė per pastaruosius 12 mėnesių gerokai viršijo verslo tikslus.

Tyrimas atskleidė, kad be sunkumų diegiant naujus techninius sprendimus, svarbi problema įmonėse yra darbo su duomenimis kultūros trūkumas. Nereikėtų tikėtis gerų rezultatų, jei atsakomybė už sprendimus, priimtus remiantis didžiaisiais duomenimis, priskiriama tik įmonės analitikams, o ne visai įmonei. „Dabar įmonės ieško įdomių didelių duomenų panaudojimo atvejų“, – sako Miftakhovas. „Tuo pačiu metu, įgyvendinant kai kuriuos scenarijus, reikia investuoti į papildomų duomenų, kurie anksčiau nebuvo analizuojami, rinkimo, apdorojimo ir kokybės kontrolės sistemas. Deja, „analitika dar nėra komandinis sportas“, – pripažįsta tyrimo autoriai.

Palikti atsakymą