ERSTE tim – Data Science: Dinamičan svet velikih podataka
Upoznajte se sa dinamičnim svetom velikih podataka, koji koristi Data Science i modele za predviđanje, u našem novom blogu koji pišu Mina Petrović i Boško Rabrenović, eksperti iz Odeljenja za naprednu analitiku i upravljanje podacima rizika.
U bankarskom svetu nije sva pažnja usmerena na novac i ljude koji sede u lepim kancelarijama, iako je većini to prva asocijacija. Da bi banka zapravo kreirala taj novac, mora da donosi ispravne odluke u skladu sa analizama trenutnog poslovanja, a u velikoj meri i budućih prognoza i očekivanja, gde Data Science ima značajnu ulogu.
A šta za banku predstavlja Data Science? To je način da se od velikog broja skladištenih podataka stvori vredno i merljivo znanje, optimizuju šablonski procesi i time uštedi vreme i novac, kako za klijente tako i za banku. Ali nije sve ni u velikom broju prodatih kredita i otvorenih računa, ima nešto i unapređenju odnosa klijenta i banke.
Sigurno ste se bar jednom zapitali zašto vam iskaču reklame za konkretan proizvod koji ste pretraživali na internet prodavnici pre samo par minuta, ili turističku destinaciju, ili novu TV seriju sličnu odgledanoj. Data Science uskače kao alat koji će prilagoditi korisničko iskustvo i dati adekvatnu preporuku, koristeći različite statističke metode.
Kako se to primenjuje u banci?
Na svakodnevnom nivou, banka generiše velike količine podataka, uključujući transakcije, kreditnu i blagajničku aktivnost, koje se skladište u bazama. Klijent dolaskom u banku daje saglasnost za obradu podataka u marketinške svrhe, što pomaže da banka ostvari personalizovan pristup ka tom klijentu. Međutim, takvi sirovi podaci ne mogu da pruže potpuno razumevanje ponašanja klijenta, te je neophodno iskoristiti moć analitičkih metoda i algoritama kako bismo uspešno kreirali sliku o osobinama i potrebama klijenata naše Banke.
U našem svakodnevnom radu, to podrazumeva pisanje kompleksnih upita za ekstrakciju podataka, čišćenje, eksplorativnu analizu, vizuelizaciju i pripremu podataka za treniranje modela mašinskog učenja pomoću alata i programskih jezika kao što su SAS, Databricks, SQL, R i Python. Ovi koraci su neophodni, jer dobro istreniran model za predviđanje je onaj koji na osnovu ulaznih podataka može samostalno da procenjuje, bez ekspertskog uticaja. Na primer, da bi veštačka inteligencija kao što je ChatGPT davala precizne odgovore na pitanja, mora i da stalno uči iz arhive podataka, kao i dete, uči i zapaža svoje okruženje i stalno usavršava stečeno znanje.
Data Science u našoj Banci podrazumeva kreiranje modela koji u velikom delu koriste transakcione i bihejvioralne podatke. Na osnovu ovih podataka moguće je uvideti kojim klijentima su potrebna dodatna sredstva za finansiranje, a kojima sredstva za refinansiranje kredita u slučaju poteškoća sa servisiranjem obaveza. Banci je takođe važno da obezbedi kontinuitet zadovoljstva klijenata, kroz prepoznavanje šablona u njihovom ponašanju i da sprovede sve neophodne mere kako bi zadovoljila njihove finansijske potrebe. U skladu sa regulativom, Banka je u obavezi da primenjuje i modele za prepoznavanje klijenata kojima raste verovatnoća da svoje obaveze neće izmiriti na vreme, kao i da proceni gubitke ukoliko dođe do nepovoljnih kretanja na tržištu. U kreiranju svih modela predviđanja, bitno je rukovati podacima na takav način da se poštuju principi etičnosti, poverljivosti i ravnopravnosti.
U realnom svetu podaci koji se najčešće koriste su nestrukturirani, često različitih značenja u zavisnosti od izvora, sirovi i neophodno ih je adekvatno procesuirati tako da mogu biti upotrebljivi, kvalitetni, da mogu da se jednostavno analiziraju i koriste za predviđanje budućih događaja. Ovaj deo posla zahteva najviše vremena, ali je neophodan kako bi modeli predviđanja i rezultat njihovog rada imali upotrebnu vrednost.
Krajnja suština primene Data Science-a jeste da kreira i uspešno prenese priču o našim klijentima ključnim stejkholderima u Banci, iza koje stoje analizirani podaci potkrepljeni čvrstim metodološkim dokazima. Rad sa podacima jeste izazovan proces. Podrazumeva neprekidno putovanje i istraživanje nepoznatog. Iako je moguće izgubiti se među mnogobrojnim tabelama i graficima, bitno je znati da je primena ovih analitičkih metoda realna. Moguće je pronaći rešenje za mnoge svakodnevne probleme, kako u bankarstvu, tako i u drugim oblastima. Data Science nema definisane granice, a na vama je da budete radoznali i iskoristite svaki trenutak ove avanture!