.

Modeliranje scoring kartice

Score-kartica se kreira na temelju prihvaćenih aplikacija za koje je poznato jesu li dobri ili loši komitenti i na temelju odbijenih aplikacija za koje se procjenjuje jesu li dobri ili loši.

Analitičari koji se bave izgradnjom kredit scoring modela analiziraju povijesne podatke prethodno odobrenih kredita u cilju određivanja karakteristika zajmotražitelja koje su važne u predviđanju individualnog rizika. U kredit scoringu postoje tri pristupa koja se mogu koristiti za odabir karakteristika koje će ući u model:

  • Upotreba znanja, iskustva i osjećaja za podatke eksperata kao nadopunu formalnoj statističkoj metodologiji. Znanje eksperata je ključno za davanje obrazloženja o odabiru svake karakteristike koje će biti u modelu, a statistička i ostala metodologija je potrebna kako bi prevenirala uključivanje u model onih karakteristika koje nemaju prediktivnu sposobnost budućeg ponašanja.
  • Odabir individualnih karakteristika upotrebom mjere razlike između distribucije dobrih i distribucije loših. Uobičajena je mjera 'informacijska vrijednost' (information value) koja se izračunava na slijedeći način:
    Informacijska vrijednost
    gdje je:
    » pij broj dobrih komitenata u atributu j karakteristike i podijeljen ukupnim brojem dobrih komitenata koji su odgovorili na karakteristiku i
    » qij broj loših komitenata u atributu j karakteristike i podijeljen ukupnim brojem loših komitenata koji su odgovorili na karakteristiku i
    » wij 'težina dokaza' (weight of evidence) što se računa na slijedeći način: wij = ln (pij / qij)
    Svaka karakteristika čija je informacijska vrijednost veća od 0.1 treba biti razmatrana za uključivanje u score-karticu.
    Druga uobičajena mjera je x2- test veličina izvedena iz kontigencijske tablice dobrih i loših prema atributima karakteristike.
    U praksi se sve te metode kombiniraju i upotrebljavaju najčešće tako da se postupak započne odabirom individualnih karakteristika zatim se upotrebljava neka od statističkih metoda uz pojašnjenja eksperata i tako se to ponavlja dok se ne postigne najbolji model.

Mnogo je raznih načina kojima možemo izgrađivati modele u cilju predikcije hoće li klijent biti dobar ili loš, npr.

  • Logistička regresija
  • Linearna diskriminacijska analiza
  • Bayesova metodologija
  • Neuralne mreže
  • Stabla odlučivanja ...

Pojedine metode su više ili manje uspješne ovisno o specifičnim uvjetima. Npr. neuralne mreže znaju davati najbolje rezultate u usporedbi s drugim metodama. Kvaliteta modela prvenstveno se temelji na kvalitetnim informacijama i na vještini tima koji radi model da iz tih informacija izvuče što više.

Primjer izgradnje modela primjenom logističke regresije u jednom od idućih blogova.


Nataša Šarlija, prof.dr.sc.