Skóringový model

Z Wikipedie, otevřené encyklopedie
Skočit na: Navigace, Hledání

Skóringový model slouží k ohodnocení kreditního rizika bankovní nebo nebankovní instituce při žádosti klienta o úvěr. Každému žadateli o úvěr je na základě tohoto modelu přiděleno skóre. Skóre je bodové ohodnocení klienta, kde lepším klientům přísluší vyšší hodnoty. Někdy bývá skóre reprezentováno odhadem pravděpodobnosti, že daný klient úvěr splatí. Podle skóre se potom instituce rozhoduje, za jakých podmínek úvěr poskytne.

Výstavba skóringového modelu[editovat | editovat zdroj]

Skóringový model bývá založen na databázi existujících klientů, kterým kdy byl poskytnut úvěr, společně s informací, kterým z nich se podařilo úvěr splatit. Pro jednoduchost nazýváme dobrým takového klienta, který úvěr splatil včas a za dohodnutých podmínek, a špatným takového klienta, který některému ze svých závazků nedostál. Nesplacení bývá označováno též jako default.

Datový vzorek[editovat | editovat zdroj]

Předpokládejme, že pro každého klienta v databázi máme k dispozici informaci, zda úvěr splatil a dále informace v podobě sady x, kde x je vektor binárních proměnných (tj. proměnných s hodnotou 0 nebo 1), které jsou rozděleny do významových skupin (např. POHLAVÍ, VĚK, PŘÍJEM,...). Každá skupina je tvořena několika kategoriemi (např. skupinu POHLAVÍ tvoří dvě kategorie - MUŽ a ŽENA). Dále předpokládáme, že každý klient patří do právě jedné kategorie každé skupiny. Potom každá binární proměnná x_j^i ze sady x indikuje, zda daný klient patří do příslušné j-té kategorie i-té skupiny (x_j^i=1) či nikoliv (x_j^i=0).

Označme dále Z jako množinu všech dvojic indexů (i,j), kde i značí skupinu a j její kategorii.

Proměnné typu odds[editovat | editovat zdroj]

odds (česky též šance) je charakteristika, která udává poměr počtu dobrých klientů ku počtu špatných klientů v celé databázi:

odds = \frac{|G|}{|B|}.

Pro jednotlivé znaky j jednotlivých skupin i se definují proměnné odds_j^i, tzv. šance znaku, jako poměry příslušných počtů dobrých a špatných klientů v jednotlivých kategoriích:

odds_j^i = \frac{|G_j^i|}{|B_j^i|}.

Nakonec se zavádí proměnná odds ratio. Označme OR_j^i podíl odds_j^i příslušné kategorie a odds celku:

OR_j^i= \frac{odds_j^i}{odds}.

Proměnná odds ratio potom vyjadřuje relativní šanci klienta v dané kategorii úvěr splatit. Hodnota menší než 1 značí, že šance splacení je podprůměrná, vysoké hodnoty naopak ukazují na nadprůměrnou šanci.

Podstata modelů[editovat | editovat zdroj]

Podstatou modelů kreditního rizika je pro každého potenciálního klienta s charakteristikou x odhadnout hodnotu teoretické charakteristiky odds(x).

Přirozeně bychom hodnotu odds(x) odhadovali jako poměr počtu dobrých klientů s charakteristikou x ku počtu špatných klientů s charakteristikou x:

odds(\boldsymbol{x}) = \frac{|G_{\boldsymbol{x}}|}{|B_{\boldsymbol{x}}|}.

Protože však hodnoty |G_{\boldsymbol{x}}| a |B_{\boldsymbol{x}}| závisí na konkrétní kombinaci hodnot sady x a těchto kombinací je obecně velmi mnoho, není v praxi vhodné funkci odds(x) odhadovat tímto vztahem. Proto tento vztah dále upravujeme a za předpokladu nezávislosti klientů v datovém vzorku převedeme na tvar

odds(\boldsymbol{x}) = odds \prod_{(i,j)\in Z} (OR_j^i)^{x_j^i},

tedy jako součin celkového odds a příslušných OR_j^i těch kategorií, do kterých potenciální klient spadá. Přiřazením různých vah činitelům v předchozím vzorci můžeme konstruovat různě obecné modely.

Independence model[editovat | editovat zdroj]

Independence model je nejjednodušším z trojice představovaných modelů ohodnocení kreditního rizika. Skóringová funkce vychází pouze z vypočítaných hodnot proměnných odds a OR_j^i:

S^{IM}(\boldsymbol{x}) = odds \prod_{(i,j)\in Z} (OR_j^i)^{x_j^i},

kde \boldsymbol{x} = \big( x_j^i : (i,j)\in Z \big) je sada nezávisle proměnných, která charakterizuje hodnoceného klienta.

Odtud vidíme, že skóringová funkce S^{IM}(\boldsymbol{x}) je tvořena součinem odds a OR_j^i právě těch kategorií, ve kterých se příslušný klient nachází. Tento přístup modelování skóringové funkce se často používá právě pro svou jednoduchost. Jeho podstatnou nevýhodou však je onen zmíněný v praxi často nedosažitelný předpoklad nezávislosti a to, že přikládá všem skupinám a kategoriím stejnou váhu a tím snižuje svou vypovídací schopnost.

V praxi se někdy jako skóre používá logaritmus uvedeného vztahu:

\ln\big(S^{IM}(\boldsymbol{x})\big) = \ln(odds)+ \sum_{(i,j)\in Z} x_j^i \ln(OR_j^i).

Tento vztah potom odpovídá ln(odds(x)), neboli tzv. logitu, jenž je základem logistické regrese.

WOE model[editovat | editovat zdroj]

Dalším možným přístupem k modelování kreditního rizika pomocí skóringové funkce je WOE model. WOE je zkratka z anglického weight of evidence a značí, že v modelu přiřadíme každé skupině jinou váhu podle toho, jaký je její statistický vliv na fakt, jestli klient úvěr splatí či nikoliv. Takový model potom můžeme vyjádřit ve tvaru

S^{WOE}(\boldsymbol{x},\boldsymbol{\lambda}) = odds \prod_{(i,j)\in Z} (OR_j^i)^{\lambda^i x_j^i},

kde \boldsymbol{x} = \big( x_j^i : (i,j)\in Z \big) je opět sada nezávisle proměnných a \boldsymbol{\lambda}=\big( \lambda^i : i\in\{1\dots s\} \big) je vektor vah jednotlivých skupin.

Takto vytvořená skóringová funkce je opět odhadem funkce odds(x). Vektor parametrů \boldsymbol{\lambda} je možno odhadovat metodou logistické regrese.

Tento model je výpočetně náročnější, avšak zvláště pro větší databáze poskytuje větší přesnost a částečně tak řeší nedostatky Independence modelu. V prezentaci Rhino Risk se tento model doporučuje pro databáze s více jak 150 případy nesplacení.

Plný logistický model[editovat | editovat zdroj]

Plný logistický model přiřazuje specifickou váhu každé jednotlivé kategorii. Takto získáváme skóringovou funkci:

S^{PLM}(\boldsymbol{x},\boldsymbol{\lambda}) = odds \prod_{(i,j)\in Z} (OR_j^i)^{\lambda_j^i x_j^i},

kde \boldsymbol{x} = \big( x_j^i : (i,j)\in Z \big) je sada nezávisle proměnných a \boldsymbol{\lambda}=\big( \lambda_j^i :(i,j)\in Z \big) vektor vah jednotlivých kategorií.

Podobně jako u WOE modelu odhadneme vektor parametrů \boldsymbol{\lambda} metodou logistické regrese.

Tento model je nejpřesnější z uvedené trojice modelů, ale také výpočetně nejnáročnější. V praxi se většinou používá pro velmi rozsáhlé databáze. V prezentaci Rhino Risk se tento model doporučuje pro databáze s více jak 1200 případy nesplacení.

Schopnost diverzifikace[editovat | editovat zdroj]

Schopnost diverzifikace, tedy míra oddělení dobrých klientů od špatných, je jednou z nejdůležitějších zkoumaných vlastností skóringového modelu.

V ideálním případě bychom totiž chtěli nalézt takový model, kde by existovala taková skóringová hranice s_0, pro kterou by všichni špatní klienti v databázi byli ohodnoceni skóre nižším než s_0 a naopak všichni dobří klienti skóre větším než s_0. V takovém modelu bychom potom mohli podle dosaženého skóre poměrně dobře rozhodnout o tom, zda se klient zdá dobrý či nikoliv.

V praxi však zpravidla nenajdeme takovou skóringovou funkci, která by neomylně vystihovala kvalitu všech klientů v databázi. Budou se zde jistě vyskytovat takoví klienti, kteří mají sice nízké skóre, ale přesto se jim podařilo splatit, a naopak takoví, kteří přes své vysoké skóre nezaplatili. Skóringová funkce nám potom tedy dobré a špatné klienty rozdělí jen přibližně.

Pro názornost si představme, že jsou všichni klienti seřazeni vzestupně podle přiděleného skóre. V ideálním modelu bychom měli řadu samých špatných klientů a po překročení hranice s_0 řadu samých dobrých klientů. Oproti tomu v reálném modelu dostáváme řadu klientů, kde by sice na začátku byli častěji špatní klienti, ale mezi nimi by se vyskytovali i nějací dobří. Dobrých klientů by postupně přibývalo, až ke konci bychom měli řadu dobrých klientů, mezi kterými by bylo i několik špatných.

A tedy podle toho, jak dobře uspořádání klientů podle skóre odděluje dobré klienty od špatných, posuzujeme kvalitu modelu z hlediska diverzifikační schopnosti.

Pro grafické znázornění schopnosti diverzifikace používáme např. Lorenzovu křivku, pro číselnou kvantifikaci potom Giniho koeficient.

Související články[editovat | editovat zdroj]

Reference[editovat | editovat zdroj]

Externí odkazy[editovat | editovat zdroj]

  • JAKUBÍK, Petr; TEPLÝ, Petr. Skóring jako indikátor finanční stability [online]. ČNB, [cit. 2012-10-29]. Dostupné online.  
  • VERNEROVÁ, Lucie. Skoringové modely hodnocení úvěrové způsobilosti. Brno : ESF MU, 2010. Diplomová práce. Dostupné online.  
  • KREJČOVÁ, Eva. Retailový a korporátní credit scoring. Brno : PřF MU, 2012. Diplomová práce. Dostupné online.