Giniho koeficient
Giniho koeficient je číselná charakteristika diverzifikace. Má veliké uplatnění v ekonomii, kde se jím poměřuje ekvivalence rozložení bohatství a důchodů v jednotlivých územních celcích, nejčastěji státech. Dále se často používá jako míra diverzifikační schopnosti skóringového modelu. Udává se od 0 do 1.
Obsah |
Definice [editovat]
Giniho koeficient většinou definujeme jako poměr plochy mezi Lorenzovou křivkou a diagonálou jednotkového čtverce (A) ku celkové ploše pod diagonálou (A+B), tedy

Protože obsah plochy pod diagonálou je polovina jednotkového čtverce, můžeme definici přepsat jako GC=2A nebo také GC=1-2B. Odtud použitím posledního jmenovaného výrazu dostáváme matematický vztah

kde
a
jsou distribuční funkce dobrých a špatných klientů (viz skóringový model). Jiné vyjádření získáme, vyjdeme-li ze vztahu GC=2A. Potom

Interpretace [editovat]
Giniho koeficient je tedy dvojnásobek plochy mezi Lorenzovou křivkou a diagonálou jednotkového čtverce, neboli ekvivalentně poměr této plochy a celkové plochy pod diagonálou. Hodnota Giniho koeficientu proto leží v intervalu [0,1], kde hodnota 1 značí perfektní (ideální) diverzifikační schopnost, hodnota 0 značí nulovou diverzifikační schopnost a záporné hodnoty značí opačnou klasifikaci skóringové funkce.
Somersovo d [editovat]
Pro odhad Giniho koeficientu lze v praxi použít více postupů. Jedním z často používaných je odhad pomocí tzv. Somersovy d statistiky.
Označíme-li
skóre j-tého klienta, můžeme definovat charakteristiky a, b a c následovně:
- a je počet všech dvojic klientů (i,j), i>j takových, že rozdíly
a
jsou nenulové a mají stejné znaménko (tedy takových dvojic, kde dobrý klient byl ohodnocen větším skóre než špatný klient); - b je počet všech dvojic klientů (i,j), i>j takových, že rozdíly
a
jsou nenulové a mají opačné znaménko (tedy takových dvojic, kde dobrý klient byl ohodnocen menším skóre než špatný klient); - c je počet všech dvojic klientů (i,j), i>j takových, že
a
(tedy takových dvojic, kde dobrý klient byl ohodnocen stejným skóre jako špatný klient).
Potom Somersovu d statistiku spočítáme jako

a
jsou nenulové a mají stejné znaménko (tedy takových dvojic, kde dobrý klient byl ohodnocen větším skóre než špatný klient);
a
(tedy takových dvojic, kde dobrý klient byl ohodnocen stejným skóre jako špatný klient).