Коэффициент Джини/Критерий Джини/Неопределенность Джини (Gini coefficient, Gini impurity, не путать с Gini coefficient, показателем степени расслоения доходов общества) – один из методов, используемых в алгоритмах (моделях) дерева принятия решений для расчета того, как часто случайно выбранный элемент из множества был бы неправильно помечен, если бы он был случайно помечен в соответствии с распределением меток в подмножестве (иначе говоря, как часто случайно выбранный элемент будет распознан неправильно).
Коэффициент Джини показывает расстояние между распределениями целевых значений и тех, что показывает модель. Чем меньше значение этого показателя, тем лучше работает прогнозная модель.
Коэффициент используется в скоринговых моделях и машинном обучении в таких секторах, как банковское кредитование, страхование, маркетинг.
Коэффициент Джини – статистический показатель меры расслоения доходов или богатства общества. Измеряется по шкале от 0 до 1, где ноль означает полное равенство, а единица – полное неравенство. Нулевое значение будет в стране или в регионе, в которой абсолютно у всех одинаковый доход. Значение равное единице будет при условии, если один человек заработал 100% денег, а остальные не заработали ничего. На практике же значения чаще всего укладываются в диапазон от 0,2 до 0,6.
Низкий показатель коэффициента Джини не означает богатства или бедности выборки в целом, а лишь низкую разницу между самыми богатыми и самыми бедными. То же самое, но с противоположной стороны, относится и к высокому показателю.
По последним данным, Россия занимает примерно среднее значение по этому показателю среди стран мира. Коэффициент Джини России: 36,6, самый высокий у ЮАР – 62,73, самый низкий у Таджикистана – 22,45.
Автор: Максим Юдин, автор направления «Рынок МФО и ломбардов»
ООО "ИА "Займ.ком"