ТЕХНОЛОГИИ РАЗВЕДКИ ДЛЯ БИЗНЕСА :: РАЗВЕДКА



Адрес первоисточника: http://www.it2b.ru/it2b2.view3.page267.html


Внедрение системы кредитного скоринга в банке

Автор: А.А. Строев (компания SAS, консультант) | Источник: Методический журнал «Расчеты и операционная работа в коммерческом банке» № 6 (48), 2004

В предыдущей публикации были рассмотрены общие методологические вопросы кредитного скоринга. В продолжение этой темы в настоящей статье рассматриваются вопросы практического построения алгоритмов скоринга.

При наличии в банке достаточной информационной базы по выданным кредитам можно приступать к реализации проекта по внедрению информационной технологии кредитного скоринга. Основными элементами этой технологии являются: Статистические методы анализа, использумые в кредитном скоринге, опираются на вероятностные модели возможных исходов кредитной сделки. Перечислим основные условия, при которых использование вероятностного моделирования является корректным.
Пределы точности скоринговых расчетов
Как правило, состав и характер влияния существенных факторов не остается постоянным, а изменяется с течением времени. Длительность периода актуальности алгоритмов скоринга зависит от характера и масштаба изменений, происходящих в экономике. На практике этот период может варьироваться от нескольких месяцев до нескольких лет.

Для того чтобы кредитный скоринг мог продолжать выполнять свои функции, вероятностные модели исходов кредитных сделок необходимо периодически корректировать. Проблема здесь кроется в том, что, для того чтобы «ухватить» новую тенденцию статистическими методами, необходимо иметь выборку данных, которые уже реализуют эту тенденцию, и если период смены тенденций сопоставим с периодом накопления данных для статистического анализа, то скоринговая карта может стать устаревшей уже к моменту ее расчета.


Подготовка исходных данных для расчетов
Для разработки алгоритмов кредитного скоринга необходима историческая выборка данных — так называемая обучающая выборка. От качества этой выборки (на языке статистики — репрезентативности) зависит точность оценок параметров модели скоринга и соответственно эффективность (предиктивная мощность) скорингового алгоритма.

Репрезентативность выборки определяется тем, насколько полно в ней присутствуют положительные и отрицательные прецеденты. Один и тот же элемент исторической выборки может быть признан и положительным, и отрицательным для разных постановок задач. А может и вообще не подходить для включения в обучающую выборку.

Например, в случае анализа кредитоспособности апликанта (application-скоринг) положительными прецедентами можно считать случаи возврата кредита без опоздания, а отрицательными — все остальные случаи.

Если же рассматривается задача оценки возвратности хотя бы части просроченного кредита (вариант collection-скоринга), то в качестве положительных прецедентов следует рассматривать все случаи возврата просроченных кредитов в сумме не менее этой части, а отрицательных — все остальные. Случаи же погашения кредита точно в срок вообще исключить из выборки, как не относящиеся к задаче.

От постановки задачи скоринга зависит не только способ разбивки обучающей выборки на положительные и отрицательные прецеденты, но и множество значимых факторов. Действительно, когда кредит выдан — апликант становится заемщиком, а банку доступна дополнительная информация, например о точности выполнения заемщиком текущих обязательств по уплате процентов за кредит. Кроме того, некоторые из существенных характеристик заемщика просто могут измениться за кредитный период (например, доход или семейное положение).


Информация по отклоненным заявкам на кредит
Информация по несостоявшимся кредитам (апликантам, которым было отказано в выдаче кредита) не может быть использована в качестве обучающей выборки, поскольку она не содержит нужных сведений. И это создает некоторую методическую проблему.

Допустим, при принятии решения о выдаче кредита к соискателям кредита применялись очень строгие критерии. Это означает, что некоторые из несостоявшихся кредитов могли бы пополнить подвыборку положительных прецедентов в обучающей выборке, если бы кредиты на самом деле были выданы. И скоринговые расчеты были бы тогда несколько другими. Но даже если бы все из отклоненных соискателей на самом деле пополнили подвыборку только отрицательных прецедентов, то и в этом случае с ненулевой вероятностью скоринговые расчеты отличались бы от тех, что получены по фактическим данным.

Таким образом, если в скоринговых расчетах опираться только на фактические данные по выданным кредитам (т.е. по состоявшимся заемщикам), то предиктивные оценки кредитоспособности новых соискателей будут содержать некоторую систематическую ошибку.

Смещение результатов скоринга происходит из-за того, что апликант — это еще не заемщик, и, оставляя в обучающей выборке только состоявшихся заемщиков, мы изначально ее цензурируем (т.е. искажаем). На языке статистики это означает, что новые соискатели кредита принадлежат к другой генеральной совокупности, чем та, из которой была взята обучающая выборка.

Степень этой ошибки можно оценить и частично ее снизить, если подвергнуть скорингу данные по отклоненным кредитным заявкам и включить их в повторный расчет скоринговой модели, разметив предварительно данные по отклоненным кредитам на положительные и отрицательные прецеденты, как если бы они были таковыми на самом деле.