Как использовать ИИ для оценки резервов в розничном кредитовании?
Введение
Оценка резервов, или прогноз ожидаемых кредитных потерь — одна из ключевых задач в банковской деятельности, над которой я работал в течение значительного времени своей карьеры.
Представьте, что у банка есть множество кредитов, выданных на различные цели, по которым клиенты ежемесячно вносят платежи. Большая часть этих кредитов будет успешно погашена в установленный срок, однако часть клиентов по разным причинам может прекратить выплаты (не вернуть кредит или его часть), что приведет к финансовым потерям для банка.
Суть задачи заключается в том, чтобы для всех действующих на данный момент кредитов спрогнозировать величину убытков, которые понесет банк из-за неисполнения клиентами своих обязательств.
Банку критически важно уметь заранее прогнозировать такие потери, поскольку это необходимо для обеспечения его финансовой устойчивости. На основе таких прогнозов формируются резервы (средства, замороженные под будущие убытки) и выстраивается кредитная политика. Размер резервов отражается в международной отчетности и служит ориентиром для инвесторов, аудиторов и Центрального банка.
Это важно и для клиентов, поскольку финансовая устойчивость банка гарантирует сохранность их средств и надежность самого банка, в котором они оформляют кредиты и размещают деньги.
Внедрение искусственного интеллекта в финансовом секторе
В своей практике я занимался разработкой моделей для оценки резервов. Мы строили сложные алгоритмы с использованием ИИ, чтобы выявлять поведенческие паттерны клиентов и точно прогнозировать возможные потери по кредитному портфелю.
Что нужно знать про оценку резервов?
Оценка резервов регулируется международным стандартом финансовой отчетности IFRS 9. Стандарт задает общие принципы и определения, которые необходимо учитывать при расчете резервов.
Один из центральных терминов дефолт — ситуация, когда клиент не может выполнять свои обязательства по кредиту. Обычно дефолтом считается просрочка платежа на 90 дней и более. Вся методология расчета резервов строится вокруг этого понятия.
Для оценки резервов банку необходимо прогнозировать четыре ключевых показателя:
Probability of Default (PD) — вероятность, что клиент окажется в дефолте; Exposure at Default (EAD) — ожидаемая сумма долга на момент дефолта; Loss Given Default (LGD) — доля долга, которую банк не сможет вернуть при дефолте; Macro Rate (MR) — влияние макроэкономических факторов.
Из этих показателей формируются резервы банка (Expected Credit Loss, ECL):
ECL = EAD × PD × LGD × MR
Для расчета резервов я разрабатывал все четыре группы моделей, каждая из которых отвечает за свой показатель формулы ECL. Прогноз регулярно обновляется для каждого действующего кредита с момента выдачи до его полного погашения и учитывает поведение клиента и изменения во внешней среде. Каждая модель решает свою задачу и требует отдельного подхода.
Предсказание вероятности дефолта
Probability of Default (PD) — это вероятность того, что заемщик окажется в дефолте в течение определенного времени: обычно 12 месяцев или до конца срока действия кредита.
Я занимался построением PD-моделей, которые оценивали вероятность дефолта для каждого действующего кредита. По сути, это похоже на кредитный скоринг, где банк оценивает, сможет ли клиент вернуть кредит. Однако в данном случае кредит уже выдан, а цель — понять текущее положение дел.
Как ИИ-технологии меняют взаимодействие с клиентами в финансовой сфере
Для решения этой задачи наилучшие результаты демонстрируют модели на основе ИИ. Такие модели называют
Behavioral PD-models
(поведенческие PD-модели) — модели бинарной классификации, которые оценивают вероятность дефолта на основе текущего поведения клиента (истории платежей, активности в других продуктах банка, образования, уровня дохода, занятости, стажа и вида деятельности, а также других характеристик клиента).
Как это работает? Если клиент регулярно вносит платежи по графику, прогнозируемая вероятность дефолта будет постепенно снижаться по мере погашения кредита. Но при первых признаках отклонения (например, просрочке или снижении активности) модель быстро пересчитывает PD, сигнализируя о растущем риске.
Стандарты качества и особенности задачи
К поведенческим PD-моделям предъявляются высокие требования к качеству прогноза:
Сортировка: более рискованные клиенты должны получать более высокое значение PD, чем надежные. Калибровка: если модель прогнозирует PD 10%, то примерно у 10% таких клиентов должен действительно наступить дефолт.
Практика показывает, что одной модели недостаточно, чтобы одновременно обеспечить и точную сортировку клиентов, и хорошую калибровку. Это связано с особенностями самой задачи:
Уровень риска быстро меняется: даже для клиентов с одинаковыми характеристиками доля дефолтов может заметно изменяться в течение короткого промежутка времени под влиянием ненаблюдаемых факторов, например изменения экономической ситуации. Отложенное обучение: в этой задаче прогнозируется событие, которое может произойти в далеком будущем (например, в течение 12 месяцев). Это означает, что для обучение таких моделей нужно использовать историю как минимум 12-месячной давности. Сертификация модели: так как модель влияет на регуляторные требования и финансовую отчетность, проверяется аудиторами и регулятором, сложно представить ситуацию, когда новая модель будет выкатываться каждые несколько месяцев.
Построение Behavioral PD-models
Для повышения точности прогноза PD я использовал связку нескольких моделей ИИ, которые поэтапно дополняют друг друга.
На первом этапе использовалась «основная» модель — сложная ML-модель, обученная на большой истории с использованием большого количества различных характеристик клиента. Ее задача эффективно сортировать заемщиков по уровню риска.
Далее ее прогноз корректировался с помощью простой «калибровочной» модели, обученной на самых свежих данных. Она использует предсказания «основной» модели как входной признак и иногда дополняется небольшим числом чувствительных к текущей ситуации факторов. Эта модель заметно проще исходной, что позволяет обновлять ее регулярно. Цель «— скорректировать прогноз так, чтобы уровень PD соответствовал наиболее актуальной информации по уровню рисков.
Такой подход хорошо показал себя на практике. Основную модель можно обучить «один раз» и использовать достаточно долго — пока она сохраняет высокое качество сортировки клиентов по риску. Калибровочную модель же легко обновлять регулярно, чтобы корректировать прогнозы в соответствии с текущим уровнем рисков. Это позволяло гибко адаптировать уровень PD к текущей ситуации без необходимости полностью пересобирать всю систему. Идею применения калибровки можно расширять и дальше, корректируя предсказания основной модели под разные потребности и особенности ситуации.
Предсказание суммы долга на момент дефолта
Exposure at Default (EAD) — это прогнозируемая сумма долга, которую заемщик будет должен банку на момент наступления дефолта.
Если PD отвечает на вопрос: «С какой вероятностью наступит дефолт?», то EAD оценивает: «Какова будет задолженность на момент дефолта?».
Подход к прогнозированию EAD существенно зависит от типа кредитного продукта и того, как банк строит свою методологию. Важно, учитывается ли, что клиент может частично или полностью погасить долг до наступления дефолта, или рассматриваются только сценарии, при которых долг остается на том же уровне или продолжает расти.
Особенности типов кредитования
Аннуитетные кредиты (ипотека, автокредиты, кредиты наличными) выдаются сразу целиком, и клиент только погашает долг по графику. То есть сумма долга к моменту дефолта может только уменьшиться.
Револьверные продукты (кредитные карты, овердрафты) клиент может тратить, гасить долг и снова тратить — сколько позволит лимит. Поэтому сумма долга может как снижаться, так и расти до момента дефолта.
Из-за принципиально разной динамики задолженности подходы к прогнозированию EAD должны быть разными.
Подход без учета возможного сокращения долга
В своей практике я разрабатывал модели для подхода, который не учитывает возможность погашения долга. Он предполагает, что EAD не может быть меньше текущей задолженности. Этот подход более распространен на практике благодаря своей простоте, прозрачности и регуляторным особенностям — в частности, он легче проходит аудит за счет отсутствия риска занижения оценки потерь.
В данном случае для аннуитетных кредитов EAD будет равен задолженности по кредиту на момент построения прогноза. Это связано с тем, что погашения в прогнозе не учитываются, а увеличение долга в таком типе кредитования невозможно. Прогнозирования не требуется.
Для револьверных кредитов необходимо учесть возможный рост задолженности за счет использования лимита:
EAD = текущая задолженность + CCF × (лимит − текущая задолженность)
CCF (Credit Conversion Factor) — доля лимита, которую по прогнозу клиент успеет потратить до наступления дефолта.
Для оценки CCF мы разрабатывали поведенческие EAD-модели на базе ИИ. Это были регрессионные ML-модели, обученные на исторических данных по клиентам, у которых уже наступил дефолт. В качестве признаков использовались поведенческие характеристики (активность клиента, траектория долга, использование лимита, характеристики пользователя и т. д.).
Все принципы, которые я применял при построении поведенческих PD-моделей, были релевантны и в этой задаче. Разница лишь в том, что здесь решается регрессионная задача и нужно предсказать непрерывное значение CCF в диапазоне от 0 до 1.
Подход с учетом возможного погашения долга
Данный подход я не использовал, но изучал возможности его внедрения. В этой методологии допускается не только рост задолженности, но и возможные погашения долга до наступления дефолта. В отличие от предыдущего подхода, здесь EAD может быть меньше текущей задолженности, что делает оценку более гибкой и точной.
В данном случае прогнозировать EAD можно двумя способами. Первый вариант — напрямую предсказывать сумму долга на дату дефолта. Второй — через коэффициент, который масштабирует базу расчета. Для аннуитетных кредитов такой коэффициент отражает долю задолженности, которую пользователь успеет погасить до дефолта. Для револьверных — долю от доступного лимита, которую клиент успеет потратить к моменту дефолта.
Во всем остальном логика аналогична тому, что я описывал в контексте прогнозирования CCF.
Основная причина, почему этот подход не так часто используется, — его сложность, низкая интерпретируемость и сильное влияние на итоговую величину резерва. Величина EAD — это база для расчета резерва, и если она формируется с помощью сложной методологии, это может вызывать множество вопросов со стороны регулятора, аудиторов и других заинтересованных сторон.
Прогнозирование потерь в случае дефолта
Loss Given Default (LGD) — это доля задолженности, которую банк фактически потеряет в случае дефолта клиента.
Если PD говорит о вероятности дефолта, а EAD о размере долга на момент дефолта, то LGD отвечает на вопрос: «Какую часть этого долга банк фактически потеряет?».
По моему опыту, при прогнозировании LGD методы машинного обучения показывают ограниченную эффективность. После дефолта поведение клиента почти не зависит от его изначальных характеристик: ключевую роль играет стратегия и активность банка по взысканию долга.
Мы оценивали LGD на основе фактической статистики возвратов по счетам, вышедшим в дефолт. Для этого объединяли клиентов в сегменты по стадии взыскания и давности дефолта, а затем считали долю невозвращенных средств от общей задолженности с учетом веса каждого сегмента — это и была наша оценка LGD.
Прогнозирование влияния макроэкономических условий
Macro Rate (MR) — компонент в расчете ожидаемых потерь, отражающий влияние макроэкономических условий на уровень кредитного риска.
На мой взгляд, построение модели MR — одна из самых творческих частей расчета резервов. Здесь активно применяется ИИ, а основная цель — понять, как изменение экономической ситуации влияет на потери банка.
Данная модель должна учитывать риски, связанные с изменением макроэкономической ситуации, которые еще не повлияли на прогнозы PD, LGD, EAD. Это важно, потому что модели строились на исторических данных и косвенно отражают конкретные экономические условия, которые были в тот временной период.
Например, если модели PD, LGD, EAD строились на данных за благоприятный экономический период, когда кредиты выплачивались вовремя, доходы росли, а безработица была низкой, то при наступлении кризиса прогнозы рисков окажутся заниженными, а резерв — недооцененным. Для учета таких ситуаций и существует MR, который в случае выявления признаков наступающего кризиса заранее повысит резервы.
Подходов к построению MR-моделей много, стандарт IFRS 9 допускает гибкость.
Один из вариантов, который я использовал для прогнозирования MR, — включение макроэкономических факторов напрямую в ML-модели PD, LGD, EAD. Например, через отдельные калибровочные модели, которые корректируют основные прогнозы с учетом макроиндикаторов.
На практике оказалось, что привязать корректировки PD, LGD и EAD к макроиндикаторам довольно сложно. Это связано с тем, что на их значения влияет множество различных факторов — от изменения кредитной политики банка до изменений в самих кредитных продуктах, а влияние экономики ограничено и каждый раз имеет разную природу.
Более перспективным оказался другой подход — построение ML-модели, которая прогнозирует, как клиенты перераспределяются между сегментами с разным уровнем риска (PD, LGD, EAD). Я сегментировал портфель по уровням риска, а затем анализировал, как в кризисы клиенты переходили из одного «бакета» в другой.
В своем подходе я использовал регрессионную модель, которая прогнозировала перетоки между сегментами риска — как меняется доля клиентов, переходящих из одного бакета в другой при изменении экономической ситуации и на основании рассчитывал MR. Такой подход оказался более чувствительным к кризисам, проще в моделировании и легко интерпретируется.
Заключение
Оценка резервов — это не одна модель, а комплексная система из десятков решений, основанных на искусственном интеллекте и эвристиках. Каждая из четырех компонент формулы ECL (PD, EAD, LGD и MR) требует своей группы моделей, учитывающих поведение клиентов и специфику кредитных продуктов. Большинство прогнозов строится с помощью ML-моделей, обученных на исторических данных. Поведенческие PD-модели, регрессии для расчета CCF и EAD, подходы для прогонзирования MR — все это примеры использования ИИ, позволяющие получать точные и адаптивные прогнозы с учетом изменений в портфеле и экономике.
Для разных типов продуктов (ипотеки, кредитные карты, кредиты наличными и т. д.) создаются отдельные модели, отражающие специфику клиентского поведения и динамику задолженности.
Такой модульный подход обеспечивает точную оценку рисков, своевременную реакцию на внешние изменения и устойчивость финансовой системы банка.