Какой быть аналитической системе крупного коммерческого банка

Хохлов Евгений

АНАЛИТИЧЕСКАЯ РАБОТА В БАНКЕ СЕГОДНЯ

    Под аналитической работой в коммерческих банках традиционно понимают составление и интерпретацию отчетов. Процесс составления состоит из процесса планирования отчета, т.е. творческого процесса создания отчетной формы и алгоритма ее заполнения, и рутинного процесса регулярного заполнения созданной отчетной формы.
    Интерпретация отчетов - как правило, неформальный процесс. Тем не менее для значительной части отчетов уже в процессе создания отчетной формы формулируются представления о нормальном, плохом (с содержательной точки зрения) и некорректном (ошибочном и/или фальсифицированном) заполнении. Неформальная интерпретация нужна только в том случае, если заполненная отчетная форма не может быть однозначно отнесена ни к одному из перечисленных классов.
    Хотя описанное представление об аналитической работе не касалось содержания отчетов, любой банкир отнесет его к анализу внутрибанковской бухгалтерской отчетности. Однако предметом анализа (и содержанием отчетов) в настоящее время все больше становятся данные другого происхождения. Это, во-первых, сведения о состоянии финансовых рынков, на которых оперирует банк (и контрагентов банка на этих рынках), и, во-вторых, внутрибанковская информация небухгалтерского происхождения.
    Информация о внешних рынках отличается нерегулируемостью темпа поступления данных (и соответственно жесткими и независящими от банка требованиями к скорости их обработки).
    Небухгалтерская информация характеризуется значительно меньшей (по отношению к бухгалтерской) систематичностью, что требует творческого отношения к ее сбору и интерпретации.
    Таким образом, постоянное увеличение объема традиционной аналитической работы в коммерческих банках, связанное с ростом самих банков и ужесточением требований ЦБ РФ к бухгалтерской отчетности, сопровождается усложнением аналитической работы, связанным с появлением новых источников данных. Остро ощущается, особенно в крупных банках, недостаточность раздельного анализа данных из разных источников, необходимость анализировать все данные в комплексе.
    Таков букет проблем, с которыми придется столкнуться в современном коммерческом банке любой серьезной аналитической системе, в том числе и той, которую разрабатывает фирма <ПрограмБанк>.

СТРУКТУРА АНАЛИТИЧЕСКОЙ ДЕЯТЕЛЬНОСТИ

    Структура программной системы, поддерживающей какой-либо процесс, обязана способствовать логике самого процесса (если, конечно, существование этой программной системы не модифицирует кардинально эту логику). Поэтому описание аналитической программной системы начнем с описания логики аналитического процесса. В коммерческом банке она ничем не отличается от логики в любой другой производственной деятельнос-ти и содержит следующие основные этапы.
    Структура А:
    А1. Сбор данных.
    А2. Анализ данных.
    А3. Прогноз изменения ситуации.
    А4. Принятие решения.
    Как и в других производственных системах, в коммерческом банке логика и ограничения реальной жизни часто перевешивают абстрактную логику структуры деятельности. Попробуем представить ту же аналитическую работу в виде ежедневно используемого алгоритма.
    Структура Р:
    Р1. Занести все собранные за день данные в базу данных.
    Р2. Оценить вновь полученные данные:

  • на достоверность (те, которые могут быть ошибочными и/или фальсифицированными);
  • на согласованность (те, для которых есть модели согласованности), в том числе на согласованность между собой, на согласованность с уже имеющимися данными;
  • на изменение тенденций (те, для которых есть модели тенденции);
  • на критичность (те, для которых есть модели критических значений).
        Р3. Далее:
  • для недостоверных и/или фальсифицированных данных повторить цикл получения данных;
  • для несогласованных - выяснить причины и повторить цикл получения данных;
  • для нормальных данных выдать стандартную реакцию;
  • для данных с изменившейся тенденцией пересчитать тенденции, заново оценить ситуацию, выработать адекватную реакцию;
  • для критичных - обратиться к тем, кто отвечает за критические ситуации (для выработки адекватной реакции).
        Р4. Если осталось время, то строить модели:
  • фальсифицирования данных;
  • согласования данных;
  • критичности данных;
  • тенденций изменения.     Все эти модели строить как для конкретных данных, так и для самих процессов.
        Такой список достаточно точно описывает, что происходит в банке. Из него видно, что целью аналитической работы прежде всего является своевременная (для дневного цик-ла - не позднее завтрашнего утра) и адекватная реакция на собранную информацию. Заключительные этапы абстрактной структуры (прогноз и оптимизация) в ежедневной рутинной работе как бы отсутствуют. Это следствие как большой трудоемкости первых этапов, так и слабой поддержки последних, причем в условиях жестких временных ограничений.
        Возможно, именно дефицитом времени объясняется столь поразительная неживучесть сложных аналитических систем в коммерческих банках. Результаты, которые можно получить с помощью сложных систем, вполне достижимы и с помощью табличек в Excel. А значит, банкиры скептически настроены ко всему более сложному, чем эти таблички.
        Проблему создает смешение двух основных составляющих аналитического процесса: творческой и рутинной. Сложные системы в первую очередь нацелены на обеспечение инструментарием творческой составляющей аналитической работы. Банк же непосредственно и ежедневно занят рутинной, производственной работой.
        Жесткие временные рамки, характерные для рутинной составляющей аналитической работы, переносят те же требования и на процесс использования в этой рутинной составляющей результатов, достигнутых в творческой аналитической работе, да и на саму эту творческую работу. Поэтому в дальнейшем главное внимание будет уделяться требованиям и характеристикам, важным именно с эксплуатационной точки зрения.

    СБОР ДАННЫХ

        Основными (и постоянными) проблемами на этом этапе являются множественность используемых форматов и качество каналов передачи информации. Общепринятым является требование максимального сокращения ручного ввода данных как процесса наиболее медленного и порождающего ошибки с наибольшей вероятностью. Поэтому максимально должны использоваться источники, предоставляющие информацию в электронной форме. Более ценными являются первоисточники, т.е. организации, производящие интересующие банк данные (если говорить о котировках, то - биржи), поскольку информационные агентства в процессе сбора данных вносят в них, хотя и редко, собственные ошибки.
        Вторичные источники имеет смысл использовать только в целях уменьшения расходов за счет сокращения числа информационных контрагентов или при невозможности получить информацию у первоисточника. Информацию вторичных источников иногда используют для перекрестных проверок.
        Этап сбора данных обязательно включает их преобразование к унифицированному формату хранения, которым будут пользоваться на всех последующих этапах.
        Организуя сбор данных, следует учитывать следующие обстоятельства:

  • неизбежные вариации форматов собираемых данных. Это требует регулярного допрограммирования и/или донастроек соответствующих интерфейсов;
  • неизбежные колебания качества каналов связи, которые требуют участия в процессе сбора данных квалифицированного технического персонала;
  • неизбежное масштабирование системы хранения данных с увеличением объема информации (как с течением времени, так и в связи с расширением номенклатуры собираемых данных). С ростом объема собранной информации время на поиск и доступ не должно расти. Это означает и переход к более мощным ЭВМ, и ориентацию на использование продуктов от известных и развивающихся фирм. На программное обеспечение тем самым накладывается обязательное требование переносимости на различные платформы;
  • среди собираемых коммерческим банком данных значительную долю составляет информация о функционировании самого банка. Поэтому используемая банком в повседневной работе информационная банковская система обязана быть <прозрачной> для инструментальных средств, используемых при построении аналитической системы;
  • форма представления данных, удобная для хранения, далеко не всегда удобна для использования. Различные и регулярно меняющиеся методы аналитической обработки данных, как правило, формулируют запросы на поиск данных в своих, часто уникальных терминах. Поэтому интерфейс между системами аналитической обработки и системой хранения данных должен быть более высокоуровневым. Наилучшим был бы вариант работы с помощью словаря-справочника, поддерживающего понятие контекста для всех данных (см., например: Сахаров А. А. Концепция построения и реализации информационных систем, ориентированных на анализ данных // СУБД. 1996. № 3).

    АНАЛИЗ ДАННЫХ

        Поисковый анализ данных нацелен на выделение в имеющейся информации (т.е. данных о настоящем и прошлом) систематически проявляющихся связей и закономерностей. В математике эти закономерности называются моделями и могут использовать различные формы выражения: булевскую логику и исчисление предикатов, обыкновенные и дифференциальные уравнения и т.д. Целевой анализ исходит из сформулированной (обычно руководством банка) цели и использует как уже существующие, так и специально создаваемые модели.
        Рутинный анализ - это подгонка уже выделенных в рамках творческой деятельности моделей под конкретные текущие данные. Ежедневная рутинная обработка всех вновь поступивших данных совершенно обязательна.
        Из трех видов анализа - рутинного, целевого и поискового - наибольшей ценностью обладает целевой, осуществляемый обычно непосредственно по заданию руководства. Несколько меньшей ценностью обладает рутинный анализ, результаты которого ежедневно используются. Поисковый анализ обычно вообще выпадает из шкалы ценностей практичного банкира. Однако без инструментального обеспечения рутинного и поискового видов анализа целевой становится трудноисполнимым, поскольку сочетает в себе их элементы.
        Поисковый анализ. Цель поиска - устойчивые связи и закономерности, существующие в данных, но не выявленные ранее. При разработке инструментального обеспечения поискового анализа важно четко сформулировать критерии качества. Наиболее существенными являются:

  • наличие мощного интерпретатора формул, позволяющего строить сложные показатели на базе лежащих в базе данных примитивов;
  • разнообразие типов реализуемых математических моделей;
  • разнообразие способов графического представления данных;
  • поддержка средств планирования экспериментов;
  • интеграция в качественную DWH-систему;
  • простота интеграции результатов поискового анализа (новых моделей) в технологию рутинного анализа. Это предполагает наличие в системе средств быстрой разработки приложений (RAD), однако требуется и жесткая дисциплина при проектировании и реализации программных средств для рутинного анализа.
        Инструментальная поддержка, характеризующаяся низким качеством даже по одному из этих критериев, будет вынуждать аналитика скорее заниматься повышением качества инструмента, чем реальной поисковой работой.
        Рутинный анализ. Им заняты и главный бухгалтер, и работники фондовых отделов, и, естественно, аналитики. Ежедневное сопоставление вновь поступивших данных с ожидавшимися значениями и модификация ожиданий для данных, которые поступят только завтра, - обыденный процесс. Он почти не воспринимается банкирами как элемент аналитической работы. Модели, используемые большинством работников, настолько просты, что не преобразуются в форму математических, а живут непосредственно в сознании (или подсознании) людей.
        И только аналитики вынуждены извлекать эти модели из подсознания и придавать им математическую форму. Это необходимо для того, чтобы ответ на вопрос: <А что, если..?> можно было получать быстро, обоснованно и в известной степени независимо от самочувствия носителей моделей. Кроме того, математическая форма представления моделей делает возможным сопоставление данных из разных областей деятельности банка, т.е. комплексный подход к анализу этой деятельности.
        Рутинный анализ осуществляют люди, в памяти которых хранятся в основном модели и их результаты - ожидаемые значения вновь поступающих данных. Люди (сознательно или бессознательно) модифицируют эти модели в соответствии с тем, как отличаются эти вновь поступившие значения от ожидавшихся.
        Подсобным инструментом для них являются отчеты (именно отчеты, причем, как правило, в бумажной форме!), позволяющие удержать или восстановить в памяти вчерашние и более давние данные. Программный инструментарий им требуется либо для того, чтобы найти ранее созданный отчет (или повторить его создание), либо для того, чтобы перейти от рутинного к целевому или поисковому анализу, когда результаты рутинного их не устраивают. Невыделенность этого перехода к другому типу анализа приводит к его неосознанности, и потребности целевого или поискового анализа начинают приписывать рутинному.
        Тем не менее аналитики, которые по роду своей деятельности преобразуют неосознанные ожидания в формальные математические модели, соответственно нуждаются в программной поддержке рутинного анализа. Функциями такого программного инструментария являются:
  • оценка вновь поступивших данных на достоверность, согласованность, соответствие тенденциям и критичность;
  • предъявление аналитику всех тех из поступивших данных, которые не прошли соответствующую проверку.
        Такая деятельность в инженерных приложениях называется мониторингом и достаточно хорошо изучена.
        Мониторинг. Этот этап обычно не только не выделяют в структуре деятельности аналитического отдела банка, но и не реализуют в полном объеме (обычно ограничиваются оценкой достоверности и оценкой изменения тенденций, но только для ограниченного набора данных). Задача мониторинга - осуществлять в соответствии с настройками пользователя-аналитика слежение за всеми существенными параметрами банка и его окружения (даже если их десятки тысяч!) и выделять для оперативного анализа те (и только те!) из них, текущие значения или тенденции изменения которых могут рассматриваться как критические (или, как минимум, существенно меняющиеся). Без такого фильтра возможности хранилища данных остаются, как правило, невостребованными.
        Аналитик не столько не может найти нужные ему данные (средства поиска есть, и достаточно мощные), сколько не в состоянии четко определить, какие же данные он должен искать (чтобы затем анализировать). И чем больше система и соответственно количество регистрируемых данных, тем сложнее сообразить, куда смотреть именно в данный момент. Будь у аналитика неограниченное время, он осмотрел бы все, но где его взять?
        Система мониторинга проделывает наиболее трудоемкую часть работы: выделяет из всех данных те, на которые нужно обратить внимание человеку.
        По-настоящему актуален мониторинг для внутрибанковской информации, которая представляет собой десятки и сотни тысяч чисел (в основном остатки и обороты по лицевым и балансовым счетам и формулы над ними).
        Однако сама технология предварительной фильтрации данных перед интерактивным анализом может быть использована и для централизованного слежения за большим количеством инструментов на финансовых рынках, исполнением бюджетов множества параллельно ведущихся или иерархически подчиненных проектов и т.д.
        Можно сформулировать следующие эксплуатацион-ные требования к подсистеме, реализующей мониторинг данных.
  • Хотя работа по выделению показателей, демонстрирующих критические значения и/или критические тенденции (далее - критические показатели), возлагается на ЭВМ, работа по установлению (и, следовательно, по модификации) критериев критичности выполняется человеком. Эта работа носит вполне инженерный характер и сводится к отслеживанию влияния параметров критичности на выделение показателей как критических. Выделяться должно не слишком много показателей (иначе аналитик не будет
        успевать их обрабатывать). При этом не должны теряться показатели, демонстрирующие действительно критическое поведение, что требует, наоборот, повышения чувствительности параметров критичности. Следовательно, хорошо сделанная система поддержки мониторинга должна:
        1. Содержать достаточно широкий набор стандартных критериев критичности показателей, в том числе основанных на моделях поведения показателей во времени.
        2. Позволять в максимально автоматизированном стиле настройку критериев на поведение конкретного показателя.
        3. Содержать развитые инструментальные средства работы с таблицей критических показателей, в том числе средства:
        - фильтрации по применяемым критериям;
        - анализа и систематизации контекстов, в которых показатели становятся критическими;
        - кластеризации показателей по характеристикам времени и контекста, в которых они становятся критическими, и т.д.
  • Затраты времени на предварительную обработку данных в мониторинге качественно зависят от объема и номенклатуры собираемых данных, поскольку обычно в процедуре мониторинга используются почти все собранные за несколько последних периодов данные. Однако время на оценку (человеком-аналитиком) критических показателей пропорционально их количеству, а также общему числу наблюдаемых показателей. С ростом последнего параметра процедура оценки критических показателей может начать требовать слишком большого времени. К счастью, эта работа может быть распараллелена и ее смогут выполнять несколько человек, что позволяет удерживать ежедневные затраты времени на мониторинг на приемлемом уровне.
  • Аналитических систем, содержащих полный набор инструментальных средств мониторинга, на рынке практически нет. Поэтому при подборе аналитической системы на это следует обратить особое внимание.
        Целевой анализ. Это наименее формализуемый вариант анализа, поскольку вариативны как его цели, так и средства их достижения. Как правило, результатом целевого анализа является отчет (таблица), представленный в графической форме (график, диаграмма), или набор конкретных документов, содержащих в неформализованном виде информацию, достаточную для получения выводов. Для получения результатов аналитику требуются:
  • контекстно-ориентированные средства <погружения> в данные;
  • развитые средства визуализации данных;
  • генератор отчетов, поддерживающий высокие требования к оформлению документов.

    ПРОГНОЗ ИЗМЕНЕНИЯ СИТУАЦИИ

        В коммерческом банке чаще всего используется краткосрочный прогноз. В его основе лежат предположения о сохранении
        существующего положения и/или сохранении существующих тенденций. Эти предположения обычно оправдываются на коротких интервалах времени, но не всегда при средне- и особенно долгосрочном прогнозировании. Однако даже краткосрочный прогноз часто опирается на данные более дальних прогнозов. Поэтому хорошая система прогнозирования должна поддерживать и технологию долгосрочного прогноза.
        Обычные алгоритмы долгосрочного прогноза, как правило, состоят из двух шагов: сначала определяются возможные качественно различные альтернативы, а затем для каждой из альтернатив строится прогноз числовых характеристик. Таким образом, система прогнозирования помимо обычных числовых алгоритмов должна поддерживать и логистические модели, и соответсвующие алгоритмы, а также уметь интегрировать модели разной математической природы в общую модель.
        Как и для анализа, полезно провести элементарную классификацию ситуаций, в которых используются методы прогнозирования. Можно выделить рутинный прогноз (каждый раз прогнозируются одни и те же характеристики на основе одних и тех же данных и моделей), ситуационный (каждый раз прогнозируется специально назначаемый, ситуационно определяемый список характеристик, но ситуации, т.е. данные о них, <ведутся> регулярно) и целевой (выполняемый по заданию руководства; как правило, требуется предварительный целевой анализ).
        В отличие от разных видов анализа разные виды прогноза используют практически одни и те же методы, зависящие скорее от периода прогнозирования и природы прогнозируемых временны?х рядов. Тем не менее существуют технические различия, о которых стоит помнить:

  • наличие или отсутствие исторических данных, позволяющих как рассчитать прогнозные значения, так и протестировать их (это часто встречающаяся проблема при целевом прогнозе);
  • наличие или отсутствие ранее выделенных при анализе моделей прогнозируемых данных (они могут отсутствовать не только при целевом, но и при ситуационном прогнозе);
  • требования к комплексности прогноза (характерное требование при ситуационном прогнозе).
        Качественная система прогнозирования должна предоставлять набор методов, работающих:
  • при различном обеспечении историческими данными;
  • с различными моделями прогнозируемых данных;
  • с учетом взаимовлияний прогнозируемых данных.
        Банковская практика показывает, что среди методов должны быть:
  • статистические (в их основе - предположение о стабильности модели прогнозируемых временны?х рядов);
  • методы технического анализа (в их основе - эвристическое предположение о стабильности косвенных характеристик прогнозируемых временны?х рядов);
  • методы прецедентного анализа (в их основе - предположение об одина-ковости проявлений одних и тех же причин).
        При всей естественности каждого из приведенных требований можно констатировать практически полное отсутствие на рынке прикладных систем, удовлетворяющих им всем. Даже инструментальных систем, в должной мере удовлетворяющих этим требованиям, совсем немного. И стоит помнить, что система прогнозирования должна эффективно взаимодействовать с системой анализа.

    ПРИНЯТИЕ РЕШЕНИЙ

        Поддержка принятия реше-ний - редко встречающаяся действительность. Деятельность, содержащая элементы принятия решений, крайне разнообразна. <Обвинить> в принятии решений можно даже сотрудника фронт-офиса, решающего стоит ли открывать расчетный счет вновь пришедшему клиенту (кстати, реально существуют программные системы, поддерживающие этот процесс). Кроме того, процесс принятия решений начинается уже на этапах анализа и прогноза, когда выбираются те критические показатели, ситуация с которыми нуждается в анализе, и используются вполне конкретные методы прогнозирования.
        Поэтому ситуацию <принятия решений>, поддержку которой мы собираемся реализовывать, стоит сформулировать с возможно большей точностью.
        Нам представляется единственно разумным поддерживать только те ситуации принятия решений, для которых удалось построить формальную модель. Звучит не очень обнадеживающе для банкира, но зато здесь ни капли обмана. Можно, конечно, попробовать поднять настроение того же банкира, перечислив те ситуации, для которых формальные модели уже есть:

  • статическая модель выбора структуры портфеля инвестиций;
  • динамическая модель <пассивной эволюции> банка (Екушов А. И. Модели учета и анализа в коммерческом банке. М.: Бизнес и компьютер, 1997);
  • динамическая модель оптимизации потоков платежей в системе корреспондентских отношений;
  • динамическая модель реструктуризации многорыночного портфеля с учетом потоков платежей.
        В список входят наиболее сложные задачи принятия решений в условиях непрерывно меняющихся внешних и внутренних ограничений. Его можно расширить, но это требует активного участия в постановочной работе самих банкиров - пользователей аналитической системы.

    ЗАКЛЮЧЕНИЕ

        Настоящая статья - обобщение опыта двухлетней разработки аналитической системы. Далеко не все в ней изложенное было ясно ДО начала разработки. Отсутствовала концепция мониторинга, смутными были представления о методах прогнозирования, не было разработанных постановок задач принятия решений и т.д. Удачей был правильный выбор инструмента (SAS), который при всех колебаниях в выборе направления раз-вития системы всегда предоставлял адекватные средства для него. Неоценимую помощь на всех этапах оказывал профессор МФТИ Л. Н. Столяров.
        Но, хотя сам по себе анализ проделанной работы был, есть и будет обязательной составляющей развития системы, для опубликования результатов этого анализа есть отдельный повод.
        В последнее время с появлением признаков стабилизации экономики и исчезновением <легких> денег растет спрос на аналитические системы. Соответственно среди программистов появилась мода на их разработку.
        И маркетинговые подразделения спешат превознести даже отсутствующие достоинства предлагаемых на продажу систем. Однако чудес не бывает. Полезная для банка система должна удовлетворять слишком многим требованиям, чтобы ее можно было разработать легко и быстро. В итоге удовлетворения не получают ни покупатели, ни продавцы, поскольку дискредитируется сама идея.
        Поэтому мне показалось полезным рассказать программистам, какие трудности ждут добросовестного разработчика аналитической системы, а банкирам - чего они вправе ожидать и требовать от систем, которые им предлагают купить.

  • © ЗАО "Группа РЦБ".