Ситуационный Evidence-анализ в интересах портфельного инвестора

Столяров Лев

Столярова Елена

ОБЪЕКТИВНЫЕ УСЛОВИЯ И НЕКОТОРЫЕ МЕТОДИКИ EVIDENCE-АНАЛИЗА

    В настоящее время в России есть 10-20 talk-аналитиков широкого профиля, которые периодически (примерно 1 раз в неделю) публикуют аналитические отчеты и статьи в средствах массовой информации; 50-100 региональных аналитиков и 200-300 отраслевых аналитиков.
    Количество источников информации, которое целесообразно было бы обрабатывать для выявления факторов, влияющих на бизнес крупного портфельного инвестора, составляет в настоящее время от 500 до 1000 (с учетом зарубежных источников).
    В этой статье популярно излагаются логика обобщения (свертки) качественной субъективной информации и формальные методы оценки достоверности (правдоподобности) совокупности факторов, влияющих на благоприятную или неблагоприятную для инвесторов ситуацию. Формальные оценки факторов в угрожающих или критических ситуациях могут выступать в качестве оценок рисков.
    Формальные методы Evidence-анализа основаны на теории свидетельств, разработанной Г. Шафером [1].
    Предлагаемый в статье ситуационный Evidence-анализ использует оригинальные работы Ю. И. Журавлева [2] и Д. А. Поспелова [3].
    Примеры, иллюстрирующие ситуационный анализ в применении к информационным системам бизнес-разведки, взяты из экспериментов, проведенных в лаборатории Computer Science Московского физико-технического института и в отделе информационно-вычислительных систем ВЦ РАН.

ИНФОРМАЦИОННЫЕ СИСТЕМЫ БИЗНЕС-РАЗВЕДКИ (СБР)

    СБР дают целенаправленные знания, необходимые для принятия бизнес-решений. Состав СБР, вне зависимости от того, носят ли они бумажный или электронный характер, определяется следующей цепочкой обработки информации: источники - измерители - верификаторы фактов - генераторы знаний. (Заметим, что эта цепочка принципиальна для получения знаний при обработке любой экспериментальной информации.)
    СБР состоят из нескольких конвейерных лент, которые постоянно (непрерывно) обеспечивают потоки целенаправленных знаний, осуществляя мониторинг и обработку информации определенного сегмента рынка.
    Источники обычно представляют собой тексты аналитических статей, аналитические записки собственных экспертов, составленные в принятых форматах, анкеты опросов и т.д.
    Измерители проводят выявление <интересной> для принятия решений информации путем сканирования источников с помощью семантических фильтров бумажным или электронным способом. И в том, и в другом случае имеется достаточно жесткая формализация как методов выявления необходимых фактов, так и технологии обработки источников.
    Верификаторы фактов - это методы и технологии оценки значимости, достоверности фактов, которые могут быть как бумажными, так и электронными. Основным требованием к верификаторам фактов является их жесткая алгоритмичность.
    Генераторы знаний - это окончательный и самый сложный этап обработки информации, который заканчивается кратким отчетом. Для бумажной СБР коэффициент сжатия информации (отношение количества слов в источнике к количеству слов в финальном отчете) порядка 103. Основа генератора знаний - формальные методы обобщения фактов, т.е. связывание и группирование фактов в классы. Далее факты, определяющие состояние сегмента рынка, будут называться факторами.

ФАКТОРЫ И ИХ <ЖИЗНЕННЫЙ ЦИКЛ>

    В отличие от объективных характеристик рынка (цена, объем продаж и выпуска продукции), talk-факторы субъективно выявляются экспертом как причины или движущие силы некоторых явлений. Так, факторами, влияющими на российский рынок, являются: высокая (низкая) цена на нефть, выборы в Госдуму, выборы президента, война в Чечне, различные указы президента, инфляционные ожидания, не сбывшиеся ожидания кредитов МВФ и т.д. Эти факторы могут быть <локальными> (региональные и отраслевые): слухи о переделе алюминиевого рынка, приход на московский бензиновый рынок крупной английской компании BP Amoco. Факторы обладают рядом формальных свойств, которые определяют методы их анализа:

  • Факторы возникают и пропадают. Моменты времени возникновения и прекращения действия фактора определяются экспертом с некоторой нечеткостью, например в виде временного интервала.
  • Некоторый фактор прекращает свое действие, но в этот момент возникает его последействие. Этот феномен редко учитывается talk-аналитиками, хотя любой эксперт выдаст исчерпывающую информацию о последействии фактора и его влиянии на рынок.
  • Возникновение новых факторов определяет специфику методов математического анализа их совокупностей, так как при быстро меняющихся наборах факторов нельзя использовать статистику (основанную на повторяемости и сходстве), т.е. при прогнозе всегда нужно учитывать возможность появления новых факторов.
        При выявлении, формулировании и группировании факторов чрезвычайно возрастает роль экспертов, работающих в рамках единой технологической дисциплины.

    СИТУАЦИИ И КЛАССЫ СИТУАЦИЙ

        Ситуация определяется набором действующих в данный момент t факторов (xi = 1) и факторов последействия (xj = 0, i ? j). Ситуация задается двоичным кодом в пространстве переменных X = .
        Варианты ситуации, определяемые как возможные наборы факторов, которые могут возникнуть на периоде прогноза, называются допустимыми ситуациями.
        На допустимых ситуациях экспертно определяются классы ситуаций, <интересных> для инвестиционного бизнеса. Например, такими могут быть благополучные для вложения (размещения) средств в сегмент рынка или некоторую бизнес-акцию ситуации или, наоборот, неблагоприятные, угрожающие ситуации, когда необходимо изымать вложенные средства, или же катастрофические ситуации, когда возврат вложенных средств исключен.
        В таблице показан пример благоприятных и неблагоприятных ситуаций, отмеченных экспертом для привлечения средств от инвесторов а1 и а2.

    Номер варианта

    Пространство Допустимые ситуации
    2 0 1 0 * - * -
    3 0 1 1 * - * -
    4 1 0 0 * - * -
    6 1 1 0 * - * -
    7 1 1 1 * - - +
    5 1 0 1 - + * -
    1 0 0 1 -- + * -
    0 0 0 0 - + - +

        Таким же образом могут быть определены классы ситуаций следующих типов:

  • <ничего не могу сказать по этому поводу>;
  • <по всей видимости, это благоприятная ситуация>;
  • <с вероятностью 0,5, это угрожающая ситуация>.
        Классификация ситуаций и объяснительный комментарий к принятым экспертом решениям зависят от технологического регламента, принятого в конкретной СБР.

    ИНДУКТИВНОЕ ОБОБЩЕНИЕ СИТУАЦИЙ, ЛОГИЧЕСКАЯ ФОРМУЛА СИТУАЦИОННЫХ ПАТТЕРНОВ, ДИАГРАММЫ ВЕЙЧА (ДВ)

        Процедуры индуктивного обобщения для выделенного класса ситуаций представляют собой методы нахождения той минимальной совокупности факторов, которые определяют класс ситуаций и позволяют качественно сравнивать классы между собой с целью выявления их сходства и различия.
        Конструктивное применение этих процедур показывается на простых примерах, где графическое построение - трехмерный куб (рис. 1) соотносится с данными таблицы.
        Итак, вводится пространство ситуаций X = , xi к {0, 1} для всех i = 1, ..., n. Вершины куба (см. рис. 1) суть допустимые ситуации в соответствии с таблицей. Ситуации, благополучные для инвесторов a1, а2, в таблице выделены экспертом и отмечены звездочкой.
        В пространстве X = они группируются в так называемые покрытия для благополучных ситуаций - ребро <4, 6>, грань <3, 7, 6, 2> (см. рис. 1). Эти покрытия называются максимальными (включают максимально возможное количество вариантов благополучных ситуаций).
        Максимальное покрытие обладает важным свойством: каждой его компоненте (точке, грани, ребру, кубу и т.д.) соответствует набор факторов, который является неизменным (инвариантным). Например, для грани <3, 7, 6, 2> это фактор x2 (см. рис. 1), все остальные факторы произвольно варьируются. Именно инвариантный набор факторов определяет класс ситуаций.
        Максимальное покрытие, состоящее из инвариантных наборов, является результатом индуктивного обобщения. Максимальному набору соответствует логическая формула в виде ДНФ (дизъюнктивной нормальной формы [2]), которая может быть принята за обобщенный образ (паттерн) класса ситуаций. Например, для максимального покрытия на рис. 1, состоящего из <4, 6> и <3, 7, 6, 2>, логическая формула паттерна благополучных ситуаций

        x2vx-1x3,
        где - знак дизъюнкции; <-> - знак отрицания, <> - знак конъюнкции.

        Интерпретация (чтение) формулы может выглядеть следующим образом: <Благополучная ситуация для инвестора a1 возникнет в случае, если будет действовать фактор x2 либо фактор x3 (при отсутствии фактора x1), либо оба эти случая>.
        Паттерн класса ситуаций в n-мерном пространстве удобно представлять двухмерными таблицами, которые называются диаграммами Вейча (ДВ) [4]. Каждая клеточка диаграммы соответствует десятичному номеру кода ситуации. Клеточки, входящие в класс ситуации, отмечаются специальным образом (цветом, штриховкой и т.д.).
        На рис. 2 приведены ДВ пространства из трех факторов, отмечены паттерны для класса ситуаций А1 (<3, 7, 6, 2> и <4, 6>) и А2 (<1, 5>, <5, 4>, <6, 2>, <2, 3>).
        Диаграммы Вейча удобны как для визуального, так и для формального анализа. На диаграммах хорошо интерпретируются операции объединения, пересечения и разности классов ситуаций, которые необходимы при анализе сходства и различия паттернов. При этом диаграммы Вейча, где клеточки <склеены> в фигуры, соответствуют небольшому числу факторов, которые устойчиво определяют ситуацию. Хаотическая <раскраска> клеточек диаграммы означает неустойчивость ситуации.

    УВЕРЕННОСТЬ В ФАКТОРАХ, СИТУАЦИЯХ И ОБРАЗАХ (ПАТТЕРНАХ), ПРЕДСТАВЛЯЮЩИХ КЛАССЫ СИТУАЦИЙ

        Основной вопрос, который возникает в СБР, заключается в том, как засвидетельствовать (оценить) степень важности факторов или силу их влияния на ту или иную ситуацию. Такое свидетельство (evidence) должно быть максимально объективным. Существует, например, миф о том, что английская разведка получила значительно больше информации о движении немецких подводных лодок в 1940-1941 гг. из газет и рекламных объявлений (при специальной массовой обработке), чем из агентурных сообщений.
        Считается, что количество упоминаний о факторе (количество цитирований) определяет степень уверенности в его важности, далее будем употреблять термин <потенциал уверенности> (E). (В данной статье методика измерения потенциала уверенности отдельного фактора не обсуждается.)
        Считается, что первичное свидетельство о потенциале уверенности в каждом факторе получено, например, из СМИ, что потенциал уверенности в важности фактора после действия затухает по линейному закону, начиная от момента прекращения действия фактора, при этом время затухания потенциала до нулевого значения оценивается экспертно. Затухание фактора говорит о том, что о нем <забывают> и его влияние (давление) на ситуацию ослабевает со временем.
        Для каждого варианта ситуации (точки пространства факторов) потенциал уверенности рассчитывается по методике Пойа [5].
        Потенциал уверенности для паттерна класса ситуаций рассчитывается по методике Г. Шафера [1], т.е. суммируются потенциалы всех компонент, входящих в покрытие паттерна. Таким образом, учитывается конфигурация покрытия (его фигура на ДВ), представляющая именно этот паттерн. Для примера (см. рис. 1): потенциал уверенности паттерна благополучной ситуации для инвестора а1 имеет вид:

        ЕА1 = (Р4 + Р6 + Р2 + Р7 + Р3 +
        + Р<4, 6> + Р<7, 6> + Р<7, 3> + Р<3, 2> + + Р<6, 2> + Р<2, 3, 7, 6>),
        где P - потенциалы компонент покрытий, входящих в паттерн.

    EVIDENCE-АНАЛИЗ КЛАССОВ СИТУАЦИЙ (ПАТТЕРНОВ)

        Далее операции анализа демонстрируются на ДВ для четырех факторов (ДВ4). На рис. 3 приведен пример покрытия на ДВ4, соответствующий паттерну с логической формулой х3 (класс ситуаций зависит только от фактора x3).
        Можно ввести понятие потенциала сомнения в некоем паттерне А как инверсию ДВ (дополнение ДВ до паттерна А) и вычислить потенциал сомнения для соответствующего максимального покрытия, как показано на рис. 4.
        Потенциал сомнения выражает риск, с которым мы принимаем решение, основываясь на тех или иных факторах.
        Часто требуется вычислить уверенность в благополучности ситуации для портфеля клиентов. В этом случае ДВ-паттерн портфеля будет пересечением ДВ-паттернов клиентов с вычислением соответствующего потенциала уверенности Е для ДВ-портфеля .

    EVIDENCE-АНАЛИЗ ВНОВЬ ПОЯВЛЯЮЩИХСЯ ФАКТОРОВ

        Воздействие вновь появляющихся факторов на уже существовавшие до некоторого момента паттерны ситуации может иметь разрушительный характер. Пример такого разрушения показан на рис. 5, где паттерн, построенный на пяти факторах, вдруг разрушается при появлении фактора х6. И наоборот, новый фактор может не только не носить разрушающего характера, но и приводить к так называемым фартовым ситуациям, когда благоприятная ситуация усиливается за счет нового фактора.
        Evidence-анализ - это новое направление в прогнозировании развития ситуаций, когда пространство факторов, определяющее <интересные> для инвесторов ситуации, все время меняется: старые факторы <умирают>, а новые <нарождаются>.
        Фундамент анализа составляют первичные экспертные оценки факторов и понимание экспертами сущности <интересных> ситуаций для конкретных инвесторов, поэтому Evidence-анализ относится к категории субъективного анализа. Но, несмотря на его субъективность, он дает возможность весьма логичной автоматической свертки информации, которая может быть использована для принятия решений в бизнес-процессе.

  • © ЗАО "Группа РЦБ".