Можно ли предсказать революцию?
Революции (и другие кризисы) имеют свои теории, методики и способы предсказания. Интересующимся читателям стоит сделать акцент на следующих авторах и источниках: Джек Голдстоун[1], Питер Турчин[2], Нассим Талеб[3] и примерах очень авторитетной российской школы[4] аналитики.
Однако даже если в ближайшее время будет создана «универсальная теория политических кризисов», через некоторое время ей на смену придет следующая. Темп изменений в цивилизации растет, и вполне возможно, что каждая последующая теория будет устаревать сразу после публикации, а возможно, и до нее. И мы вряд ли получим жесткую и стабильно работающую в любых условиях причинно-следственную связь между объективными причинами и революционными кризисами.
Доля случайности, непредсказуемости и хаоса всегда будет существенной. Однако если ориентироваться на «вероятностный» подход и быть менее требовательным к жесткости выводов, то можно попробовать спрогнозировать кризис.
Самое простое решение – исторические данные, предположение о том, что определенное сочетание факторов, повторившись когда-то в прошлом, по аналогии приведет к такому же явлению в будущем. Аналогия не совсем точная, но вполне может быть положена в основу предиктивной модели классификации, а также в основу подсчета вероятности наступления события положительного класса (и отрицательного – по политико-экономическим последствиям).
Итак, представим, что мы не знаем, какие факторы (и какое их сочетание) могут привести к кризису. У нас нет и «предобученной» модели – политической теории. Используем только стандартные ансамблевые модели машинного обучения и исторические данные.
Первый эксперимент на исторических данных: революции и революционные ситуации
Воспользуемся базой данных The Cross National Time Series (CNTS)[5] с выборкой за 1991–2019 годы со 151 показателем. Всего за указанный период времени насчитывается 588 кризисных «революционных» событий. Каждое из которых можно определить следующим образом: «любое незаконное или насильственное изменение в высшей правительственной элите, любая попытка такого изменения или любое успешное либо неудачное вооруженное восстание, целью которого является независимость от центрального правительства (сепаратизм)».
Общее количество событий положительного класса составило 10,34% от общего количества наблюдений, сгруппированных по принципу «одна страна – один год» (5686 наблюдений).
Чтобы доказать принципиальную возможность прогнозирования, необходимо получить значение метрики ROC_AUC больше 0,5 («случайное гадание»). В результате эксперимента оптимизированная (с подобранными гиперпараметрами) ансамблевая модель двухклассовой классификации lgb.LGBMClassifier[6] достигла целевого значения 0,92–0,93 при общей точности прогнозов (accuracy) в 0,926–0,933.
Рис. 1. Оценка классификатора по вероятности классов для вычисления ROC-AUC (roc_auc_score (y_test, y_prob) для модели, оптимизированной по критерию F1_score
Упрощенно это означает, что в 92–93 наблюдениях из каждых 100 мы верно определили наличие или отсутствие кризисного события. С учетом дисбаланса классов примерно 1 к 10 – это не идеальный результат, однако помимо предсказаний мы можем получить и вероятностные значения соотнесения итогового события к целевому классу. И здесь в случае вероятности выше 0,5 необходимо принимать непосредственные меры, впрочем, и при более низких вероятностях (с учетом достаточной «грубости» классификатора) не стоит расслабляться.
Второй эксперимент: военные перевороты
В данном опыте мы будем искать событие, связанное с «количеством внеконституционных или насильственных изменений в высшем правительстве элиты и/или ее эффективный контроль над структурой власти нации в данный год». Термин «переворот» включает, но не исчерпывается, термином «успешная революция». Неудачные перевороты в счет не идут и не учитываются (в отличие от первого эксперимента).
В обозначенной выборке это достаточно «редкое» событие по сравнению с другими кризисами: зафиксировано всего 68 эпизодов, или 1,2% от общего числа наблюдений. Но, впрочем, как показала проверка с использованием модели детекции аномалий, ни разу не «невероятное».
Для работы использовался ансамблевый алгоритм CatBoost[7], созданный «сумрачным гением» российского «Яндекса», с оптимизированными по критерию F1_score гиперпараметрами.
Справочно: метрика F1_score – среднее гармоническое между долей истинно положительных результатов среди всех предсказанных положительных и долей истинно положительных результатов среди всех реальных положительных.
Рис 2. Матрица ошибок для базовой модели предиктивной аналитики переворотов, оптимизированной по критерию F1_score
В результате прогностический алгоритм довольно точно предсказал наступление 14 из 23 переворотов (9 переворотов он все-таки пропустил) и ошибочно предположил военный переворот в 5 случаях.
Что является движущей силой политических кризисов?
Прежде всего это сочетание факторов, случайностей, отдельных событий. Тем не менее можно попытаться определить вес каждого такого фактора. Притом что зависимость может быть вовсе не линейной (прямой или обратной), а более сложной.
Текущий перечень признаков второго эксперимента следующий (см. таб. 1)
Таб. 1. Вес признаков модели прогнозирования переворотов (первые десять факторов)
Данный перечень не является исчерпывающим (вес и расстановка признаков должны быть перепроверены – таблица приведена скорее для иллюстрации исследовательского принципа). Однако уже сейчас можно сделать предварительные выводы: вероятность переворота повышается, если в исполнительной власти произошли изменения (нарушен баланс элит, появились группы, чувствующие себя ущемленными), законодательная власть неэффективна и зависима от исполнительной, конституция (или основные законы страны) очень часто менялась.
Также вероятность переворота зависит от типа политического режима, наличия партийных коалиций (способности политических сил договариваться между собой), признания легитимности правящей партии и ряда экономических факторов: производство электроэнергии, валовой национальной продукт и распространенность интернета. Еще раз отметим, что данный вывод не является итоговым.
В отличие от революционных процессов подавляющее количество вооруженных переворотов связано в первую очередь с политическим развитием страны и устойчивостью ее политических институтов. Военный переворот – это следствие внутриэлитного противостояния в стране, слабости политической элиты, находящейся у власти (вследствие перепроизводства, деградации, утраты креативной функции и так далее). Неудавшийся переворот и попытка такого переворота скорее подтверждают устойчивость политической системы.
Сравним набор показателей для военного переворота с данными первого эксперимента. Для корректности используем тот же более долгий по времени работы алгоритм CatBoost (вместо быстрого lgb.LGBMClassifier) c подобранными гиперпараметрами под критерий f1 на той же выборке, так же сбалансированной по классам при помощи синтетических данных RandomOverSampler[8] из модуля imblearn.over_sampling. Во всех описанных экспериментах, с учетом того, что в выборке присутствует дисбаланс положительного и отрицательного класса, во всех случаях мы используем синтетические данные для лучшего обучения моделей, они незначительно, но повышают итоговые метрики моделей. Синтетическими данными заполняется только тренинговая выборка – поэтому результаты тестирования не искажаются.
Рис. 3. Матрица ошибок для базовой модели предиктивной аналитики революционных кризисов, оптимизированной по критерию F1 score
В таб. 2 приведен перечень (еще раз отметим – таблица носит характер предварительного вывода) факторов, влияющих на формирование условий для революции и сопоставимых событий. Главный признак – текущая партизанская война, включая сепаратистские движения на отделение от центра. Инвестиции в подобные страны и регионы будут носить крайне рисковый характер. Сюда также мы вносим антиправительственные демонстрации с очевидным выводом: чем больше, чем они чаще, тем больше шансов на реализацию кризисного сценария. Этот пункт логически может быть связан с правительственными кризисами. Отметим значительный факт экономических факторов: потребление электроэнергии, телефонизация, импорт, рост населения, охват образованием и долю страны в мировой торговле.
Таб. 2. Вес признаков модели прогнозирования революционных ситуаций (первые десять факторов)
Дальнейшее направление исследования может быть следующим: выявление веса признаков из отмеченного перечня с помощью feature_importance, выявление признаков, имеющих максимальное влияние на вероятность наступления кризисного события. Этот подход может реализоваться двумя путями: 1 – удаление из перечня признаков, переобучение модели, оценка метрик; 2 – введение нового признака с рандомным заполнением значений: все те признаки, чей вес будет выше «рандомного», останутся, а остальные будут отнесены к категории «мусорных признаков». Одновременно необходимо протестировать идею временного лага между значениями признаков и фактом реализации прогнозируемого события.
Справочно: Feature importance – это техника в машинном обучении, которая определяет относительную важность каждого признака в датасете при прогнозировании целевой переменной.
Выводы
А что если попробовать обучить одну модель на одном периоде, другую – на другом, третью – на третьем? Попробовать разные настройки, перекрестную валидацию, а там, где у нас есть объективные пробелы в данных, использовать другие методы (конструирование признаков, обучение с подкреплением, прогнозирование трендов на основе новостей запросов языковых моделей и т. п.). Так мы со временем придем к гибридной человеко-машинной системе предиктивной аналитики политических кризисов и траекторий развития, которая будет соответствовать условной «психоистории» в стиле Айзека Азимова.
Более сложные модели, учитывающие временной лаг, комбинацию разных источников и отбор наиболее значимых признаков, и исключение сильно коррелирующих между собой, сделают прогнозы более точными. Разумеется, для того чтобы «предсказать» «историю будущего» на 25–50 лет вперед, такой метод не будет эффективным.За указанный период времени поменяется набор весов признаков, да и сами признаки. И модель как минимум надо будет дообучать.
Однако на горизонте до 3–5 лет для коротких инвестиций такие прогнозы вполне возможны. Их результаты также можно использовать для повышения эффективности политического управления, совершенствования политической системы и избегания масштабных кризисов. Так и для прогнозирования страновых рисков для инвестиций.
Если сравнивать политическую систему, точнее – модель принятия политических решений в политической системе, с моделью машинного обучения – по аналогии с моделью машинного обучения, появится возможность точной настройки ее «гиперпараметров» если не для предотвращения, то как минимум для успешного прохождения всех политических и иных кризисов (при таком подходе кризис становится вызовом, запускающим процесс обновления и модернизации политической системы).
Когда система работает эффективно и результативно, то «неустойчивое равновесие» сменяется «устойчивым». А в последнем случае незначительные флуктуации и небольшие потрясения скорее полезны для политических систем, поскольку повышают их приспосабливаемость и адаптивность, совершенствуют модель принятия решений.
Политическая аналитика: от субъективизма к объективности
В современном мире политическая и политико-экономическая аналитика часто страдает от субъективизма и чрезмерной увлеченности нарративами. Решения могут приниматься на основе идеологических убеждений и предубеждений, а также следования умозрительно выведенным теориям и моделям. Некоторые из этих моделей были созданы для того, чтобы обосновать права определенной элиты на власть с использованием наукообразных терминов и определений, имеющих позитивную коннотацию.
Это приводит к эффектам «тоннельного видения», подмены причины и следствия и другим когнитивным ошибкам и искажениям, которые обычно свойственны инфантильным или зависящим от психостимулирующих веществ личностям.
В результате модель принятия политических решений начинает сбоить и допускать ошибки, она становится неэффективной и нерезультативной. Подобно переобученной модели машинного обучения, система накапливает ошибки, функция потерь (кросс-энтропия или logloss при обучении модели) растет — и мы со временем получим масштабный кризис.
Справочно:
перекрестная энтропия (кросс-энтропия) — это функция потерь в машинном обучении, которая используется для количественной оценки разницы между двумя распределениями вероятностей. Она говорит о том, насколько вероятно, что события произойдут на основе вероятностей: если это очень вероятно, то кросс-энтропия малая, а если маловероятно — высокая.
Чтобы избежать кризиса и улучшить ситуацию в модели принятия решений в политической системе, необходимо провести настройку гиперпараметров и сменить принципы негативного отбора кадров элиты на меритократически-конструктивные.
Справочно: гиперпараметры — это настройки модели машинного обучения, которые определяют ее общую архитектуру, структуру, способ, скорость и другие характеристики обучения. Определяются до начала процесса обучения и не изменяются в процессе. Гиперпараметры оказывают влияние на то, как модель будет обучаться, какие признаки будут учитываться и какие ограничения будут наложены на процесс обучения. Гиперпараметрическая оптимизация в ряде случаев может улучшить производительность и метрики модели.
Прикладное использование предиктивной политической аналитики в инвестиционной отрасли
Самое очевидное направление: принятие инвестиционных решений: когда уходить / когда заходить – и самое главное: куда? Высокая вероятность реализации странового кризиса должна останавливать инвестиции и способствовать их выводу с рискового рынка, переходу части средств внешних и внутренних инвесторов, например, в криптовалюты.
В то же время реализовавшийся кризис, но не приведший к катастрофическим политическим потрясениям и гибели системы (если убрать факторы случайности), может свидетельствовать о ее высокой устойчивости и способности к адаптации. Для внешнего инвестора это всегда «лакомый кусок». Страхи и опасения останавливают его конкурентов, а значит, при рациональной оценке рисков он может получить ощутимые преимущества и привилегии, если в числе первых придет или вернется на страновой рынок. В такой ситуации «первые получают все».
Вероятность «успешного» государственного переворота, когда полностью меняются внутриэлитные расклады, на самом деле невысокая: всего 68 эпизодов за исследованный период в более чем 200 странах. Так что, если не забредать в совсем уж «гнилые» местечки и диверсифицировать портфель инвестиционных проектов на 10–15 стран, успешный высокомаржинальный бизнес вполне возможен.
Революционные ситуации, сепаратистские выступления и им подобные ситуации из первого эксперимента встречаются чаще почти на порядок. Если противоречие разрешилось, политический режим устоял по аналогии с окончанием военных конфликтов, могут появляться интересные «точки входа». И их ожидание измеряется не столетиями, а скорее годами, что для крупного и осторожного бизнеса вполне нормально.
Ключом к преодолению политических внутригосударственных кризисов и межгосударственных (геополитических) противостояний, а также правильной настройки гиперпараметров являются экономика (экономические институты), система политических институтов и ценностей (или идеология).
Развитые рынки и финансовые институты, экономическое сотрудничество, инвестиции, отказ от торговых войн, односторонних санкций и ограничений, партнерская торговля не только являются фундаментом многовекторной политики, экономического процветания, но и в определенной мере уменьшают саму возможность столкновений между разными государствами и политическими системами: вероятность вооруженного конфликта обратно пропорциональна темпам прироста товарооборота между странами и обратно пропорциональна квадрату прироста благосостояния их граждан.
Политические институты в системе предполагают предсказуемость, стабильность.
Идеология, балансирующая набор традиционных, консервативных ценностей в обществе и ценностей развития, инноваций, определяет успехи и возможности политической системы по поддержанию своей идентичности, суверенности и перспективы ее развития, эволюционной трансформации, а также цели и задачи, сценарии достижения будущего.
Примечание
Результаты экспериментов можно посмотреть (обсудить, покритиковать) подробнее – см. публикации:
1. Предиктивная аналитика политических кризисов с помощью machine learning (на исторических данных)
https://habr.com/ru/articles/852276/
2. Государственные перевороты: бармалеи выпрыгивают как черти из табакерки.
Не хотите, дети, в Африку сыграть
https://habr.com/ru/articles/853214/
[1] https://www.mercatus.org/scholars/jack-goldstone
[4] https://publications.hse.ru/chapters/557006935
[6] https://lightgbm.readthedocs.io/en/latest/pythonapi/lightgbm.LGBMClassifier.html
[7] https://yandex.ru/dev/catboost/
[8] https://imbalanced-learn.org/stable/references/generated/imblearn.over_sampling.RandomOverSampler.ht...
[9] https://habr.com/ru/articles/852276/
[10] https://habr.com/ru/articles/853214/