23 октября 2023, 16:39
Количество просмотров 2186

Изучение перспектив банковского бизнеса Евразии. Часть 2

Олег Брагинский, наш постоянный автор и основатель «Школы траблшутеров», и ее ученик Рамиль Мамедов продолжают рассказ о том, как прогнозировали востребованность финансовых услуг рынков стран, которые в условиях санкционного давления проводят дружественную политику по отношению к РФ, по данным о поведении пользователей мобильной версии геоинформационного сервиса 2ГИС.
Изучение перспектив банковского бизнеса Евразии. Часть 2

В первой части материала мы описали пространство задачи: 17 мегаполисов, с суммарной численностью населения в 34 млн человек, которые за первые два календарных месяца 2020–2023 годов интересовались доступностью финансовых сервисов, совершив 32,4 млн поисковых запросов.

Выбрав 15 наиболее банковских рубрик, оценили востребованность функции прокладки маршрутов в количестве на пользователя. Рассчитали популярные фразы, которые разделили на общие — неоправданно часты и дифференцирующие — встречаются при поиске конкретного бизнеса.

Текстовые строки, вбиваемые пользователями 2ГИС, отранжировали и предложили к встраиванию в семантические ядра сайтов соответствующих сервисов. Построили матрицы BCG, спозиционировав финансовые услуги в пространстве доли рынка и перспективности индустрии.

Построили графики временного распределения спроса для популярнейших рубрик по часам, дням и неделям, чтобы оценить разницу активности потребителей, для потенциальной коррекции распорядка работы офисов, филиалов, отделений и устройств денежного содействия.

Пришла пора выяснить, существует ли возможность предсказывать поведение одной рубрики через показатели других. Полезны ли корреляции в пределах страны или населенного пункта по количеству пользователей или интенсивности запросов. С зависимостью прямой или обратной.

Сформировали общую корреляционную матрицу однозвенных зависимостей (см. рис. 1), отражающую влияние каждого бизнеса на каждый, без учета страны, города, интенсивности запросов, количества пользователей. Покрыли получившуюся таблицу температурной раскраской.

ris-01.webp
Рис. 1. Общая корреляционная матрица однозвенных зависимостей
Нажмите для увеличения

Светлая диагональ отражает очевидные единичные корреляции показателей к ним же. Верхний правый треугольник симметричен нижнему левому, поэтому вычислительная сложность исследования оказалась сравнительно невелика. Приступили к расслоению таблиц на полезные.

Отсортировав корреляции по величине, выделили позитивную корреляционную матрицу однозвенных зависимостей (см. рис. 2), предсказательная сила которой позволяет использовать ее в формулах без коррекции знака. В отличие от общей таблицы укажем числовые значения ячеек.

Рис. 2. Положительная корреляционная матрица однозвенных зависимостей
Нажмите для увеличения

Выбрав наиболее сильные негативные зависимости, получили отрицательную корреляционную матрицу однозвенных зависимостей (см. рис. 3), которую сможем применить с инверсионным изменением знака на противоположный, чтобы повысить устойчивость будущих формул.

Рис. 3. Отрицательная корреляционная матрица однозвенных зависимостей
Нажмите для увеличения

В нейтральную корреляционную матрицу однозвенных зависимостей (см. рис. 4) отошли ячейки, имеющие невысокую предсказательную силу в положительном и отрицательном диапазонах. Задействование подобных зависимостей не усиливает прогностику и может даже ослабить.

Рис. 4. Нейтральная корреляционная матрица однозвенных зависимостей
Нажмите для увеличения

Перешли к построению общей корреляционной матрицы двухзвенных зависимостей (рис. 5), отражающую влияние каждого бизнеса на каждый, только с учетом города. Аналогичным образом рассчитали положительную (рис. 6), отрицательную (рис. 7) и нейтральную (рис. 8) вариации.

ris-05.webp
Рис. 5. Общая корреляционная матрица двухзвенных зависимостей
Нажмите для увеличения
ris-06.webp
Рис. 6. Положительная корреляционная матрица двухзвенных зависимостей
Нажмите для увеличения
ris-07.webp
Рис. 7. Отрицательная корреляционная матрица двухзвенных зависимостей
Нажмите для увеличения
ris-08.webp
Рис. 8. Нейтральная корреляционная матрица двухзвенных зависимостей
Нажмите для увеличения

Подобным сценарием усложнили рассмотрение влияний до трехзвенных зависимостей (см. рис. 9), где элемент «город-бизнес» расширили вариацией «запросы или пользователи». Получили положительную (рис. 10), отрицательную (рис. 11) и нейтральную (рис. 12) модели.

ris-09.webp
Рис. 9. Общая корреляционная матрица трехзвенных зависимостей
Нажмите для увеличения
ris-10.webp
Рис. 10. Положительная корреляционная матрица трехзвенных зависимостей
Нажмите для увеличения
ris-11.webp
Рис. 11. Отрицательная корреляционная матрица трехзвенных зависимостей
Нажмите для увеличения
ris-12.webp
Рис. 12. Нейтральная корреляционная матрица трехзвенных зависимостей
Нажмите для увеличения

Наконец, мы получили шанс построить долгожданные формулы, отражающие покомпонентный состав городов, рубрик и показателей, на которые смогут умеренно опираться дотошные аналитики бизнесов, планирующих выход на новые территории или интенсификацию в домашних регионах:

I. Направленность положительная. Прогноз активности оцениваемого бизнеса строится на наиболее коррелирующих видах деятельности:

Инвестиционные компании =
f{0.8242 × Банки
,0.8193 × Операции на фондовом рынке
,0.7734 × Банкоматы
,0.7432 × Микрофинансирование
,0.7290 × Негосударственные пенсионные фонды
,0.7188 × Системы денежных переводов
,0.7139 × Лизинговые услуги
,0.7031 × Кредитные потребительские кооперативы
,0.6265 × Банковское оборудование}

II. Направленность отрицательная. Предсказание основывается на зависимостях обратной или инверсной природы:

Кредитные потребительские кооперативы =
f{-1.0000 × Обмен валюты
, -0.5713 × Бюро кредитных историй
, -0.3088 × Ремонт банковского оборудования
, -0.2759 × Лизинговые услуги
, -0.2727 × Негосударственные пенсионные фонды
, -0.2544 × Инвестиционные компании
, -0.2009 × Банковское оборудование
, -0.1877 × Паевые инвестиционные фонды (ПИФы)
, -0.1056 × Услуги факторинга}

III. Направленность смешанная. Формула сочетает наиболее существенные положительные и отрицательные корреляции:

Лизинговые услуги =
f{1.0000 × Обмен валюты
, 0,9072 × Негосударственные пенсионные фонды
, 0,8726 × Банки
, 0,8711 × Инвестиционные компании
, 0,8433 × Микрофинансирование
, 0,8110 × Банкоматы
, 0,8091 × Банковское оборудование
, 0,7871 × Системы денежных переводов
, -0.3972 × Ремонт банковского оборудования}

IV. Однородность органическая. Для построения тренда используются смысловые ряды переменных: запросы базируются на запросах, пользователи на пользователях:

СПБ. Микрофинансирование. Запросы =
f{1.0000 × Алматы. Обмен валюты. Запросы
, 0,9448 × Новосибирск. Банкоматы. Запросы
, 0,9336 × Бишкек. Банки. Запросы
, 0,9028 × Бишкек. Системы денежных переводов. Запросы
, 0,8506 × ОАЭ. Инвестиционные компании. Запросы
, 0,7192 × Бишкек. Операции на фондовом рынке. Запросы
, 0,6934 × Новосибирск. Лизинговые услуги. Запросы
, 0,6626 × Новосибирск. Негосударств. пенсионные фонды. Запросы
, 0,6152 × Астана. Банковское оборудование. Запросы}

V. Однородность синтетическая. В формулу замешиваются показатели наибольшей предсказательной силы без учета их физической природы:

Алматы. Операции на фондовом рынке. Запросы =
f{1.0000 × Алматы. Обмен валюты. Запросы
, 0,4238 × Бишкек. Ремонт банковского оборудования. Запросы
, 0,8823 × Алматы. Банки. Пользователи
, 0,8813 × Алматы. Микрофинансирование. Пользователи
, 0,8442 × Алматы. Инвестиционные компании. Пользователи
, 0,8213 × Алматы. Банкоматы. Пользователи
, 0,7910 × Алматы. Лизинговые услуги. Пользователи
, 0,7812 × Новосибирск. Системы денежных переводов. Пользователи
, 0,7002 × Астана. Банковское оборудование. Пользователи}

VI. Однородность адаптационная. Задействуется оптимизационный алгоритм вариативности, чередующий переменные, не допуская преобладания единственного типа:

Астана. Паевые инвестиционные фонды (ПИФы). Пользователи =
f{0.8037 × Калининград. Негосударственные пенсионные фонды. Пользователи
, 0,7456 × ОАЭ. Лизинговые услуги. Пользователи
, 0,7070 × Санкт-Петербург. Услуги факторинга. Пользователи
, 0,6011 × ОАЭ. Банковское оборудование. Пользователи
, 0,5781 × Бишкек. Бюро кредитных историй. Пользователи
, 1,0000 × Алматы. Кредитные потребительские кооперативы. Запросы
, 0,7256 × ОАЭ. Банковское оборудование. Запросы
, 0,6494 × Владивосток. Микрофинансирование. Запросы
, 0,6392 × Санкт-Петербург. Услуги факторинга. Запросы}

VII. Комбинаторность низкая. Для предсказания востребованности одного бизнеса в городе используются другие бизнесы этого же населенного пункта:

Владивосток. Системы денежных переводов =
f{0.8296 × Владивосток. Банки
, 0,8154 × Владивосток. Банкоматы
, 0,6377 × Владивосток. Микрофинансирование
, 0,5933 × Владивосток. Обмен валюты
, 0,5552 × Владивосток. Инвестиционные компании
, 0,4231 × Владивосток. Лизинговые услуги
, 0,3665 × Владивосток. Операции на фондовом рынке
, 0,3508 × Владивосток. Банковское оборудование
, 0,2971 × Владивосток. Паевые инвестиционные фонды (ПИФы)}

VIII. Комбинаторность средняя. Тренд деятельности в городе строится на основе других активностей в иных населенных пунктах:

Москва. Негосударственные пенсионные фонды =
f{1.0000 × Алматы. Обмен валюты
, 0,6621 × Владивосток. Паевые инвестиционные фонды (ПИФы)
, 0,5913 × Новосибирск. Банки
, 0,5161 × Санкт-Петербург. Лизинговые услуги
, 0,5112 × Владивосток. Бюро кредитных историй
, 0,4951 × Калининград. Банковское оборудование
, 0,4700 × Санкт-Петербург. Операции на фондовом рынке
, 0,4624 × Новосибирск. Кредитные потребительские кооперативы
, 0,3989 × Санкт-Петербург. Инвестиционные компании}

IX. Комбинаторность максимальная. Прогноз строится на любом количестве бизнесов любых населенных пунктов для получения максимальной сходимости:

Новосибирск. Сельскохозяйственные кредитные потребительские кооперативы =
f{1.0000 × Астана. Паевые инвестиционные фонды (ПИФы)
, 0,8662 × Ташкент. Бюро кредитных историй
, 0,6636 × ОАЭ. Лизинговые услуги
, 0,6323 × Бишкек. Негосударственные пенсионные фонды
, 0,5786 × Калининград. Операции на фондовом рынке
, 0,5771 × Ташкент. Кредитные потребительские кооперативы
, 0,5229 × Астана. Системы денежных переводов
, 0,4983 × Санкт-Петербург. Банковское оборудование
, 0,4844 × Москва. Обмен валюты}

X. Звенность. Одно и двух. Формула предсказания активности вида деятельности складывается из единичных компонент — «бизнес» и парных, вида «город-бизнес»:

Банковское оборудование =
f{1.0000 × Обмен валюты
, 0,7256 × Паевые инвестиционные фонды (ПИФы)
, 0,5864 × Инвестиционные компании
, 0,5640 × Операции на фондовом рынке
, 0,5288 × Банки
, 0,4502 × Ташкент. Микрофинансирование
, 0,4214 × Санкт-Петербург. Ремонт банковского оборудования
, 0,4116 × ОАЭ. Банкоматы
, 0,3982 × Ташкент. Бюро кредитных историй
, 0,3901 × Бишкек. Системы денежных переводов}

XI. Звенность. Двух и трех. Зависимость формируют корреляционные пары «город-бизнес» и тройки «город-бизнес-показатель»:

Ремонт банковского оборудования =
f{0.7847 × Ташкент. Бюро кредитных историй
, 0,6172 × Алматы. Паевые инвестиционные фонды (ПИФы)
, 0,5156 × Астана. Негосударственные пенсионные фонды
, 0,4214 × ОАЭ. Банковское оборудование
, 0,3550 × Ташкент. Операции на фондовом рынке
, 0,2915 × Санкт-Петербург. Обмен валюты. Запросы
, 0,2642 × Астана. Услуги факторинга. Пользователи
, 0,2551 × Калининград. Инвестиционные компании. Запросы
, 0,2515 × Бишкек. Банкоматы. Запросы}

XII. Звенность. Одно, двух и трех. Тренд востребованности поставщиков товаров и услуг задается зависимостями любой природы, отсортированными по убыванию корреляции:

Банки =
f{0.9775 × Инвестиционные компании
, 0,9717 × Банкоматы
, 0,9653 × Микрофинансирование
, 0,9287 × Операции на фондовом рынке
, 0,8057 × Алматы. Лизинговые услуги
, 0,7734 × Астана. Банковское оборудование
, 0,6982 × Ташкент. Бюро кредитных историй
, 0,6665 × Новосибирск. Негосударственные пенсионные фонды
, 0,4966 × Астана. Ремонт банковского оборудования
, 0,3799 × Алматы. Услуги факторинга. Пользователи}

Предложенный подход и проведенное исследование позволили сделать вывод: предсказывать востребованность и успешность бизнесов на домашней и гостевых территориях представляется возможным, используя рубрики собственные и смежные, численности запросов и пользователей.

Подобный анализ провели по 1556 рубрикам, что означает апробацию методики на масштабе, в 10 760 раз превышающем представленный в данной публикации. Изучили 902 млн запросов, выполненных 18 млн человек, что привело к построению матриц корреляции на 968 млн ячеек.

Остается дождаться геоинформационных итогов января-февраля 2024 года, чтобы проверить построенные формулы на свежей контрольной выборке. Подобное тестирование должно продемонстрировать устойчивость модели или показать, что мы самозабвенно ошибались.


PLUSworld в соцсетях:
telegram
vk
dzen
youtube