21 марта 2023, 18:01
Количество просмотров 1878

Успех «Чебурашки» можно повторить с помощью ИИ. И не только в киноиндустрии!

О том, как кассовые сборы кинопроекта (портфеля кинопроектов) прогнозируются с помощью алгоритмов машинного обучения и нейросетей, рассказывает Антон Дождиков, аналитик данных, кандидат политических наук.
Успех «Чебурашки» можно повторить с помощью ИИ. И не только в киноиндустрии!

Фильм «Чебурашка» Дмитрия Дьяченко установил рекорд по доходности для национальных проектов. Этому отчасти поспособствовала сложившаяся ситуация на рынке, однако художественные качества проекта и компетенции организаторов кинопроизводства и прокатчиков также сыграли свою роль. Сделать не только отдельные кинопроекты, но и всю креативную индустрию успешнее и прибыльнее могут помочь инструменты mасhine learning, а в перспективе и deep learning. С их помощью индустрия и смежные отрасли получат алгоритмы прогнозирования и расчетов рисков/доходов для привлечения государственных и частных инвестиций.

Объективные и субъективные факторы успеха

В отношении объективных внешних причин успеха «Чебурашки» следует отметить такие факторы, как уход иностранных дистрибьютеров и контента с российского рынка, а также выпуск проекта под Новый год — традиционно самый удачный период для отечественных кинокартин (вспомните ту же «Иронию судьбы» или «Обыкновенное чудо»).

В наличии имеются и две субъективные причины. Первая — фильм выполняет иллюзорно-компенсаторную функцию для человеческой психики в трудное время, сопоставимую по эффективности воздействия с религиозной практикой или посещением профессионального психотерапевта. В таких условиях незначительные недочеты по компьютерной графике и в целом по проекту остаются за рамками фокуса внимания зрителя. Вторая — фильм апеллирует к советскому культурному наследию и имеет максимальный уровень узнаваемости у аудитории.

Отмеченные факторы способствовали небывалому кассовому успеху: проект многократно окупил производственный и рекламный бюджет.

Есть и внутренние признаки, предопределяющие успех фильма в прокате.

Во-первых, базовые жанры: комедия, анимация — исторически самые успешные в России.

tabl-1.webp
Рис. 1. Прибыльные и неудачные в прокате жанры российского кинематографа

Комментарий: в таблице используются усредненные значения по количеству экранов проката, сборам, просмотру зрителями, бюджету, соотношению сборы/бюджет, рейтингу Кинопоиска, IMDb и длительности проектов.

Притом что само по себе «семейное кино» в сочетании с драмой или иным жанром предполагает скорее неудачу в прокате. Лучшие показатели может продемонстрировать только жанр «сказки», опять же в силу иллюзорно-компенсаторной функции.

Во-вторых, Дмитрий Дьяченко — не только один из самых «кассовых» в современной истории режиссеров, но и профессионал, на протяжении более десяти фильмов подряд показывающий положительный финансовый результат. Такая «стабильность» недоступна даже для многих голливудских звезд и свидетельствует именно о профессионализме, высоком уровне ремесла. Ведь история финансовых успехов в прокате важнее статуэток, призов кинофестивалей, всевозможных рейтингов. В России коэффициент корреляции между средним рейтингом проектов режиссера на «Кинопоиске» и окупаемостью его проектов в прокате — 0,054: какая-либо прямая связь отсутствует.

В-третьих, свою роль сыграла эффективная связка режиссер — продюсер — сценарист. Авторы сценария Виталий Шляппо, Василий Куценко и другие имеют большой и давний опыт создания коммерчески успешных фильмов и сериалов. Традиционно в кинематографе сценарий предопределяет до 50% успеха проекта. Продюсеры Эдуард Илоян и Денис Жалинский приложили руки к самым известным и успешным кино и сериальным проектам последних пяти лет. Накопленный организационный опыт позволяет браться за масштабные проекты, подбирая оптимальные параметры творческой группы и организационного обеспечения.

В-четвертых, эффективная маркетинговая и рекламная кампания, которая позволила максимально, практически на 100%, «выбрать» всю целевую аудиторию проекта внутри страны.

Резюмируя перечень факторов и причин, с уверенностью отметим: выйди «Чебурашка» в любое другое время, фильм, скорее всего, все равно окупился бы в прокате, несмотря на довольно большой бюджет в 850 млн рублей.

Как правило, крупнобюджетные проекты свыше 650 млн рублей в России проваливаются в прокате (для окупаемости проект должен собрать у зрителей два своих бюджета), поскольку большое влияние имеет ограниченная емкость локального кинорынка.

ifgr-01.webp
* В нашем случае 0,28 означает что типовой (усредненный) проект в среднем собирает 28 копеек на вложенный рубль. Для успеха он должен собрать 200 копеек (2 рубля). Коридор значений показателя: от 0 (фильм не просмотрел ни один зритель) до 2 и далее до 10–15. Если усредненный показатель окупаемости равен 3,30 для портфеля кинопроектов, значит он дает нам доходность в 130%. Отдельные проекты могут показывать доходность в сотни процентов.

Масштабные проекты лучше сразу делать в международной кооперации, с позиционированием на несколько иностранных целевых аудиторий.

Итак, ответ на вопрос о причинах успеха «Чебурашки» найден. Однако возникает другой: «можем ли повторить?» — и не только в рамках франшизы или сиквела.

Алгоритмы machine learning для прогнозов

На заданный вопрос можно ответить утвердительно: успех или неуспех любого кинопроекта в России предсказуем с точностью (accuracy) до 0,95 на самом раннем этапе, еще до начала съемок. Кинематограф, как и зрительская аудитория, консервативны, поэтому использование исторических данных проката в качестве обучающей выборки для алгоритмов машинного обучения и нейросетей показывает высокую эффективность.

База фильмов за 2004–2022 гг.

  • Проанализировано: 1400 проектов
  • Общий бюджет: 210,1 млрд руб.
  • Общие сборы: 145,9 млрд руб.
  • Зависимость окупаемости от наград режиссера: отсутствует

В проведенном исследовании [Подробные результаты исследования готовятся к публикации в ведущем российском научном журнале «Финансы: Теория и практика» Финансового университета при Правительстве Российской Федерации под названием «Прогнозирование результатов кинопроката в Российской Федерации с помощью машинного обучения в инвестиционных целях» — прим. автора] на базе выборки из 1400 фильмов национального производства с 2004 года по апрель 2022 года выявлены критерии успеха российского фильма в прокате в зависимости от таких факторов как: количество экранов, длительность, жанр, возрастной рейтинг, размер производственного бюджета, данные по режиссерам и сценаристам.

ris-2.webp
Рис. 2. Визуализация удачных и провалившихся в прокате российских фильмов с 2004 по 2022 гг.

Комментарий: представлены отмасштабированные (инструмент библиотеки sklearn — StandardScaler) и нормализованные (инструмент — Normalize) данные по российским фильмам, распределенные по сегментам с помощью метода снижения размерности PCA и последующей кластеризации методом DBSCAN. Красные точки — провалившиеся в прокате картины. Другие цвета — удавшиеся в прокате проекты по сочетанию признаков (оптимальный бюджет, сценарий, режиссура, количество экранов в прокате, возрастной рейтинг и длительность).

Самая первая пробная модель (логистическая регрессия) показала точность в 0.92. В дальнейшем были использованы и другие модели machine learning и нейросеть MLPClassifier. Алгоритм машинного обучения Decision Tree Classifier с подбором параметров и нейросеть показали точность прогнозов на тестовой выборке в 0.96 и 0.95 соответственно. То есть в отношении 95 проектов из 100, имея лишь предварительные данные не только до выхода фильма, но даже до начала его производства, можно довольно точно определить успех или неуспех картины в прокате.

ris-3.webp
Рис. 3. График ROC_AUC оценки эффективности модели машинного обучения

Комментарий: инструмент результативности нейросети MLPClassifier (многослойный персептрон). Receiver Operating Characteristic (ROC) — показывает эффективность модели машинного обучения при решении задачи классификации, отображая частоту истинных прогнозов (True Positive Rate) и частоту ложных (False Positive Rate). Area Under the Curve (AUC) — используется для измерения всей площади под кривой ROC. Чем ближе результат к 1, тем точнее работает модель машинного обучения.

Соответственно, появляется возможность отбирать не только потенциально успешные проекты и проводить отсев заведомо неудачных вариантов, но также оптимально формировать творческие и организационные группы, подбирать параметры фильма.

Более сложные модели machine learning с десятками параметров, а также инструменты deep learning уже в ближайшем будущем могут оперировать не только результатами бинарной классификации — успех или неуспех картины, но и прогнозировать предполагаемый уровень кассовых сборов, количество просмотров на платформах и других каналах трансляции контента, предсказывать зрительский рейтинг и иные значимые для производства содержательные и финансовые характеристики.

Искусственный интеллект может анализировать сценарий и сюжет будущего произведения, делать выводы и рекомендации на основе визуальной части эскизов, раскадровок и постеров, пилотных видеороликов и тизеров. Причем не только в отношении кинофильмов, но и сериалов, видеоигр и других элементов современных креативных индустрий в рамках глобальных франшиз и «зонтичных» брендов.

Портфельный принцип инвестиций

На практике инвестиции в один отдельный проект, даже тщательно отобранный, в итоговом результате всегда приводят к провалу, как это было в случае с проектом «Смешарики. Начало» и инвестиционным продуктом от компании «Тройка-Диалог». Необходима диверсификация. Поэтому нельзя делать ставку только на «Чебурашку-2», «Чебурашку-3» и так далее.

В идеале только для локального рынка Российской Федерации необходимо полтора-два десятка успешных кинофраншиз, с миграцией контента и авторов в смежные категории креативных индустрий (сериалы, книги, видеоигры, комиксы, сувенирная продукция, предметы массового потребления и т. п.) и активным использованием других инструментов финансирования: краудфандинг, копродукция, продакт плейсмент, фандрайзинг, кредитование под залог авторских прав, предпродажные соглашения.

Применительно к сфере кинематографа возможно создание «портфеля» из 20–30 кинопроектов, которые реализует 10–15 режиссеров в течение нескольких лет. На исторических данных такой инвестиционный портфель показывает доходность в 130% годовых.

Если попытаться выявить «самых финансово эффективных» российских режиссеров с 2004 по 2022 год, имеющих в активе пять и более проектов, можно сформулировать перечень персоналий: Жора Крыжовников (Андрей Першин), Клим Шипенко, Алексей Нужный, Тимур Бекмамбетов, Дмитрий Дьяченко, Виктор Шамиров, Егор Баранов, Роман Каримов и, внимание, — Марюс Вайсберг и Сарик Андреасян. Средняя окупаемость их проектов — свыше двух бюджетов. Для диверсификации в этот перечень можно добавить следующих авторов: Фёдор Бондарчук, Святослав Подгаевский, Артем Аксененко, Пётр Буслов, Карен Оганесян со средними показателями окупаемости от 1 до 2.

tabl-2.webp
Рис. 4. Сравнительная таблица усредненных показателей российских режиссеров за 2004-апрель 2022 гг. для расчета «инвестиционного портфеля»

Комментарий: в таблице учитываются только сборы проектов в кинотеатрах, без остальных направлений монетизации по состоянию на апрель 2022 года. Для попадания в «инвестиционный портфель» режиссер должен иметь 5 и более выпущенных полнометражных картин. Указаны средние значения для количества экранов, сборов за фильм, просмотры, средний бюджет картин, соотношение сборов к экранам, просмотров к экранам, сборов к бюджету. Указаны актуальные на апрель 2022 года усредненные рейтинги фильмов режиссера от Кинопоиска и IMDb.

Аналогичные «портфели» могут быть составлены для продюсеров, сценаристов, композиторов, операторов и ведущих актеров.

Рецепт идеального фильма для России с точки зрения окупаемости прост: это комедия, мелодрама, анимация или сказка, которую снимает опытный режиссер-ремесленник по качественному сценарию под руководством продюсера, ориентированного на прибыль с проката. Последний подбирает оптимальные характеристики проекта и состав творческой группы.

Механизмы инвестиций в киноотрасль и глобальный рынок

Предсказуемость инвестиционного портфеля, нивелирующего индивидуальные риски проекта, но не страхующего, к сожалению, от глобальных «черных лебедей», приносящих вред всей отрасли, открывает путь к долговому и долевому финансированию кинематографа с помощью облигаций и акций компаний-производителей и дистрибьютеров киноконтента.

Возникает возможность для государственных и частно-государственных инвестиций в сферу кино и креативных индустрий, включая механизмы определения рисков, условий кредитования, расчета приблизительной стоимости бизнеса и формирования данных для принятия решений инвестиционными компаниями и рейтинговыми агентствами.

Предсказуемость «креативной» индустрии в целом позволяет осуществлять более тесную международную кооперацию в производстве и дистрибуции цифрового контента, а также рассчитывать на появление новых глобальных кинофраншиз и связанных с ними бизнесов.

Принципиальных препятствий в анализе иностранных рынков кинопроката с помощью алгоритмов machine learning так же нет — необходимы только данные проката по локальному рынку. Используется стандартный алгоритм: разведочный анализ, выдвижение первичных гипотез, сбор исторических данных, выявление зависимостей, обучение модели, прогнозирование результата. Отличия от российского кинорынка будут только в «весах» моделей машинного обучения или искусственных нейронов. Эти особенности определяют специфику локального кинорынка, например, востребованность того или иного жанра, показатели бюджета, длительность.

Инвестиционный портфель российского кино

  • Проекты: 20–30 фильмов в год
  • Авторы: 10–15 режиссеров с опытом от 5 проектов
  • Горизонт инвестирования: 2–5 лет.
  • Историческая доходность: 130% годовых

Будущее креативной отрасли

С появлением все более совершенных аналитических и творческих алгоритмов наподобие Stable Diffusion и ChatGPT представляется вполне возможным, что мы придем к ситуации, когда нейросеть сама сможет генерировать фильм по заданному или созданному самой сценарию, написанному в формате «американки», обычного романа или киноповести.

К счастью для человека, остаются те самые 5%, успех которых объясняется за счет субъективного фактора. К примеру, фильм «Звездные войны», если рассчитывать вероятность его успеха на исторических данных до конца 1970-х годов, тоже должен был ждать кассовый провал, о чем говорили и сами актеры, и представители творческой группы на площадке.

Пока только человек может думать в «парадигме оптимизма», создавая принципиально новые продукты, образы, символы и сами алгоритмы. Ближайшее будущее креативной отрасли — вовсе не торжество искусственного интеллекта, скорее наоборот, перспектива за гибридными, человеко-машинными технологиями творческой деятельности и ее анализа.

Однако тревожный звоночек уже прозвенел. В 2022 году группа ученых из России, Франции и Германии создала новую модель машинного «обучения с подкреплением» — Bayes-UCBVI [Проект представлен на конференции ICML-2022. Научная статья опубликована и  доступна по ссылке], которая ориентирована на исследование новых возможностей, а не использование известных данных. Алгоритм перепроверяет те последовательности действий, которые выполняются редко, постоянно работая с изменяющейся внешней средой, от которой он получает обратную связь в виде «поощрений» и «наказаний». Вполне возможно, что потомок этой модели, выйдя за рамки тестирования в компьютерных играх Atari, будет принимать эффективные решения и станет лучшим творцом, чем человек. И пусть лучше он создает качественные и веселые фильмы-комедии, чем воплощает апокалиптический сценарий краха цивилизации или на практике играет в военные игры…


PLUSworld в соцсетях:
telegram
vk
dzen
youtube