Участникам необходимо решить задачу прогнозирования временных рядов для клиентов банка (юридических лиц) на основе их профилей и истории транзакций.
Нажимая кнопку «Участвовать» и/или «Отправить решение», вы соглашаетесь с Правилами участия в соревновании Data Fusion Contest 2025.
Необходимо решить задачу прогнозирования динамики денежных переводов клиентов банка. В роли временного ряда, который требуется прогнозировать, выступают переводы со счетов юридических лиц клиентов банка — другим юридическим лицам, агрегированные суммарно по неделям. Для обучения прогнозных моделей предоставляются транзакции за 2 года (106 недель, с 0 по 105 включительно), а горизонт прогнозирования — следующие 12 недель (с 106 по 117 включительно).
В данной задаче предстоит работать с данными юридических лиц: их транзакциями за 2 года, а также предоставленной информацией из профилей юридических лиц. У задачи имеется ряд весьма интересных особенностей для исследователей и практиков анализа данных:
Для удобства работы с данными предоставляется глобальный календарь непрерывно идущих недель. Подробнее про структуру и особенности данных можно узнать на странице “Данные”.
Задачи по прогнозированию повсеместно встречаются в рабочей практике компаний всех индустрий. На основании прогнозных моделей можно принимать самые различные решения для бизнеса, как на уровне конкретных клиентов, так и на уровне стратегии действий компании. Само прогнозирование имеет богатую историю подходов, моделей, научных школ и методологий, попробовать которые можно в рамках соревнования.
Это табличное соревнование с разметкой предоставленного вам .csv файла. Вам необходимо создать алгоритм, способный по предоставленным в рамках соревнования данным, создать новый табличный .csv файл с тремя столбцами:
inn_id, week, predict
inn1000051, 106, 7430786
inn1000051, 107, 7430786
...
inn999886, 117, 19776084
inn_id
– идентификатор юридических лиц, клиентов банка;week
– номер недели (периода прогнозирования), на которую сделан прогноз;predict
– предсказание вашего алгоритма. Предсказания необходимо построить для всех 51,963 клиентов на все 12 недель (периодов прогнозирования) тестовых данных.
Примеры sample_submission.csv доступны на странице “Данные”.
Решения проверяются автоматически путем сопоставления с известными истинными историческими значениями суммарных переводов клиентов банка со своих счетов. Истинные исторические значения в тестовых данных доступны только организаторам.
Метрика соревнования — средний RMSLE (Root Mean Squared Logarithmic Error) по клиентам:
$$\overline{RMSLE} = \frac{1}{N} \sum_{i=1}^N \text{RMSLE}_i$$
$$RMSLE_{i} = \sqrt{\frac{1}{T} \sum_{t=1}^T (\log(1 + y_{it}) - \log(1 + \hat{\overline{y}}_{it} ))^2 }$$
$$\hat{\overline{y}}_{it} = max(0, \hat{y}_{it}) $$
$$\text{Где:}$$
$$N \text{ — число клиентов},$$
$$T \text{ — число периодов прогнозирования},$$
$$y_{it} \text{ — истинные значения временного ряда клиента i в период t},$$
$$\hat{y}_{it} \text{ — спрогнозированные значения временного ряда клиента i в период t}.$$
Соотношение public/private в соревновании составляет 4/8:
Обратите внимание, что если в качестве прогноза предоставляются отрицательные значения, то они принудительно зануляются.
Победители соревнования определяются по результатам на private лидерборде. Для private лидерборда можно выбрать до 2 финальных решений.
1 место: 600 000 рублей
2 место: 250 000 рублей
3 место: 100 000 рублей
Спецноминация Companion:
1 место — 50 000 рублей
2 место — мерч
Cookies help us deliver our services. By using our services, you agree to our use of cookies.