Участникам необходимо решить задачу прогнозирования временных рядов для клиентов банка (юридических лиц) на основе их профилей и истории транзакций.
Нажимая кнопку «Участвовать» и/или «Отправить решение», вы соглашаетесь с Правилами участия в соревновании Data Fusion Contest 2025.
Необходимо решить задачу прогнозирования динамики денежных переводов клиентов банка. В роли временного ряда, который требуется прогнозировать, выступают переводы со счетов юридических лиц клиентов банка — другим юридическим лицам, агрегированные суммарно по неделям. Для обучения прогнозных моделей предоставляются транзакции за 2 года (118 недель, с 0 по 117 включительно), а горизонт прогнозирования — следующие 12 недель (с 118 по 129 включительно).
В данной задаче предстоит работать с данными юридических лиц: их транзакциями за 2 года, а также предоставленной информацией из профилей юридических лиц. У задачи имеется ряд весьма интересных особенностей для исследователей и практиков анализа данных:
Для удобства работы с данными предоставляется глобальный календарь непрерывно идущих недель. Подробнее про структуру и особенности данных можно узнать на странице “Данные”.
Задачи по прогнозированию повсеместно встречаются в рабочей практике компаний всех индустрий. На основании прогнозных моделей можно принимать самые различные решения для бизнеса, как на уровне конкретных клиентов, так и на уровне стратегии действий компании. Само прогнозирование имеет богатую историю подходов, моделей, научных школ и методологий, попробовать которые можно в рамках соревнования.
Это табличное соревнование с разметкой предоставленного вам .csv файла. Вам необходимо создать алгоритм, способный по предоставленным в рамках соревнования данным, создать новый табличный .csv файл с тремя столбцами:
inn_id, week, predict
inn1000051, 118, 7430786
inn1000051, 119, 7430786
...
inn999886, 129, 19776084
inn_id
– идентификатор юридических лиц, клиентов банка;week
– номер недели (периода прогнозирования), на которую сделан прогноз;predict
– предсказание вашего алгоритма. Предсказания необходимо построить для всех 51,963 клиентов на все 12 недель (периодов прогнозирования) тестовых данных.
Примеры sample_submission.csv доступны на странице “Данные”.
Решения проверяются автоматически путем сопоставления с известными истинными историческими значениями суммарных переводов клиентов банка со своих счетов. Истинные исторические значения в тестовых данных доступны только организаторам.
Метрика соревнования — средний RMSLE (Root Mean Squared Logarithmic Error) по клиентам:
$$\overline{RMSLE} = \frac{1}{N} \sum_{i=1}^N \text{RMSLE}_i$$
$$RMSLE_{i} = \sqrt{\frac{1}{T} \sum_{t=1}^T (\log(1 + y_{it}) - \log(1 + \hat{\overline{y}}_{it} ))^2 }$$
$$\hat{\overline{y}}_{it} = max(0, \hat{y}_{it}) $$
$$\text{Где:}$$
$$N \text{ — число клиентов},$$
$$T \text{ — число периодов прогнозирования},$$
$$y_{it} \text{ — истинные значения временного ряда клиента i в период t},$$
$$\hat{y}_{it} \text{ — спрогнозированные значения временного ряда клиента i в период t}.$$
Соотношение public/private в соревновании составляет 4/8:
Обратите внимание, что если в качестве прогноза предоставляются отрицательные значения, то они принудительно зануляются.
Победители соревнования определяются по результатам на private лидерборде. Для private лидерборда можно выбрать до 2 финальных решений.
1 место: 600 000 рублей
2 место: 250 000 рублей
3 место: 100 000 рублей
Спецноминация Companion:
1 место — 50 000 рублей
2 место — мерч
Our website uses cookies, including web analytics services. By using the website, you consent to the processing of personal data using cookies. You can find out more about the processing of personal data in the Privacy policy