Участникам необходимо решить задачу multi-label классификации для 41 финансового продукта клиентов банка на основе обезличенных данных заранее предоставленных признаков.
Нажимая кнопку «Участвовать» и/или «Отправить решение», вы соглашаетесь с Правилами участия в соревновании Data Fusion Contest 2026.
Клиенты банка владеют разными банковскими продуктами — различными видами счетов, карт и услуг. Одним из запросов бизнеса является желание ранжировать эти продукты по вероятности их открытия клиентами.
В данной задаче продуктов “на полке” 41 штука. В отличие от классических задач рекомендаций, бизнес интересуют вероятности открытия каждого из продуктов. Умея хорошо предсказывать эти вероятности, бизнес имел бы возможность гибко настраивать рекомендации.
В этом соревновании участникам предстоит работать с полностью анонимными и обфусцированными данными 1,000,0000 клиентов:
cat_feature_i и числовые признаки num_feature_j). Подробнее про структуру данных можно узнать на странице “Данные”.
Это соревнование с разметкой предоставленного вам .parquet файла. Вам необходимо создать алгоритм, способный по предоставленным в рамках соревнования данным, создать новый .parquet файл с 42 столбцами:
customer_id, predict_1_1, predict_1_2, ... , predict_10_1
1750000, -4.921889, -5.700829, ... , -0.954659
1750001, -4.963202, -6.826517, ... , -0.622011
...
1999999, -4.249957, -4.785856, ... , -0.931220customer_id – идентификатор клиента;predict_i – предсказание вашего алгоритма для класса target_i. Например predict_1_1 для target_1_1 и т.д. Предсказания необходимо построить для всех 250,000 клиентов в тестовых данных.
Пример sample_submit.parquet доступен на странице “Данные”.
Решения проверяются автоматически путем сопоставления с известными истинными историческими значениями суммарных переводов клиентов банка со своих счетов. Истинные исторические значения в тестовых данных доступны только организаторам.
Метрика соревнования — Macro Averaged ROC-AUC. Для multi-label это эквивалентно простому усреднению ROC-AUC по каждому классу.
Для расчета метрики используется sklearn имплементация:
from sklearn.metrics import roc_auc_score
roc_auc_score(y_true, y_pred, average="macro")Соотношение public/private в соревновании составляет 30/70:
Победители соревнования определяются по результатам на private лидерборде.
Для private лидерборда можно выбрать до 2 финальных решений.
1 место: 500 000 рублей
2 место: 300 000 рублей
3 место: 100 000 рублей
Спецноминация Companion:
1 место — 50 000 рублей
2 место — 50 000 рублей
Our website uses cookies, including web analytics services. By using the website, you consent to the processing of personal data using cookies. You can find out more about the processing of personal data in the Privacy policy