Ended 7 months ago
999 participants
9255 submissions

Тренировочный датасет

Данные пользователей за 6 недель, упорядоченные по времени (первые строки самые давние).

Столбцы:

  • user_id - уникальный идентификатор пользователя;
  • item_id - уникальный идентификатор клипа;
  • timespent - время, которое пользователь провел на клипе;
  • like - лайкнул ли пользователь клип;
  • dislike - дизлайкнул ли пользователь клип;
  • share - поделился ли пользователь клипом;
  • bookmarks - поместил ли пользователь клип в закладки.

Дополнительные данные

users_meta.parquet

PARQUET | 618.56 KB

email

items_meta.parquet

PARQUET | 39.53 MB

email

test_pairs.csv

CSV | 20.68 MB

email

Файл users_meta содержит данные о пользователе:

  • user_id - уникальный идентификатор пользователя;
  • gender - пол пользователя;
  • age - возраст пользователя.

Файл items_meta содержит информацию о клипе:

  • item_id - уникальный идентификатор клипа;
  • source_id - уникальный идентификатор автора клипа;
  • duration - длительность клипа в секундах;
  • embeddings - нейросетевые эмбеддинги содержимого клипа (видеоряд, звук и тд.).

Файл test_pairs содержит пары юзеров/клипов, для которых нужно сделать предсказание. Пары собраны за седьмую неделю (сразу после тренировочных).

Baseline решение

baseline.ipynb

IPYNB | 3.20 KB

email

sample_submission.csv

CSV | 38.05 MB

email

Our website uses cookies, including web analytics services. By using the website, you consent to the processing of personal data using cookies. You can find out more about the processing of personal data in the Privacy policy