Ends in 3 weeks
849 participants
5835 submissions

Тренировочный датасет

Данные пользователей за 6 недель, упорядоченные по времени (первые строки самые давние).

Столбцы:

  • user_id - уникальный идентификатор пользователя;
  • item_id - уникальный идентификатор клипа;
  • timespent - время, которое пользователь провел на клипе;
  • like - лайкнул ли пользователь клип;
  • dislike - дизлайкнул ли пользователь клип;
  • share - поделился ли пользователь клипом;
  • bookmarks - поместил ли пользователь клип в закладки.

Дополнительные данные

users_meta.parquet

PARQUET | 618.56 KB

email

items_meta.parquet

PARQUET | 39.53 MB

email

test_pairs.csv

CSV | 20.68 MB

email

Файл users_meta содержит данные о пользователе:

  • user_id - уникальный идентификатор пользователя;
  • gender - пол пользователя;
  • age - возраст пользователя.

Файл items_meta содержит информацию о клипе:

  • item_id - уникальный идентификатор клипа;
  • source_id - уникальный идентификатор автора клипа;
  • duration - длительность клипа в секундах;
  • embeddings - нейросетевые эмбеддинги содержимого клипа (видеоряд, звук и тд.).

Файл test_pairs содержит пары юзеров/клипов, для которых нужно сделать предсказание. Пары собраны за седьмую неделю (сразу после тренировочных).

Baseline решение

baseline.ipynb

IPYNB | 3.20 KB

email

sample_submission.csv

CSV | 38.05 MB

email

Cookies help us deliver our services. By using our services, you agree to our use of cookies.