Мы недавно отделившаяся команда и занимаемся созданием эмбедингов на всех возможных данных банка. Идея в том чтобы перевести всю сложную структуру данных unsupervised подходами в эмбединги для дальнейшего переиспользования другими командами, построения рекомендаций и вероятностного мачинга
ОБЯЗАННОСТИ:
- обработка чековых данных, переиспользование чеков для улучшения банковских моделей рисков, дохода и тд. Улучшение моделей категоризации, NER;
- единая рекомендательная система на данных банка. Построение сервисов рекомендаций товаров из чеков/брендов/категорий товаров/мерчантов/банковских продуктов на основе получившихся эмбедингов;
- синтетические данные: можно ли обучить генеративную сеть генерировать транзакции которые не отличишь от настоящих;
- создание эмбедингов последовательностей по человеку: чеки, транзакции, переводы и т. д.;
- вероятностный мачинг на эмбедингах (есть сущности у разных компаний (персональные, поведенческие и т.д. данные) и задачи их смачить, не передавая сырые данные);
- некоторые исследовательские проекты (AutoML, NAS для RNN).
ТРЕБОВАНИЯ:
- хорошее знание Python;
- понимание Classic ML;
- General DL и PyTorch;
- умение читать статьи и их реализовывать, улучшать;
- приветствуется опыт в RecSys;
- pyspark будет сильным плюсом, или как минимум sql, так как данных много и надо уметь с ними работать эффективно;
- будет плюсом опыт в Metric Learning, RNN, NLP.
УСЛОВИЯ:
- трудоустройство согласно Законодательству;
- конкурентная заработная плата;
- профессиональное обучение и развитие;
- добровольное медицинское страхование, льготные условия кредитования;
- корпоративная пенсионная программа, материальная помощь;
- спортивная жизнь и корпоративные мероприятия;
- возможность построить карьеру в ведущем банке России.