Data scientist (команда NLP & Time Series)

Posted: September 7 at 10:25 AM
Remote or office
Full-time

#python #NLP #SQL #ML

Команда занимается разработкой моделей для всех подразделений группы ВТБ. Ключевые компетенции – NLP & Time Series. Также мы занимаемся различными образовательными проектами и написанием научных статей

Ищем коллегу уровня middle или senior

Текущий портфель проектов:

Инвестиции:
- оценка влияния тональности новостного потока на динамику финансовых инструментов (news sentiment for financial markets);
- оценки влияния разнообразия и шумности новостного фона на ликвидность финансовых активов (news diversity, hype for financial markets);
- выявление в новостных лентах наиболее важных тем в контексте Financial Markets (event-based analytics);
- поведенческая аналитика компаний и клиентов на основе неструктурированных данных в контексте Financial Markets (behavioral analytics);
- разработка торговых стратегий для валидации гипотез;
- оценка капитализации компаний через технологический индекс на основе новостей и патентов (dollar value index of technology).

Риски:
- поиск событий, свидетельствующих о возможном ухудшении кредитного качества контрагентов (розничных и корпоративных) Банка в новостных лентах (event-based analytics);
- выявление именованных сущностей (NER);
- саммаризация новостей (text summarization);
- объединение новостей в сюжеты;
- предиктивная аналитика и финансовый мониторинг (nlp & time series forecasting).

Маркетинг:
- unsupervised мониторинг тем, возникающих в Social Media, связанных с брендом и продуктами ВТБ и конкурентов (topic modelling);
- анализ настроений в Social Media (sentiment analysis);
- классификация обращений, поступающих в Банк по всевозможным каналам (опросы, отзывы, контактный центр и т.д.) (text classification);
- модельные оценки клиентского уровня удовлетворенности (nlp & time series forecasting).

Контактный центр:
- прогнозирование нагрузки на Контактный Центр (time series forecasting, clustering);
- составление и оптимизация расписания операторов (discrete optimization);
- детектирование проблемных направлений поддержки и тематик разговоров операторов с клиентами (anomaly detection).

Управление налично-денежной ликвидностью:
- прогнозирование клиентского спроса на наличность по всем типам устройств, номиналов и валют для всей банкоматной сети (multiple time series forecasting, clustering, local and global modelling);
- рекомендательная система налично-денежного обращения для инкассаторов (discrete optimization).
​​​​

Требования:

  • высшее физико-математическое / техническое / экономическое образование;
  • основы линейной алгебры, методов оптимизации, теории вероятностей и математической статистики;
  • основы машинного обучения и методов анализа данных;
  • основы SQL, git;
  • чтение технической и научной литературы в предметной области на английском языке;
  • уверенное владение стандартным стеком python-библиотек (sklearn, pandas, numpy, scipy, matplotlib, LightGBM и т.д.);
  • опыт в разработке дэшбордов и визуализации данных (dash, flask);
  • уверенное владение NLP-библиотеками (NLTK, spaCy, gensim, pymorphy2, transformers, fasttext);
  • опыт работы в проектах по машинному обучению;
  • опыт внедрения моделей в промышленную среду (docker, mlflow);

Условия:

  • трудоустройство согласно Законодательству;
  • конкурентная заработная плата;
  • профессиональное обучение и развитие;
  • добровольное медицинское страхование, льготные условия кредитования;
  • корпоративная пенсионная программа, материальная помощь;
  • спортивная жизнь и корпоративные мероприятия;
  • возможность построить карьеру в ведущем банке России.

Contacts

Log InOnly registered users can open employer contacts.

Posted: September 7 at 10:25 AM