Hidden
Data scientist (команда NLP & Time Series)

Created:
Remote or office
Full-time

#python #NLP #SQL #ML

Moderation Review

In the archive

Brief description of the vacancy

Команда занимается разработкой моделей для всех подразделений группы ВТБ. Ключевые компетенции – NLP & Time Series. Также мы занимаемся различными образовательными проектами и написанием научных статей

Ищем коллегу уровня middle или senior

Текущий портфель проектов:

Инвестиции:
- оценка влияния тональности новостного потока на динамику финансовых инструментов (news sentiment for financial markets);
- оценки влияния разнообразия и шумности новостного фона на ликвидность финансовых активов (news diversity, hype for financial markets);
- выявление в новостных лентах наиболее важных тем в контексте Financial Markets (event-based analytics);
- поведенческая аналитика компаний и клиентов на основе неструктурированных данных в контексте Financial Markets (behavioral analytics);
- разработка торговых стратегий для валидации гипотез;
- оценка капитализации компаний через технологический индекс на основе новостей и патентов (dollar value index of technology).

Риски:
- поиск событий, свидетельствующих о возможном ухудшении кредитного качества контрагентов (розничных и корпоративных) Банка в новостных лентах (event-based analytics);
- выявление именованных сущностей (NER);
- саммаризация новостей (text summarization);
- объединение новостей в сюжеты;
- предиктивная аналитика и финансовый мониторинг (nlp & time series forecasting).

Маркетинг:
- unsupervised мониторинг тем, возникающих в Social Media, связанных с брендом и продуктами ВТБ и конкурентов (topic modelling);
- анализ настроений в Social Media (sentiment analysis);
- классификация обращений, поступающих в Банк по всевозможным каналам (опросы, отзывы, контактный центр и т.д.) (text classification);
- модельные оценки клиентского уровня удовлетворенности (nlp & time series forecasting).

Контактный центр:
- прогнозирование нагрузки на Контактный Центр (time series forecasting, clustering);
- составление и оптимизация расписания операторов (discrete optimization);
- детектирование проблемных направлений поддержки и тематик разговоров операторов с клиентами (anomaly detection).

Управление налично-денежной ликвидностью:
- прогнозирование клиентского спроса на наличность по всем типам устройств, номиналов и валют для всей банкоматной сети (multiple time series forecasting, clustering, local and global modelling);
- рекомендательная система налично-денежного обращения для инкассаторов (discrete optimization).
​​​​

Требования:

  • высшее физико-математическое / техническое / экономическое образование;
  • основы линейной алгебры, методов оптимизации, теории вероятностей и математической статистики;
  • основы машинного обучения и методов анализа данных;
  • основы SQL, git;
  • чтение технической и научной литературы в предметной области на английском языке;
  • уверенное владение стандартным стеком python-библиотек (sklearn, pandas, numpy, scipy, matplotlib, LightGBM и т.д.);
  • опыт в разработке дэшбордов и визуализации данных (dash, flask);
  • уверенное владение NLP-библиотеками (NLTK, spaCy, gensim, pymorphy2, transformers, fasttext);
  • опыт работы в проектах по машинному обучению;
  • опыт внедрения моделей в промышленную среду (docker, mlflow);

Условия:

  • трудоустройство согласно Законодательству;
  • конкурентная заработная плата;
  • профессиональное обучение и развитие;
  • добровольное медицинское страхование, льготные условия кредитования;
  • корпоративная пенсионная программа, материальная помощь;
  • спортивная жизнь и корпоративные мероприятия;
  • возможность построить карьеру в ведущем банке России.

Contacts

Our website uses cookies, including web analytics services. By using the website, you consent to the processing of personal data using cookies. You can find out more about the processing of personal data in the Privacy policy