Идея проекта: предсказывать оценку компании, основываясь на отзывах, оставленных клиентами.
Бизнес - контекст: много компаний с большим количеством необработанных текстовых отзывов.
Проблема: текстовый отзыв нужно перевести в цифровой рейтинг.
Рынок: компании с возможностью оставления отзыва об их услугах.
ML - задача: задача классификации текста.
Данные: размеченные англоязычные комментарии с kaggle.
Модели: BERT, RoBERTa, CHAT-GPT, TF-IDF, Count-Vectorizer, GBDT, RF, LR.
Метрики: Precision, Recall, F1-score, MAE.
Интерпретация результатов: маппинг оценок от 1 до 5 в грейды (VB, B, M, G, E).
MLOps: Docker, CI/CD, Telegram.
Проблемы и ограничения: отсутствие размеченных данных на русском языке. Бесплатная версия гитлаба. Ограниченный формат CHAT-GPT.
Результаты: MVP продукта. Наилучшие метрики: MAE = 0.136, Prec = 0.98, Recall = 0.97, F1 = 0.975.
Полезные ссылки:
https://ods.ai/hubs/ai-talent
https://docs.google.com/presentation/d/1hBvCWBjF4M8GvJebry32rbRnWplJZIDCJfSBlllVCZM/edit#slide=id.g25634c8c239_0_19
Cookies help us deliver our services. By using our services, you agree to our use of cookies.