Учебный проект, созданный по ходу моего участия в My First Data Project, который решает задачу по очистке записи речи (аудио, видео) от фоновых шумов, с использованием технологий машинного обучения. В рамках работы над проектом, были реализованы и сравнены между собой две н.с. с различными архитектурами (CNN, CRNN). При их подборе и проектировании, немалое внимание уделялось поиску баланса между "легковесностью" и качеством работы, т.к. было желание разместить н.с. на мобильное устройство, чего, к сожалению, не произошло. Работа над данным проектом позволила выявить и частично закрыть пробелы в знаниях, познакомиться с обработкой звуков, получить ценный фидбэк от менторов, поступить в магистратуру ИТМО.
Ссылочка на Github: https://github.com/Svyatocheck/ML-Speech-enhancement/tree/master
В профиле можно найти докер-контейнер с MVP в нем.
Небольшая презенташка с защиты проекта, если кому-то будет полезно: https://docs.google.com/presentation/d/1-Vl1QdrgXCGgvGrTEx85ZnQWeg-ymBHh-ujbPmT-6KU/edit?usp=sharing
Cookies help us deliver our services. By using our services, you agree to our use of cookies.