Ended 14 months ago
161 participants
152 submissions

Задание по CI-CD (курс MLOps и production в DS исследованиях 3.0)

Домашнее задание после Блока 4. Жмите "Участвовать" и во вкладке "Мои решения" отправляйте свое дз

Цель этого домашнего задания настроить CI-CD пайплайн и опубликовать на gitlab pages документацию проекта и исследований. пайплан должен включать в себя:

  1. DinD – сборку вашего докер образа из предыдущего дз, стоит также опубликовать образ в вашем gitlab docker registry.
  2. Линтеринг кода с использованием выбранных линтеров и форматеров
  3. Сборка и публикация вашего проекта в виде пакета в gitlab pypi registry.
  4. Сборка исследования из quarto/jupyter, документации в html (возможно надо будет скачать данные с помощью kaggle-cli)
  5. Публикация на gitlab pages

Помните, что в ci-cd различные credentials надо задавать как секреты – masked variables.

Проведите разведочный анализ на датасет ny-2015-street-tree-census-tree-data. В исследование стоит отобразить следующее:

  1. Показать при помощи таблиц превью данных.
  2. Продемонстрировать при помощи таблиц или графиков объем пропущенных значений в данных. Например, можно для столбцов, где есть пропуски, построить pie chart с указанием процента пропусков (есть в plotly).
  3. Построить диаграммы попарного распределения признаков.
  4. Рассчитать и показать матрицу попарных корреляций между вещественными признаками.
  5. Отобразить географическое представление деревьев из датасета. В датасете есть поля: latitude и longitude, и, используя библиотеки, которые позволяют отображать положение объектов на карте при помощи широты и долготы, необходимо предоставить в отчете карту расположения деревьев из данных.

Не забудьте зафиксировать ваши наблюдения и выводы полученные в ходе исследования, что интересного вы заметили и как вы это интерпретировали.

Результатом домашнего задания будет ссылка на открытый репозиторий и ссылка на gitlab pages.

Our website uses cookies, including web analytics services. By using the website, you consent to the processing of personal data using cookies. You can find out more about the processing of personal data in the Privacy policy