Data Collection

Как собирать данные и где они обитают: методологии сбора данных, архитектуры систем, доставка данных до моделей машинного обучения и многое другое.

Расписание выступлений cпикеров:

30 мая:
11-00. “Россети и Mail.ru в поисках чёрных майнеров” – Александр Мамаев
11-30. “XtremeAugment: Getting the Most from Your Data by Combining Image Collection with Image Augmentation” – Сергей Нестерук, PhD student, Skoltech CDISE
12-00. “Собираем датасет для системы распознавания лиц через Яндекс.Толоку” – Куцев Роман, CEO & Founder, TrainingData.ru

5 июня:
11-00. “Еще одна архитектура системы мониторинга цен и место библиотеки ferret в ней” – Маликов Роман, Леруа Мерлен
11-30. "Парсинг через Tor: Как скачать 1.5 млн патентов за 2 недели, а не за 40 лет" – Елена Никитина, руководитель проектов, "Аналитические программные решения" 
12-00. "Микрооптимизации парсинга в промышленных масштабах" – Алекс
12-30. "Data platform for startups" – Даниил Охлопков, Data lead, Runa Capital

13 июня: 
11-00.
"Путь новичка в веб-парсинге" – Игорь Смирнов, Data scientist, Crayon
11-30. "Коммерческий бот для парсинга маркетплейсов" – Михаил Павлов
12-00. "Автоматические регистрации на веб-порталах" – Ярослав Меньшиков, Ведущий программист .Net, компания ГисАвто
12-30. "Как добывать данные когда их не хотят отдавать" – Евгений, инженер, Scrapinghub
17-00. Scrapy workshop – Михаил Синегубов
 

Track program