Data Fusion 2022 — Open Data Science

Ended 4 years ago

Расписание сессий 14.05.2022

Business Day

11.05-12.05	Ставка на Data Fusion	Эксперты о межотраслевом тренде Data Fusion, его перспективах, возможностях технологий, влиянии на развитие рынка данных, применении в разных индустриях и государственных проектах	Модератор: Александра Кирьянова главный редактор Cnews Спикеры: Александр Абаркин Первый заместитель по ИТ руководителя Инновационного центра «Безопасный транспорт» Сергей Безбогов Заместитель руководителя Технологического блока - старший вице-президент ВТБ Артем Блинов Директор по закупкам ГК Самолет Роман Мизюрин Руководитель продвинутой аналитики Рисков и Общекорпоративных функций Альфабанк Алексей Нейман Исполнительный директор АБД	11.05-12.05	Decision Maker’s Problem. О чем говорят на конференциях, но не внедряют в жизни	Новейшие технологии проходят долгий путь от момента первого прототипа до принятия решения о масштабном внедрении, и проблема не только в доступности технологии. Во многом успех зависит от готовности функционального заказчика внутри компании, который должен взять на себя роль адвоката создаваемого продукта, и сфера Data Science – не исключение. Какова должна быть мотивация C-level руководителей внутри компании для успешной акселерации проекта на основе Data Fusion? На сколько созрел рынок к внедрению решений Data Fusion, и есть ли необходимая экосистема для запуска проектов, специалисты с соответствующей квалификацией и квалифицированные заказчики? Участники сессии поделятся кейсами внутрикорпоративного взаимодействия по внедрению Data Science решений. Какие барьеры были преодолены для успешного внедрения, и какие неудачные попытки пришлось пережить?	Модератор: Виталий Мзоков, директор венчурной студии ГК «Иннотех» Спикеры: Наталья Дегтярева Директор Акселератора ВТБ Антон Мерзляков Директор по аналитике больших данных Tele2 Павел Мягких Директор по продвинутой аналитике Лента Дмитрий Фадеев Руководитель проектов AmberData
12.15-12.25	Data Fusion Awards Data Fusion в бизнесе	Номинации Прорыв года Монетизация данных Трендсеттер	Ведущие: Александра Кирьянова главный редактор CNews Денис Елаховский начальник отдела новостей экономики, телеканал «Москва 24», экономический обозреватель Вручает: Сергей Безбогов заместитель руководителя Технологического блока - старший вице-президент ПАО «Банк ВТБ»	12.15-13.45	Как анализ данных помогает внедрению принципов ESG?	Глобальные климатические изменения вследствие антропогенных факторов требуют реализации четвертого энергоперехода для снижения рисков глобального потепления и выхода на траекторию устойчивого развития (потепление до 1.5 градусов Цельсия к 2100 г. по сравнению с доиндустриальным уровнем). При реализации мер по обеспечению устойчивого развития выделяют ESG-риски, для контроля которых требуются подходы на основе анализа данных, позволяющие надежно оценить вероятность и существенность риска. В рамках данной секции планируется обсудить существующие на данный момент технологии энергоперехода, и то, какие задачи возникают в ходе ESG-трансформации у бизнеса и могут быть решены за счет цифровизации, как моделировать риски устойчивого развития и оценивать их влияние на экономику. Помимо этих глобальных вопросов планируется обсудить вопросы образования для повышения осведомленности о ESG-принципах и оптимизации городской среды.	Спикеры: Михаил Аким Профессор практики Высшей школы бизнеса Анна Кулашова Директор Центра обучения проектированию и разработке игр ФПМИ МФТИ Андрей Осипцов Профессор и директор, проектный центр по энергопереходу, Сколтех Назар Сотириади Исполнительный директор, Департамент интегрированного риск-менеджмента, ПАО Сбербанк Александр Филатов Начальник управления данными в распределенных вычислительных сетях, Департамент информационных технологий города Москвы
12.35-14.05	Open source	Всё больше компаний, разворачивающих свою цифровую инфраструктуру или разрабатывающих цифровые сервисы, переходят от проприетарных платформ, которые не всегда в полной мере обеспечивают потребности бизнеса в гибкой настройке к своим собственным решениям. Использование Open Source библиотек позволяет сохранить рентабельность разработки на приемлемом уровне, но, с другой стороны, является источником рисков. Это и риск блокировки доступа к ресурсам с открытыми библиотеками, изменения лицензий использования, безопасность размещенного кода и «закладки» в фундаментальных моделях. Каковы риски коммерческих систем в основе которых лежат Open Source разработки? Есть ли перспективы импортозамещения в этой сфере и когда появится российский GitHub?	Модератор: Сергей Бережной Директор по взаимодействию с разработчиками, Яндекс Спикеры: Владислава Васильева Заместитель директора по развитию, направление «Безопасная и открытая инфраструктура» АНО «Цифровая экономика» Борис Емельянов Директор департамента управления платформами хранилища данных Ростелеком Александр Ермаков Arenadata, СТО Сергей Сергиенко Cоветник Министра цифрового развития, связи и массовых коммуникаций Российской Федерации Алексей Синицин Генеральный директор РеСолют Алексей Смирнов Председатель совета директоров Базальт СПО	13:55 - 14:55	Практическое внедрение управления данными в органах государственной власти	Нынешняя цифровая трансформация госуправления невозможна без скоординированной работы с данными на федеральном и региональном уровнях. Создание единого государственного data lake (озеро данных), запуск маркетплейса дата-сетов, развитие НСУД и СМЭВ4 станут ключевыми в повестке 2022 года. Как в ФИОВ сегодня выстраивается работа с данными в государстве? Каких успехов уже удалось добиться в ФИОВ и РОИВ, и что еще предстоит сделать? Какие изменения грядут на федеральном уровне, и к чему нужно готовиться регионам? Участники сессии озвучат позиции федеральных и региональных ОГВ, представят кейсы по управлению данными и обсудят предстоящие задачи. В ходе сессии состоится презентация навигатора «Управление данными в госсекторе», который поможет РЦТ РОИВ и их командам глубже погрузиться в процессы по управлению данными, чтобы согласовать свои задачи с федеральной повесткой и скоординировать стратегии цифровой трансформации.	Модератор: Екатерина Потапова академический директор Центра CDTO, ВШГУ РАНХиГС Спикеры: Михаил Петров Директор департамента цифровой трансформации Счетной палаты Российской Федерации Дмитрий Разумовский Заместитель Губернатора Калужской области, Руководитель министерства цифрового развития Калужской области Николай Распопин Министр цифрового развития Красноярского края Максим Цыганков Руководитель направления «Аналитические сервисы» НСУД, заместитель руководителя Научно-исследовательского департамента управления данными ФГАУ НИИ «Восход» Дмитрий Шмелев Заместитель руководителя аппарата Губернатора Ямало-Ненецкого автономного округа
14.35-15.35	Data Fusion. Работа с клиентами	Эксперты о межотраслевом тренде Data Fusion, его перспективах, возможностях технологий, влиянии на развитие рынка данных, применении в разных индустриях и государственных проектах.	Модератор: Сергей Голицын вице-президент, заместитель руководителя департамента анализа данных и моделирования ВТБ Спикеры: Артем Алексеев Партнер, директор по стратегии и развитию бизнеса Aggregion Ксения Ачкасова Исполнительный директор Mediascope Евгений Макаров Руководитель центра компетенций Data Science МТС Александр Самсонов Директор по стратегическим партнерствам Авито Тигран Саркисов Директор по работе с данными Х5 Group Денис Суржко Начальник управления перспективных алгоритмов машинного обучения департамента анализа данных и моделирования ВТБ
15.45-15.55	Data Fusion Awards. Гран При ВТБ	Бизнес-партнёрство в стиле Data Fusion Партнёрство в области науки и исследований	Ведущие: Александра Кирьянова главный редактор Cnews Денис Елаховский начальник отдела новостей экономики, телеканал «Москва 24», экономический обозреватель Вручает: Сергей Голицын вице-президент, заместитель руководителя департамента анализа данных и моделирования ВТБ	15.05-16.05	Case Study Data Fusion. Промышленность	По мере развития подходов к цифровизации промышленных производств акценты от отдельных станков и установок смещаются к комплексной автоматизации целых предприятий или промышленных групп, составляющих производственные цепочки. В подобных сложных системах продуманная система анализа мультимодальных данных и принятия решений на их основе способна дать максимальный эффект по оптимизации промышленных процессов, снижению транзакционных издержек и повышению маржинальности производства в целом. Но все ли промышленные компании готовы к подобной Data Science-трансформации? Каков уровень доверия топ-менеджеров к дорогостоящим трансформационным решениям на основе подходов Data Fusion?	Модератор: Кирилл Железнов директор по продуктам, Цифровая Индустриальная платформ Спикеры: Владимир Вавра Руководитель отдела инфраструктуры данных Уралхим Николай Князев Ведущий архитектор СофтЛайн
16.05-17.05	Вопросы доверия и этики в ИИ и работе с данными	Сегодня технологии искусственного интеллекта развиваются стремительно и применяются в самых разных сферах. Однако, чем быстрее развиваются технологии, тем меньше доверия они вызывают среди населения, даже несмотря на то, что искусственный интеллект делает жизнь человека намного проще. Человечество учится не только использовать технологии искусственного интеллекта, но и доверять им. Спикеры рассмотрят кейсы из практики компаний по разрешению этических вопросов при внедрении искусственного интеллекта во взаимодействие с потребителями товаров/услуг, которые будут полезны сообществу ученых, занимающихся исследованиями Data Science. Кто несет ответственность за последствия применения ИИ и за возмещение потенциального вреда клиентам сервисов, использующих ИИ? Как использование ИИ может гарантировать справедливость (включая недискриминацию, непредвзятость, равенство) и где проходит грань между защитой участников от дискриминации и свободой слова Как гарантировать процесс прозрачности использования данных и конфиденциальность информации, используемой ИИ?	Модератор: Карен Казарян генеральный директор Института исследований интернета, главный аналитик Ассоциации электронных коммуникаций Спикеры: Дмитрий Демидов Руководитель лаборатории инноваций НОРБИТ Сергей Морозов Эксперт Фонд Сколково Алексей Нейман Исполнительный директор АБД Елена Сурагина Руководитель Группы регуляторной поддержки экосистемы МТС	16.15-17.15	Case Study Data Fusion. Человеческий капитал	Цифровизация, удаленка и геополитика выбили почву из под ног у HR директоров, а традиционные инструменты работы с командой утратили былую эффективность. Где найти современные рычаги влияния на климат в коллективе? У дата-саентистов есть ответ! - Как аналитика данных помогает работодателю выстраивать взаимоотношения с сотрудниками в периоды турбулентности и неопределенности? - Как оцифровать выгорание? Предотвращение выгорания при удаленной работе, когда эмоциональная обратная связь от сотрудника к работодателю ограничена. - Санкции, паника и стресс? Какие данные необходимо проанализировать и какие выводы сделать, чтобы настроить команду на эффективную работу? Кейсы повышения уровня мотивации.	Марина Буздалина Управляющий директор, департамент ИТ блока HR Сбербанк Даниэль Саттаров И.о. руководителя подразделения «Пользовательские сервисы» ДОМ.РФ Даниил Терентьев CEO Conventus Оксана Фетисова Директор Департамента Корпоративный университет МТС
17.40-18.40	Круглый стол Data Fusion. Маркетинг, реклама и коммуникации	Привлечение клиентов сегодня и завтра. Большие данные, стабильные идентификаторы, аналитика и новые инструменты взаимодействия с аудиторией. Готовы ли отечественные компании занять освобождающиеся и новые ниши и получить новый пул клиентов? Как в этом могут помочь большие данные? Какие технологии помогут бизнесу привлекать новых пользователей? Как защитить клиентские данные в период турбулентности? Какие правила хорошего тона существуют для работы с данными?	Модератор: Алексей Каштанов генеральный директор, Platforma Спикеры: Марина Кормщикова Директор направления, Департамент управления данными Ростелеком Алина Садукевич Руководитель департамента развития продуктов больших данных Билайн Александр Сафонов Руководитель службы развития продуктов больших данных Tele2 Дмитрий Фадеев Руководитель проектов AmberData Евгения Шулипина CEO QuiteMedia
18.50-19.00	Data Fusion Awards. Data Fusion Rising	Stars спецноминация Фонда «Сколково»	Ведущий Павел Новиков директор центра инноваций в финансовом секторе Фонда «Сколково»

Расписание сессий 15.05.2022

Data Science Day

10:05 - 10:50	Science notes Федеративые модели	Технология федеративного обучения, которое можно определить как распределенную систему машинного обучения, которая позволяет создавать коллективную модель из данных, которые распределены по владельцам этих данных, сегодня актуальна и быстро развивается. Как можно классифицировать системы федеративного обучения и основных алгоритмов? Какие основные кейсы федеративного обучения для разных типов систем сегодня наиболее репрезентативны? Каковы основные фреймворки федеративного обучения, их особенности? Об этом и некоторых benchmarks алгоритмов и фреймворков федеративного обучения поговорим в рамках science note	Иван Холод СПбГЭТУ "ЛЭТИ" Декан факультета компьютерных технологий и информатики	10.05-11.15	Сессия MLOps	Рассмотрим практические шаги по реализации технологического основания MLOps: инструменты DevOps конвейера и надстройки для непрерывного релиза моделей ML как ключевой компоненты ИИ. Сессия будет интересна всем, кто интересуется технологическими и организационными вопросами применения DevOps для внедрения систем искусственного интеллекта.	Модератор: Александр Разгон Заместитель начальника управления процессов и стандартов моделирования ВТБ Спикеры: Александр Волынский технический менеджер продукта ML Platform, VK Cloud Solutions Ван Хачатрян руководитель отдела машинного обучения и матчинга, Ozon Константин Хримпач руководитель службы разработки решений машинного обученияTele2
11:00 - 11:40	Робастность глубоких нейросетей: геометрический подход	При построении предиктивных моделей важно учитывать геометрическую структуру данных - то, как расположены наблюдения в многомерном пространстве. Обычно расположение наблюдений хорошо описывается многообразием. Очевидно, что его свойства влияют на точность соответствующих предиктивных моделей. Оценив многообразие данных, мы можем выявить области на многообразии, в которых предиктивная модель не робастна, и, тем самым, становится возможным генерировать как эффективные злонамеренные атаки на модель, так и обеспечивать защиту от них. Доклад посвящён вопросам генерации атак и защиты от них с учётом многообразия данных, а также, в целом, вопросам того, как сравнивать многообразие реальных данных и данных, порождённых генеративной моделью, и за счет этого, например, выявлять искусственно сгенерированные (потенциально фейковые) наблюдения.	Евгений Бурнаев Руководитель Центра прикладного ИИ, Сколтех, в.н.с., AIRI	11.25-12.25	Сессия Конфиденциальные вычисления	Важность конфиденциальности при работе с данными и моделями сложно переоценить: Обладая существенными набором информации и желая создать получить дополнительную выгоду для себя или общества, владельцы больших данных также несут ответственность за сохранение конфиденциальности, рискуя не только доверием к своему имени, но и подвергая рискам свой бизнес, а также субъектов информации. С ростом популярности вычислений в сторонних и совместных центрах обработки также крайне важно не только сохранять в тайне свои модели и алгоритмы, но и быть уверенными, что в промышленной эксплуатации находится именна та модель и именно тот код, который создавался в процессе разработки. Вопрос конфиденциальных вычислений крайне важен с одной стороны с точки зрения защиты, а с другой стороны критичен с точки зрения возможности безопасного развития совместных решений, построенных на основе анализа данных и моделирования. В этой сессии мы рассмотрим два основных подхода к конфиденциальным вычислениям, дающим новые возможности для использования совместных датасетов в моделях, а также для проведения вычислений в совместных средах: - математико-алгоритмический, представитлять который будет MPC - multi-party computation - программно-аппаратный, представлять который будет Trusted Execution Environment на примере Intel SGX Кроме того, рассмотрим архитектуру Data Mesh, которая позволит собрать и объединить в одном периметре обработки данных сразу оба этих подхода.	Модератор: Олег Мангутов ассоциированный партнер Группа анализа данных и моделирования EY Спикеры: Дмитрий Берестнев заместитель директора Департамента анализа и моделирования Иннотех Петр Емельянов CEO, Bloomtech Виктор Стрелков директор по разработке, oneFactor Андрей Тотмаков технический директор Platforma
11.50-13.10	От научной статьи до MVP	Путь от научной статьи до MVP это путь, который проходит идея в R&D процессе. Часто этот путь занимает годы и не исключена ситуация, когда идея так и не сможет оформиться в конкретный продукт. Как происходит и какой спецификой обладает R&D в стремительно развивающейся сфере DataScience? Дискуссия будет разбита на две части, в первой обсудим актуальные проблемы R&D в области AI и DS в России. Во второй поговорим о конкретных научных работах, направлениях исследований, которые, по мнению наших экспертов, активно развиваются и имеют широкую область приложений.	Модератор: Александр Мамаев руководитель отдела машинного обучения и анализа данных VK Спикеры: Юрий Дорн Школа анализа данных Яндекс и ФКН ВШЭ, Ст. преподаватель: МФТИ Руководитель OzonMasters Александр Дьяконов Chief Research Scientist Dasha.ai Лектор OzonMasters Илья Макаров Программный директор Академии больших данных MADE, ВК Образование Александр Панченко Доцент Сколтех Максим Савченко Управляющий директор, руководитель Центра инструментов машинного обучения Лаборатории AI Сбера	12.35-13.35	Сессия Повышение эффективности в NLP	Для большинства успешных компаний NLP стало business critical технологией. В этой связи, становится важным поиск максимально операционно эффективных решений NLP задач, в том числе: минимизация затрат на разметку (zero и few-shot learning, active learning и information retrieval), рост скорости разработки и внедрения моделей путем применения AutoML решений, unsupervised подходы. В рамках секции мы обсудим данный тренд и актуальные разработки в области операционно эффективного решения NLP задач.	Модератор: Денис Суржко Начальник управления перспективных алгоритмов машинного обучения департамента анализа данных и моделирования ВТБ Спикеры: Андрей Коцеруба директор в управлении перспективных алгоритмов машинного обучения ВТБ Денис Кузнецов исследователь DeepPavlov (MIPT) Валентин Малых Senior Research Scientist, Huawei Noah's Ark Lab - Алексей Рябых ML Team Lead, ВТБ
13:20 - 14:00	Диффузионные модели с динамически меняющимся размером	За последние два года диффузионные модели задали новую планку качества в генеративном моделировании. Эта красивая концепция объединяет в себе нейродиффуры, моделирование на основе скор-функции, приближенные методы байесовского вывода и стохастические дифференциальные уравнения. Их основным недостатком является большое время генерации объекта. В докладе мы рассмотрим причины успеха диффузионных моделей и пути повышения их эффективности за счет уменьшения работы вхолостую на начальном этапе обратной динамики. Получившаяся модель обобщает стандартные диффузионные модели и иерархические вариационные автокодировщики в рамках более общей парадигмы.	Дмитрий Ветров к.ф.-м.н., профессор факультета компьютерных наук НИУ ВШЭ	13.45-14.30	Сессия Matching. Соревнование Data Fusion Contest	С все большим ростом объема накопленных данных, появляются новые актуальные задачи машинного обучения. Ранее, задача вероятностного соотнесения и сопоставления данных (Matching) уже проявлялась как в поисках дубликатов, так и в классических приложениях по восстановления целостности данных, особенно медицинских. Последние несколько лет появились возможности проводить более сложные семантические сопоставления в неструктурированных данных, таких как фото, видео и текст. Сегодня эти методы Matching подходят к тому уровню, что все накопленные за эти годы наработки в области машинного обучения становится возможным вывести в широкий круг приложений индустрий, включая работу с уже привычными данными банковских транзакций или онлайн магазинов. В этой секции наши слушателю узнают, что из себя представляют Matching задачи сегодня, как к этим задачам можно подходить, а также смогут перенять опыт решения Matching задач в реальных компаниях.	Модератор: Алексей Натекин основатель, ODS Спикеры: Дмитрий Берестнев заместитель директора департамента анализа и моделирования Иннотех Евгений Ворсин Data Scientist Иннотех Анатолий Глушенко Lead DS ВТБ Александр Голубев Senior ML engineer Ozon
14:10 - 14:50	Science notes Вызовы технологий искусственного интеллекта	Методы искусственного интеллекта достигли высоких результатов. Однако, они подвержены различным ошибкам. Как можно "атаковать" модели ИИ, как защищаться от этого и можно ли это делать вообще – это мы обсудим в лекции.	Иван Оселедец Профессор, Директор центра технологий ИИ, Сколтех	14.40-15.40	Сессия Нейроданные – от структуры к функции при помощи доменно информированных методов ML	На сегодняшний день ученые, эксперты располагают обширным опытом в сборе нейроданных как инвазивными, так и неинвазивными методами, но формат этих данных, а, следовательно, и их анализ сталкивается с рядом вызовов. Но как сформировать качественный субстрат функциональных данных на основе структурных? По факту, преодоление этих препятствий, которые во многом лежат в плоскости Data Science и ML, может открыть новые перспективы по их коммерческому использованию. К примеру, нейросети хорошо учатся по данным, собранным с помощью МРТ, ФМРТ, когда они хорошо размечены. Как хорошо размеченные данные без шумов могут повысить эффективность работы алгоритмов и методов машинного обучения, например, self-supervised learning? Другой аспект работы с данными, полученными при сканировании мозга, так и получаемые иными неинвазивными методами со всего человеческого организма – «жадность» алгоритмов. Алгоритмы часто научаются не тем задачам, которые от них требовались изначально, в силу неправильного восприятия контекста, или, наоборот, чрезмерной фокусировке на нем. Какими методами это «лечить» – один из вопросов предстоящей дискуссии. Поговорим об интерпретации получаемых данных в ходе сканирования мозга, организма, об оценке эффективности работы алгоритмов машинного обучения, обрабатывающих эти данные, и интерпретации результатов, полученных уже по итогам работы этих алгоритмов. Ну и, конечно же, обсудим практическое, в том числе коммерческое применение – зачем мы изучаем мозг, обрабатываем информацию о работе нейронов, о реакции всего организма с помощью сложных методов глубинного обучения?	Модератор: Сергей Воинов Директор по акселерации по направлению цифровая медицина, Кластер биологических и медицинских технологий, Фонд «Сколково» Спикеры: Анвар Курмуков PhD старший научный сотрудник AIRI Алексей Осадчий директор, Центр биоэлектрических интерфейсов, институт когнитивных нейронаук НИУ ВШЭ, в.н.с., Институт искусственного интеллекта, AIRI Максим Шараев к.ф.-м.н., руководитель группы Интеллектуальной обработки сигналов и изображений Центра прикладного ИИ, Сколтех Евгений Шуранов руководитель RnD лаборатории Huawei
16.10-16.50	Science notes Граф исследований и исследования графов в Физтех-школе прикладной математики и информатики		Спикер: Андрей Михайлович Райгородский, МФТИ д.ф-м.н, федеральный профессор математики, директор ФПМИ	15.50-16.50	Сессия Генеративные модели	Генеративные модели ИИ по версии Gartner входят в топ актуальных технологических трендов. Очевидны их преимущества, к примеру генеративный дизайн позволяет даже без топологической оптимизации создать сразу валидный прототип, с учетом ограничений и требований, свойств материалов, заданных инженером-проектировщиком. Генеративный дизайн при создании айдентики позволяет, например, с помощью языка программирования GLSL или инструментария TouchDesigner, по-новому преподнести ценности компании, сформировать желаемый образ бренда посредством уникальных, создаваемых «с нуля» аудио-визуальных решений. Генеративный подход при наличии качественных синтетических данных позволяет существенно сэкономить время проверки прототипа. Какие на данный момент ключевые практические области применения генеративных моделей? Какими на данный момент качественными дата-сетами располагают программисты? Каковы перспективы использования генеративной модели в дизайне, инжиниринге, проектировании?	Модератор: Александр Коротин н.с. Центра ИИ Сколтеха, н.с. Института ИИ Спикеры: Арип Асадулаев Исследователь, Университет ИТМО, Институт Искусственного Интеллекта Сергей Николенко директор по науке компании Neuromation
17.00-18.00	Сессия ДНК дата-сайентиста	Дата-сайентист без преувеличения одна из самых перспективных профессий. Однако стремительное развитие технологий и все более сложные бизнес-задачи становятся причиной ее постоянной трансформации. Какие запросы к data science формирует сегодня бизнес, какая экспертиза будет востребована в будущем, как меняется образовательный трек специалиста, и какие опыт и знания становятся главным в «ДНК» успешного дата-сайентиста? Анализируем российский и международный опыт.	Модератор: Константин Вячеславович Воронцов, МФТИ д.ф.-м.н., профессор РАН, профессор МГУ и МФТИ Спикеры: Иван Гуз управляющий директор Авито Товары заместитель генерального директора, Авито Андрей Зима директор департамента анализа данных Ростелеком Максим Савченко управляющий директор, руководитель Центра инструментов машинного обучения, Лаборатория AI Сбера Денис Суржко начальник управления перспективных алгоритмов машинного обучения департамента анализа данных и моделирования, ВТБ Александр Дьяконов лектор Ozon Masters, Chief Research Scientist Dasha.ai	17.00-18.40	Сессия Рекомендательные системы	Системы рекомендаций, поддерживаемые машинным обучением, способны сегодня значительно усилить позиции сервиса или приложения на рынке. Изучение преференций и поведения пользователя, способность прогнозировать реакцию на тот или иной контент, и предложить новый, максимально отвечающий предпочтениями пользователя, – все это стало благодатной почвой для применения data science и алгоритмов машинного обучения, создания новых моделей и подходов. Как сегодня бизнес комбинирует базовые подходы – коллаборативную фильтрацию, контентную фильтрацию, экспертные системы, методы, основанные на матричном разложении и другие с deep learning, другими алгоритмами машинного обучения? Что дает наибольший эффект, ведет к приросту целевого действия пользователя, или позволяет сформировать максимально точную матрицу предпочтений без шума? Обсудим целесообразность создания новых архитектур нейронных сетей и постараемся ответить, всегда ли оправдано кратное увеличение сложности используемых моделей, где бизнес находит для себя баланс между сложностью и эффективностью?	Модератор: Виктор Кантор директор центра Big Data МТС Спикеры: Петр Ермаков создатель школы машинного обучения DataGym Юрий Жидков управляющий директор Управления перспективных алгоритмов машинного обучения ВТБ Семен Поляков ведущий ML-инженер VK Тимофей Смирнов Data Scientist ВТБ Алексей Васильев тимлид группы рекомендательных систем, Лаборатория по искусственному интеллекту Сбера
18.10-19.30	Science notes Распределенные методы оптимизации	Обзор результатов наиболее актуальных исследований касающихся методов оптимизации в сфере работы с данными и машинном обучении. Какие теоретические прорывы, совершенные в последнее время способны, способны трансформировать имеющийся набор инструментов работы с данными, сделав расчеты более быстрыми, снизив нагрузку на каналы передачи данных и увеличив точность работы алгоритмов. Какие актуальные задачи из сферы BigDataScience стоят перед учеными?	Модератор: Александр Гасников заведующий кафедрой Математических основ управления ФУПМ ПМИ МФТИ Спикеры: Александр Безносиков младший научный сотрудник ФПМИ МФТИ Александр Рогозин аспирант ФПМИ МФТИ Евгений Лепшин заместитель начальника управления перспективных алгоритмов машинного обучения ВТБ	18.50-19.50	Сессия Computer Vision	На сессии будут расмотрены актуальные направления исследований в компьютерном зрении и представлены доклады о практическом примении этих технолий. Будут рассмотрены практические сценарии разработки моделей сегментации изображений при наличии небольшого количества обучающих данных для решаемого бизнес-кейса. Также будет разобрана подготовка моделей по анализу лиц на мобильных устройствах, которые накладывают значительные ограничения на вычислительную сложность и размер разрабатываемых моделей.	Модератор: Сергей Миляев руководитель исследовательских проектов в VisionLabs Спикеры: Дарья Виноградова Data Scientist Иннотех Андрей Савченко д.т.н., профессор кафедры информационных систем и технологий НИУ ВШЭ в Нижнем Новгороде

Our website uses cookies, including web analytics services. By using the website, you consent to the processing of personal data using cookies. You can find out more about the processing of personal data in the Privacy policy

Learn More