Ended 2 years ago

Расписание сессий 14.05.2022

Business Day

11.05-12.05 Ставка на Data Fusion Эксперты о межотраслевом тренде Data Fusion, его перспективах, возможностях технологий, влиянии на развитие рынка данных, применении в разных индустриях и государственных проектах

Модератор: Александра Кирьянова

главный редактор Cnews 

Спикеры:

Александр Абаркин

Первый заместитель по ИТ руководителя Инновационного центра «Безопасный транспорт»

Сергей Безбогов

Заместитель руководителя Технологического блока - старший вице-президент ВТБ

Артем Блинов

Директор по закупкам ГК Самолет

Роман Мизюрин

Руководитель продвинутой аналитики Рисков и Общекорпоративных функций Альфабанк

Алексей Нейман

Исполнительный директор АБД

11.05-12.05 Decision Maker’s Problem. О чем говорят на конференциях, но не внедряют в жизни Новейшие технологии проходят долгий путь от момента первого прототипа до принятия решения о масштабном внедрении, и проблема не только в доступности технологии. Во многом успех зависит от готовности функционального заказчика внутри компании, который должен взять на себя роль адвоката создаваемого продукта, и сфера Data Science – не исключение. Какова должна быть мотивация C-level руководителей внутри компании для успешной акселерации проекта на основе Data Fusion? На сколько созрел рынок к внедрению решений Data Fusion, и есть ли необходимая экосистема для запуска проектов, специалисты с соответствующей квалификацией и квалифицированные заказчики? Участники сессии поделятся кейсами внутрикорпоративного взаимодействия по внедрению Data Science решений. Какие барьеры были преодолены для успешного внедрения, и какие неудачные попытки пришлось пережить?

Модератор:

Виталий Мзоков, директор венчурной студии ГК «Иннотех»

Спикеры: Наталья Дегтярева

Директор Акселератора ВТБ

Антон Мерзляков

Директор по аналитике больших данных Tele2

Павел Мягких

Директор по продвинутой аналитике Лента

Дмитрий Фадеев

Руководитель проектов AmberData

12.15-12.25    Data Fusion Awards Data Fusion в бизнесе

Номинации
Прорыв года

Монетизация данных

Трендсеттер

Ведущие:

Александра Кирьянова

главный редактор CNews

Денис Елаховский начальник отдела новостей экономики, телеканал «Москва 24», экономический обозреватель

Вручает:

Сергей Безбогов заместитель руководителя Технологического блока - старший вице-президент ПАО «Банк ВТБ»

12.15-13.45 Как анализ данных помогает внедрению принципов ESG? Глобальные климатические изменения вследствие антропогенных факторов требуют реализации четвертого энергоперехода для снижения рисков глобального потепления и выхода на траекторию устойчивого развития (потепление до 1.5 градусов Цельсия к 2100 г. по сравнению с доиндустриальным уровнем). При реализации мер по обеспечению устойчивого развития выделяют ESG-риски, для контроля которых требуются подходы на основе анализа данных, позволяющие надежно оценить вероятность и существенность риска. В рамках данной секции планируется обсудить существующие на данный момент технологии энергоперехода, и то, какие задачи возникают в ходе ESG-трансформации у бизнеса и могут быть решены за счет цифровизации, как моделировать риски устойчивого развития и оценивать их влияние на экономику. Помимо этих глобальных вопросов планируется обсудить вопросы образования для повышения осведомленности о ESG-принципах и оптимизации городской среды.

Спикеры:

Михаил Аким

Профессор практики Высшей школы бизнеса

Анна Кулашова

Директор Центра обучения проектированию и разработке игр ФПМИ МФТИ

Андрей Осипцов

Профессор и директор, проектный центр по энергопереходу, Сколтех

Назар Сотириади

Исполнительный директор, Департамент интегрированного риск-менеджмента, ПАО Сбербанк

Александр Филатов

Начальник управления данными в распределенных вычислительных сетях, Департамент информационных технологий города Москвы

12.35-14.05    Open source Всё больше компаний, разворачивающих свою цифровую инфраструктуру или разрабатывающих цифровые сервисы, переходят от проприетарных платформ, которые не всегда в полной мере обеспечивают потребности бизнеса в гибкой настройке к своим собственным решениям. Использование Open Source библиотек позволяет сохранить рентабельность разработки на приемлемом уровне, но, с другой стороны, является источником рисков. Это и риск блокировки доступа к ресурсам с открытыми библиотеками, изменения лицензий использования, безопасность размещенного кода и «закладки» в фундаментальных моделях. Каковы риски коммерческих систем в основе которых лежат Open Source разработки? Есть ли перспективы импортозамещения в этой сфере и когда появится российский GitHub?

Модератор: 

Сергей Бережной

Директор по взаимодействию с разработчиками, Яндекс

Спикеры:

Владислава Васильева

Заместитель директора по развитию, направление «Безопасная и открытая инфраструктура» АНО «Цифровая экономика»

Борис Емельянов

Директор департамента управления платформами хранилища данных Ростелеком

Александр Ермаков

Arenadata, СТО

Сергей Сергиенко

Cоветник Министра цифрового развития, связи и массовых коммуникаций Российской Федерации

Алексей Синицин

Генеральный директор РеСолют

Алексей Смирнов

Председатель совета директоров Базальт СПО

13:55 - 14:55 Практическое внедрение управления данными в органах государственной власти Нынешняя цифровая трансформация госуправления невозможна без скоординированной работы с данными на федеральном и региональном уровнях. Создание единого государственного data lake (озеро данных), запуск маркетплейса дата-сетов, развитие НСУД и СМЭВ4 станут ключевыми в повестке 2022 года. Как в ФИОВ сегодня выстраивается работа с данными в государстве? Каких успехов уже удалось добиться в ФИОВ и РОИВ, и что еще предстоит сделать? Какие изменения грядут на федеральном уровне, и к чему нужно готовиться регионам? Участники сессии озвучат позиции федеральных и региональных ОГВ, представят кейсы по управлению данными и обсудят предстоящие задачи.
В ходе сессии состоится презентация навигатора «Управление данными в госсекторе», который поможет РЦТ РОИВ и их командам глубже погрузиться в процессы по управлению данными, чтобы согласовать свои задачи с федеральной повесткой и скоординировать стратегии цифровой трансформации.

Модератор:

Екатерина Потапова

академический директор Центра CDTO, ВШГУ РАНХиГС

Спикеры:

Михаил Петров

Директор департамента цифровой трансформации Счетной палаты Российской Федерации

Дмитрий Разумовский

Заместитель Губернатора Калужской области, Руководитель министерства цифрового развития Калужской области

Николай Распопин

Министр цифрового развития Красноярского края

Максим Цыганков

Руководитель направления «Аналитические сервисы» НСУД, заместитель руководителя Научно-исследовательского департамента управления данными ФГАУ НИИ «Восход»

Дмитрий Шмелев

Заместитель руководителя аппарата Губернатора Ямало-Ненецкого автономного округа

14.35-15.35   Data Fusion. Работа с клиентами Эксперты о межотраслевом тренде Data Fusion, его перспективах, возможностях технологий, влиянии на развитие рынка данных, применении в разных индустриях и государственных проектах.

Модератор:

Сергей Голицын

вице-президент, заместитель руководителя департамента анализа данных и моделирования ВТБ

Спикеры:

Артем Алексеев

Партнер, директор по стратегии и развитию бизнеса Aggregion

Ксения Ачкасова

Исполнительный директор Mediascope

Евгений Макаров

Руководитель центра компетенций Data Science МТС

Александр Самсонов

Директор по стратегическим партнерствам Авито

Тигран Саркисов

Директор по работе с данными Х5 Group

Денис Суржко

Начальник управления перспективных алгоритмов машинного обучения департамента анализа данных и моделирования ВТБ

       
15.45-15.55    Data Fusion Awards. Гран При ВТБ

Бизнес-партнёрство в стиле Data Fusion

Партнёрство в области науки и исследований

Ведущие:

Александра Кирьянова

главный редактор Cnews

Денис Елаховский

начальник отдела новостей экономики, телеканал «Москва 24», экономический обозреватель

Вручает:

Сергей Голицын

вице-президент, заместитель руководителя департамента анализа данных и моделирования ВТБ

15.05-16.05 Case Study Data Fusion. Промышленность По мере развития подходов к цифровизации промышленных производств акценты от отдельных станков и установок смещаются к комплексной автоматизации целых предприятий или промышленных групп, составляющих производственные цепочки. В подобных сложных системах продуманная система анализа мультимодальных данных и принятия решений на их основе способна дать максимальный эффект по оптимизации промышленных процессов, снижению транзакционных издержек и повышению маржинальности производства в целом. Но все ли промышленные компании готовы к подобной Data Science-трансформации? Каков уровень доверия топ-менеджеров к дорогостоящим трансформационным решениям на основе подходов Data Fusion?

Модератор:

Кирилл Железнов

директор по продуктам, Цифровая Индустриальная платформ

Спикеры:

Владимир Вавра

Руководитель отдела инфраструктуры данных Уралхим

Николай Князев

Ведущий архитектор СофтЛайн

16.05-17.05   Вопросы доверия и этики в ИИ и работе с данными

Сегодня технологии искусственного интеллекта развиваются стремительно и применяются в самых разных сферах. Однако, чем быстрее развиваются технологии, тем меньше доверия они вызывают среди населения, даже несмотря на то, что искусственный интеллект делает жизнь человека намного проще. Человечество учится не только использовать технологии искусственного интеллекта, но и доверять им.

Спикеры рассмотрят кейсы из практики компаний по разрешению этических вопросов при внедрении искусственного интеллекта во взаимодействие с потребителями товаров/услуг, которые будут полезны сообществу ученых, занимающихся исследованиями Data Science.

Кто несет ответственность за последствия применения ИИ и за возмещение потенциального вреда клиентам сервисов, использующих ИИ?

Как использование ИИ может гарантировать справедливость (включая недискриминацию, непредвзятость, равенство) и где проходит грань между защитой участников от дискриминации и свободой слова

Как гарантировать процесс прозрачности использования данных и конфиденциальность информации, используемой ИИ?

Модератор:

Карен Казарян

генеральный директор Института исследований интернета, главный аналитик Ассоциации электронных коммуникаций

Спикеры:

Дмитрий Демидов

Руководитель лаборатории инноваций НОРБИТ

Сергей Морозов

Эксперт  Фонд Сколково

Алексей Нейман

Исполнительный директор АБД

Елена Сурагина

Руководитель Группы регуляторной поддержки экосистемы МТС

16.15-17.15 Case Study Data Fusion. Человеческий капитал

Цифровизация, удаленка и геополитика выбили почву из под ног у HR директоров, а традиционные инструменты работы с командой утратили былую эффективность. Где найти современные рычаги влияния на климат в коллективе? У дата-саентистов есть ответ!

- Как аналитика данных помогает работодателю выстраивать взаимоотношения с сотрудниками в периоды турбулентности и неопределенности?

- Как оцифровать выгорание? Предотвращение выгорания при удаленной работе, когда эмоциональная обратная связь от сотрудника к работодателю ограничена.

- Санкции, паника и стресс? Какие данные необходимо проанализировать и какие выводы сделать, чтобы настроить команду на эффективную работу? Кейсы повышения уровня мотивации.

Марина Буздалина

Управляющий директор, департамент ИТ блока HR Сбербанк

Даниэль Саттаров

И.о. руководителя подразделения «Пользовательские сервисы» ДОМ.РФ

Даниил Терентьев

CEO Conventus

Оксана Фетисова

Директор Департамента Корпоративный университет МТС

17.40-18.40    Круглый стол Data Fusion. Маркетинг, реклама и коммуникации

Привлечение клиентов сегодня и завтра. Большие данные, стабильные идентификаторы, аналитика и новые инструменты взаимодействия с аудиторией.

Готовы ли отечественные компании занять освобождающиеся и новые ниши и получить новый пул клиентов? Как в этом могут помочь большие данные? Какие технологии помогут бизнесу привлекать новых пользователей? Как защитить клиентские данные в период турбулентности? Какие правила хорошего тона существуют для работы с данными? 

Модератор:

Алексей Каштанов

генеральный директор, Platforma

Спикеры:

Марина Кормщикова

Директор направления, Департамент управления данными Ростелеком

Алина Садукевич

Руководитель департамента развития продуктов больших данных Билайн

Александр Сафонов

Руководитель службы развития продуктов больших данных Tele2

Дмитрий Фадеев

Руководитель проектов AmberData

Евгения Шулипина

CEO QuiteMedia

       
18.50-19.00    Data Fusion Awards. Data Fusion Rising  Stars спецноминация Фонда «Сколково»

Ведущий

Павел Новиков

директор центра инноваций в финансовом секторе Фонда «Сколково»

       

Расписание сессий 15.05.2022

Data Science Day

10:05 - 10:50    Science notes Федеративые модели Технология федеративного обучения, которое можно определить как распределенную систему машинного обучения, которая позволяет создавать коллективную модель из данных, которые распределены по владельцам этих данных, сегодня актуальна и быстро развивается. Как можно классифицировать системы федеративного обучения и основных алгоритмов? Какие основные кейсы федеративного обучения для разных типов систем сегодня наиболее репрезентативны? Каковы основные фреймворки федеративного обучения, их особенности? Об этом и некоторых benchmarks алгоритмов и фреймворков федеративного обучения поговорим в рамках science note

Иван Холод

СПбГЭТУ "ЛЭТИ" Декан факультета компьютерных технологий и информатики

10.05-11.15 Сессия MLOps Рассмотрим практические шаги по реализации технологического основания MLOps: инструменты DevOps конвейера и надстройки для непрерывного релиза моделей ML как ключевой компоненты ИИ. Сессия будет интересна всем, кто интересуется технологическими и организационными вопросами применения DevOps для внедрения систем искусственного интеллекта. 

Модератор: 

Александр Разгон Заместитель начальника управления процессов и стандартов моделирования ВТБ

Спикеры: 

Александр Волынский технический менеджер продукта ML Platform, VK Cloud Solutions 

Ван Хачатрян руководитель отдела машинного обучения и матчинга, Ozon

Константин Хримпач

 руководитель службы разработки решений машинного обученияTele2

11:00 - 11:40    Робастность глубоких нейросетей: геометрический подход При построении предиктивных моделей важно учитывать геометрическую структуру данных - то, как расположены наблюдения в многомерном пространстве. Обычно расположение наблюдений хорошо описывается многообразием. Очевидно, что его свойства влияют на точность соответствующих предиктивных моделей. Оценив многообразие данных, мы можем выявить области на многообразии, в которых предиктивная модель не робастна, и, тем самым, становится возможным генерировать как эффективные злонамеренные атаки на модель, так и обеспечивать защиту от них. Доклад посвящён вопросам генерации атак и защиты от них с учётом многообразия данных, а также, в целом, вопросам того, как сравнивать многообразие реальных данных и данных, порождённых генеративной моделью, и за счет этого, например, выявлять искусственно сгенерированные (потенциально фейковые) наблюдения.

Евгений Бурнаев

Руководитель Центра прикладного ИИ, Сколтех, в.н.с., AIRI

11.25-12.25 Сессия Конфиденциальные вычисления 
 
Важность конфиденциальности при работе с данными и моделями сложно переоценить: Обладая существенными набором информации и желая создать получить дополнительную выгоду для себя или общества, владельцы больших данных также несут ответственность за сохранение конфиденциальности, рискуя не только доверием к своему имени, но и подвергая рискам свой бизнес, а также субъектов информации. С ростом популярности вычислений в сторонних и совместных центрах обработки также крайне важно не только сохранять в тайне свои модели и алгоритмы, но и быть уверенными, что в промышленной эксплуатации находится именна та модель и именно тот код, который создавался в процессе разработки. Вопрос конфиденциальных вычислений крайне важен с одной стороны с точки зрения защиты, а с другой стороны критичен с точки зрения возможности безопасного развития совместных решений, построенных на основе анализа данных и моделирования. В этой сессии мы рассмотрим два основных подхода к конфиденциальным вычислениям, дающим новые возможности для использования совместных датасетов в моделях, а также для проведения вычислений в совместных средах: - математико-алгоритмический, представитлять который будет MPC - multi-party computation - программно-аппаратный, представлять который будет Trusted Execution Environment на примере Intel SGX Кроме того, рассмотрим архитектуру Data Mesh, которая позволит собрать и объединить в одном периметре обработки данных сразу оба этих подхода. 
 

Модератор: 

Олег Мангутов ассоциированный партнер Группа анализа данных и моделирования EY

 Спикеры: 

Дмитрий Берестнев заместитель директора Департамента анализа и моделирования Иннотех 

Петр Емельянов CEO, Bloomtech

Виктор Стрелков директор по разработке, oneFactor 

Андрей Тотмаков технический директор Platforma

11.50-13.10    От научной статьи до MVP Путь от научной статьи до MVP это путь, который проходит идея в R&D процессе. Часто этот путь занимает годы и не исключена ситуация, когда идея так и не сможет оформиться в конкретный продукт. Как происходит и какой спецификой обладает R&D в стремительно развивающейся сфере DataScience? Дискуссия будет разбита на две части, в первой обсудим актуальные проблемы R&D в области AI и DS в России. Во второй поговорим о конкретных научных работах, направлениях исследований, которые, по мнению наших экспертов, активно развиваются и имеют широкую область приложений.

Модератор:

Александр Мамаев

руководитель отдела машинного обучения и анализа данных VK

Спикеры:

Юрий Дорн

Школа анализа данных Яндекс и ФКН ВШЭ, Ст. преподаватель: МФТИ

Руководитель OzonMasters

Александр Дьяконов

Chief Research Scientist Dasha.ai

Лектор OzonMasters

Илья Макаров

Программный директор Академии больших данных MADE, ВК Образование

Александр Панченко

Доцент Сколтех

Максим Савченко

Управляющий директор, руководитель Центра инструментов машинного обучения Лаборатории AI Сбера

12.35-13.35 Сессия Повышение эффективности в NLP Для большинства успешных компаний NLP стало business critical технологией. В этой связи, становится важным поиск максимально операционно эффективных решений NLP задач, в том числе: минимизация затрат на разметку (zero и few-shot learning, active learning и information retrieval), рост скорости разработки и внедрения моделей путем применения AutoML решений, unsupervised подходы. В рамках секции мы обсудим данный тренд и актуальные разработки в области операционно эффективного решения NLP задач. 
 

Модератор: 

Денис Суржко Начальник управления перспективных алгоритмов машинного обучения департамента анализа данных и моделирования ВТБ 

Спикеры: 

Андрей Коцеруба директор в управлении перспективных алгоритмов машинного обучения ВТБ

Денис Кузнецов исследователь DeepPavlov (MIPT)

 Валентин Малых Senior Research Scientist, Huawei Noah's Ark Lab - 

Алексей Рябых

ML Team Lead, ВТБ 
 

13:20 - 14:00    Диффузионные модели с динамически меняющимся размером За последние два года диффузионные модели задали новую планку качества в генеративном моделировании. Эта красивая концепция объединяет в себе нейродиффуры, моделирование на основе скор-функции, приближенные методы байесовского вывода и стохастические дифференциальные уравнения. Их основным недостатком является большое время генерации объекта. В докладе мы рассмотрим причины успеха диффузионных моделей и пути повышения их эффективности за счет уменьшения работы вхолостую на начальном этапе обратной динамики. Получившаяся модель обобщает стандартные диффузионные модели и иерархические вариационные автокодировщики в рамках более общей парадигмы.

Дмитрий Ветров

к.ф.-м.н., профессор факультета компьютерных наук НИУ ВШЭ

13.45-14.30 Сессия Matching. Соревнование Data Fusion Contest С все большим ростом объема накопленных данных, появляются новые актуальные задачи машинного обучения. Ранее, задача вероятностного соотнесения и сопоставления данных (Matching) уже проявлялась как в поисках дубликатов, так и в классических приложениях по восстановления целостности данных, особенно медицинских. Последние несколько лет появились возможности проводить более сложные семантические сопоставления в неструктурированных данных, таких как фото, видео и текст. Сегодня эти методы Matching подходят к тому уровню, что все накопленные за эти годы наработки в области машинного обучения становится возможным вывести в широкий круг приложений индустрий, включая работу с уже привычными данными банковских транзакций или онлайн магазинов. В этой секции наши слушателю узнают, что из себя представляют Matching задачи сегодня, как к этим задачам можно подходить, а также смогут перенять опыт решения Matching задач в реальных компаниях.

Модератор: 

Алексей Натекин основатель, ODS

Спикеры:

Дмитрий Берестнев заместитель директора департамента анализа и моделирования Иннотех 

Евгений Ворсин Data Scientist Иннотех 

Анатолий Глушенко

 Lead DS ВТБ 

Александр Голубев Senior ML engineer Ozon 
 

14:10 - 14:50   

Science notes

Вызовы технологий искусственного интеллекта

Методы искусственного интеллекта достигли высоких результатов. Однако, они подвержены различным ошибкам. Как можно "атаковать" модели ИИ, как защищаться от этого и можно ли это делать вообще – это мы обсудим в лекции.

Иван Оселедец

Профессор, Директор центра технологий ИИ, Сколтех

14.40-15.40 Сессия Нейроданные – от структуры к функции при помощи доменно информированных методов ML  На сегодняшний день ученые, эксперты располагают обширным опытом в сборе нейроданных как инвазивными, так и неинвазивными методами, но формат этих данных, а, следовательно, и их анализ сталкивается с рядом вызовов. Но как сформировать качественный субстрат функциональных данных на основе структурных? По факту, преодоление этих препятствий, которые во многом лежат в плоскости Data Science и ML, может открыть новые перспективы по их коммерческому использованию. К примеру, нейросети хорошо учатся по данным, собранным с помощью МРТ, ФМРТ, когда они хорошо размечены. Как хорошо размеченные данные без шумов могут повысить эффективность работы алгоритмов и методов машинного обучения, например, self-supervised learning? Другой аспект работы с данными, полученными при сканировании мозга, так и получаемые иными неинвазивными методами со всего человеческого организма – «жадность» алгоритмов. Алгоритмы часто научаются не тем задачам, которые от них требовались изначально, в силу неправильного восприятия контекста, или, наоборот, чрезмерной фокусировке на нем. Какими методами это «лечить» – один из вопросов предстоящей дискуссии. Поговорим об интерпретации получаемых данных в ходе сканирования мозга, организма, об оценке эффективности работы алгоритмов машинного обучения, обрабатывающих эти данные, и интерпретации результатов, полученных уже по итогам работы этих алгоритмов. Ну и, конечно же, обсудим практическое, в том числе коммерческое применение – зачем мы изучаем мозг, обрабатываем информацию о работе нейронов, о реакции всего организма с помощью сложных методов глубинного обучения?

Модератор: 

Сергей Воинов Директор по акселерации по направлению цифровая медицина, Кластер биологических и медицинских технологий, Фонд «Сколково» 

Спикеры: 

Анвар Курмуков

PhD старший научный сотрудник AIRI

Алексей Осадчий директор, Центр биоэлектрических интерфейсов, институт когнитивных нейронаук НИУ ВШЭ, в.н.с., Институт искусственного интеллекта, AIRI

Максим Шараев к.ф.-м.н., руководитель группы Интеллектуальной обработки сигналов и изображений Центра прикладного ИИ, Сколтех 

Евгений Шуранов руководитель RnD лаборатории Huawei

16.10-16.50   Science notes Граф исследований и исследования графов в Физтех-школе прикладной математики и информатики   Спикер: Андрей Михайлович Райгородский, МФТИ д.ф-м.н, федеральный профессор математики, директор ФПМИ 15.50-16.50 Сессия Генеративные модели  Генеративные модели ИИ по версии Gartner входят в топ актуальных технологических трендов. Очевидны их преимущества, к примеру генеративный дизайн позволяет даже без топологической оптимизации создать сразу валидный прототип, с учетом ограничений и требований, свойств материалов, заданных инженером-проектировщиком. Генеративный дизайн при создании айдентики позволяет, например, с помощью языка программирования GLSL или инструментария TouchDesigner, по-новому преподнести ценности компании, сформировать желаемый образ бренда посредством уникальных, создаваемых «с нуля» аудио-визуальных решений. Генеративный подход при наличии качественных синтетических данных позволяет существенно сэкономить время проверки прототипа. Какие на данный момент ключевые практические области применения генеративных моделей? Какими на данный момент качественными дата-сетами располагают программисты? Каковы перспективы использования генеративной модели в дизайне, инжиниринге, проектировании? 

Модератор:

Александр Коротин н.с. Центра ИИ Сколтеха, н.с. Института ИИ

 Спикеры: 

Арип Асадулаев Исследователь, Университет ИТМО, Институт Искусственного Интеллекта 

Сергей Николенко директор по науке компании Neuromation

17.00-18.00    Сессия ДНК дата-сайентиста  Дата-сайентист без преувеличения одна из самых перспективных профессий. Однако стремительное развитие технологий и все более сложные бизнес-задачи становятся причиной ее постоянной трансформации. Какие запросы к data science формирует сегодня бизнес, какая экспертиза будет востребована в будущем, как меняется образовательный трек специалиста, и какие опыт и знания становятся главным в «ДНК» успешного дата-сайентиста? Анализируем российский и международный опыт. 
 

Модератор: 

Константин Вячеславович Воронцов, МФТИ д.ф.-м.н., профессор РАН, профессор МГУ и МФТИ

Спикеры: 

Иван Гуз

управляющий директор Авито Товары заместитель генерального директора, Авито

 Андрей Зима

директор департамента анализа данных Ростелеком 

Максим Савченко

управляющий директор, руководитель Центра инструментов машинного обучения, Лаборатория AI Сбера

 Денис Суржко

начальник управления перспективных алгоритмов машинного обучения департамента анализа данных и моделирования, ВТБ 

Александр Дьяконов лектор Ozon Masters, Chief Research Scientist Dasha.ai 
 

17.00-18.40 Сессия Рекомендательные системы Системы рекомендаций, поддерживаемые машинным обучением, способны сегодня значительно усилить позиции сервиса или приложения на рынке. Изучение преференций и поведения пользователя, способность прогнозировать реакцию на тот или иной контент, и предложить новый, максимально отвечающий предпочтениями пользователя, – все это стало благодатной почвой для применения data science и алгоритмов машинного обучения, создания новых моделей и подходов. Как сегодня бизнес комбинирует базовые подходы – коллаборативную фильтрацию, контентную фильтрацию, экспертные системы, методы, основанные на матричном разложении и другие с deep learning, другими алгоритмами машинного обучения? Что дает наибольший эффект, ведет к приросту целевого действия пользователя, или позволяет сформировать максимально точную матрицу предпочтений без шума? Обсудим целесообразность создания новых архитектур нейронных сетей и постараемся ответить, всегда ли оправдано кратное увеличение сложности используемых моделей, где бизнес находит для себя баланс между сложностью и эффективностью?


Модератор: 

Виктор Кантор директор центра Big Data МТС 

Спикеры: 

Петр Ермаков создатель школы машинного обучения DataGym

Юрий Жидков управляющий директор Управления перспективных алгоритмов машинного обучения ВТБ 

Семен Поляков ведущий ML-инженер VK

Тимофей Смирнов Data Scientist ВТБ

 Алексей Васильев тимлид группы рекомендательных систем, Лаборатория по искусственному интеллекту Сбера

18.10-19.30 Science notes Распределенные методы оптимизации
Обзор результатов наиболее актуальных исследований касающихся методов оптимизации в сфере работы с данными и машинном обучении. Какие теоретические прорывы, совершенные в последнее время способны, способны трансформировать имеющийся набор инструментов работы с данными, сделав расчеты более быстрыми, снизив нагрузку на каналы передачи данных и увеличив точность работы алгоритмов. Какие актуальные задачи из сферы BigDataScience стоят перед учеными?

Модератор: 

Александр Гасников заведующий кафедрой Математических основ управления ФУПМ ПМИ МФТИ 

Спикеры: 

Александр Безносиков 

младший научный сотрудник ФПМИ МФТИ

Александр Рогозин

аспирант ФПМИ МФТИ

Евгений Лепшин заместитель начальника управления перспективных алгоритмов машинного обучения ВТБ


 

18.50-19.50  Сессия Computer Vision На сессии будут расмотрены актуальные направления исследований в компьютерном зрении и представлены доклады о практическом примении этих технолий. Будут рассмотрены практические сценарии разработки моделей сегментации изображений при наличии небольшого количества обучающих данных для решаемого бизнес-кейса. Также будет разобрана подготовка моделей по анализу лиц на мобильных устройствах, которые накладывают значительные ограничения на вычислительную сложность и размер разрабатываемых моделей. 
 

Модератор: 

Сергей Миляев руководитель исследовательских проектов в VisionLabs 

Спикеры: 

Дарья Виноградова Data Scientist Иннотех 

Андрей Савченко д.т.н., профессор кафедры информационных систем и технологий НИУ ВШЭ в Нижнем Новгороде 
 

Cookies help us deliver our services. By using our services, you agree to our use of cookies.