Присоединяйтесь к Mattermost чату сообщества Open Data Science!
Трек для подачи заявки на создание курса
Изучаются алгоритмы обучения с подкреплением, использующие нейронные сети.
Курс про линейные модели и ансамбли из деревьев решений
Учим избавляться от рутины во внутренних процессах жизненного цикла моделей и повышать эффективность своей работы.
Natural Language Processing (NLP) is a domain of research whose objective is to analyze and understand human languages and develop technologies to enable human machine interactions with natural languages. NLP is an interdisciplinary field involving linguistics, computer sciences and artificial intelligence. The goal of this course is to provide students with comprehensive knowledge of NLP. Students will be equiped with the principles and theories of NLP, as well as various NLP technologies, including rule-based, statistical and neural network ones. After this course, students will be able to conduct NLP research and develop state-of-the-art NLP systems.
Актуальные карьерные вопросы для начинающих свой путь в DS
Секция о применении машинного обучения в образовательном процессе. Как правильно строить системы взаимодействия с пользователями для улучшения учебного процесса.
Секция Reliable ML - про эффективное внедрение ML-решений в бизнеc-практику.
В этой секции Вы узнаете о передовых методах и подходах к работе с большими языковыми моделями (LLM). Вас ждут доклады от ведущих специалистов в области Data Science, которые поделятся своим опытом и знаниями о том, как создавать умных ассистентов, бороться с галлюцинациями в RAG-системах, обучать большие языковые модели и применять их в различных областях.
Секция посвящена ИИ-проектам с открытым кодом, а также лучшим практикам в их использовании и создании.
ML для задач маркетинга: привлечение, удержание, работа с узнаваемостью, и многое другое где бизнесу пригодится ML уже сегодня.
Теория и практика работы с временными рядами и прогнозированием: от классических статистических наработок до DL и FM
Самая масштабная секция Data Fest 2024 о том, как компьютер понимает, обрабатывает и порождает тексты на языках, на которых общаются люди.
Секция посвящена применению машинного обучения к задачам обработки Данных Дистанционного Зондирования Земли (ДЗЗ).
ML in Physics - в этой секции мы расскажем как машинное обучение применяется для решения сложных физических задач, расширения возможностей научных исследований и промышленности.
В этой секции вы узнаете о том как решать задачи обработки речи
Секция Robotics посвящена применению различных алгоритмов машинного обучения в робототехнике
Секция RecSys познакомит вас с самыми актуальными кейсами различных компаний и технологическими трендами в этой области.
В секции "Scoring" представлены передовые доклады в сферах оценки кредитоспособности и прогнозировании рисков. Вам предстоит погружение в самые актуальные аспекты данных в области скоринга и моделирования.
Секция о том, как машинное обучение применяется в промышленности: от подготовки данных и ресерча до внедрения на производстве и поддержки ML систем
Кузница будущих секций Data Fest — интересные темы внутри DS/ML, которые пока еще не успели разрастись до целой секции 🤗
Делимся опытом по вопросам продакшена, автоматизации, масштабируемости, воспроизводимости, и не только!
Секция про то, как оптимизировать нейронки для выкатывания в прод, и экономии на инференсе
У хороших хорроров — пентиквел не предел!
Стратегия развития данных - про управление данными в организациях
Career - карьера, дата-роли и профессиональный рост
Про data governance в компаниях. В этом году — с уклоном в Data Quality часть колеса Сансары.
Хрестоматия разработчика компьютерного зрения: как без боли решить задачу компьютерного зрения и заставить это решение работать в проде. Вдохновляемся опытом коллег о том, как они прошли через тернистый путь разработки модели компьютерного зрения для своих задач.
Рассказываем, как мы используем ML в Авито: решения, инструменты, данные, обучающие материалы и другие ресурсы, необходимые для работы.
Трек про опыт применения ML в реальных задачах Яндекса.
Трек для подачи заявки на организацию секций от сообщества для сообщества, а также подачи своего доклада в уже существующие (и не только) секции.
Первый открытый русскоязычный курс по геоаналитике. Материалы курса будут полезны специалистам в области Data Scientist, поскольку позволят решать геопространственные задачи, а также проводить исследования в области Geospatial Data Science.
Современные подходы и инструменты для исследований на данных, разработки и внедрения ML-решений в production.
Привет! В этом треке мы собрали страшно интересные видео с офлайн митапа в Санкт-Петербурге, который прошел 27ого октября в Лектории Газпром нефти
В этом треке мы собрали записи Random DS с офлайн-конференции Data Fest Siberia 4
В этом треке мы собрали записи по Career с офлайн-конференции Data Fest Siberia 4
В этом треке мы собрали записи по Computer Vision с офлайн-конференции Data Fest Siberia 4
В этом треке мы собрали записи по MLOps с офлайн-конференции Data Fest Siberia 4
В этом треке мы собрали записи AI4Code с офлайн-конференции Data Fest Siberia 4
В этом треке мы собрали записи по NLP с офлайн-конференции Data Fest Siberia 4
В этом треке мы собрали записи по Разбору статей с офлайн-конференции Data Fest Siberia 4
В этом треке мы собрали записи по Студенческим проектам с офлайн-конференции Data Fest Siberia 4
Долгожданное продолжение курса «Линейный модели»!
Курс о линейной зависимости: поговорим о линейной и логистической регрессиях, метриках, валидации, генерации признаков и применим знания в конкурсе "Турникеты".
Дизайн систем машинного обучения. Введение для начинающих.
Опыт применения ML в реальных задачах Яндекса
Особенности применения NLP в практических задачах
Четвёртое пришествие ужасов медицинских данных
Опенсорс - научный и не только
В этой секции вы узнаете, как работает ChatGPT как с теоретической, так и с практической точки зрения.
Наша традиционная рубрика: применение NLP в индустриальных задачах
Секция Reliable ML - о том, как сделать так, чтобы результаты работы дата-команд приносили прибыль
Трек с интересными докладами вокруг и около DS/ML с конференции Data Fest 2023
В этом треке мы собрали записи по RecSys с конференции Data Fest 2023
В этом треке мы собрали записи по Computer Vision с конференции Data Fest 2023
Секция ML in Manufacturing Data Fest 2023 об интересных кейсах применения машинного обучения в промышленности
Как собирать данные и где они обитают: методологии сбора данных, обучение разметчиков, полевой краудсорсинг, и многое другое.
В этом треке мы собрали записи по Career с конференции Data Fest 2023
Первый MLOps трек в рамках онлайн DataFest
Практикоориентированный онлайн-курс по созданию реального продукта на данных с менторской поддержкой и возможностью поступить в магистратуру ИТМО без экзаменов
Продвинутые подходы и инструменты для разработки и внедрения ML-решений в production.
Трек для подачи заявки на создание курса, организации секций, проектов и возможностью стать спикером.
mlcourse.ai is an open Machine Learning course by OpenDataScience (ods.ai), led by Yury Kashnitsky (yorko). Having both a Ph.D. degree in applied math and a Kaggle Competitions Master tier, Yury aimed at designing an ML course with a perfect balance between theory and practice. Thus, the course meets you with mathematical formulae in lectures and a lot of practice in a form of assignments and Kaggle Inclass competitions. In 2017-2019, some 26k people participated in active course sessions offered twice a year, and ~1500 finished the course. ODS has witnessed multiple stories about the course changing careers of those who had passed it. Currently, the course is in a self-paced mode. Here we guide you through the self-paced mlcourse.ai.
Этот курс позволит вам погрузиться в удивительный мир квантового машинного обучения! Курс максимально ориентирован на практику, на методы, которые работают уже сегодня, в NISQ-эпоху (Noisy Intermediate-Scale Quantum), когда кубитов мало и они не идеальны.
Международная конференция по машинному обучению, анализу данных и технологиям ИИ
Кейсы, технические доклады и science notes конференции по анализу данных Data Fusion 2022
Международная онлайн-конференция в области больших данных
В этом треке мы собрали записи по NLP с офлайн-конференции Data Fest Siberia 3
В этом треке мы собрали записи по Computer Vision с офлайн-конференции Data Fest Siberia 3
В этом треке мы собрали записи по MLOps с офлайн-конференции Data Fest Siberia 3
В этом треке мы собрали записи по Career с офлайн-конференции Data Fest Siberia 3
В этом треке мы собрали записи по Ужасам медицинских данных с офлайн-конференции Data Fest Siberia 3
В этом треке мы собрали записи по ML & Security с офлайн-конференции Data Fest Siberia 3
В этом треке мы собрали записи по студенческим проектам in Industry с офлайн-конференции Data Fest Siberia 3
В этом треке мы собрали записи по ML in Industry с офлайн-конференции Data Fest Siberia 3
В этом треке мы собрали записи по Code Mining с офлайн-конференции Data Fest Siberia 3
Трек с интересными докладами вокруг и около DS/ML
В этом треке мы собрали записи по ODS Lab с офлайн-конференции Data Fest Siberia 3
Курс по графам знаний (Knowledge Graphs) и как их готовить в 2022 году. Запуск №2.
Трек по Natural Language Processing в рамках Data Fest Online 3
Ужасы медицинских данных возвращаются!
Трек посвящен задаче матчинга в анализе данных и разборам решений соревнования Data Fusion Contest 2022
Расскажем и покажем на практике, как мы умеем применять ML алгоритмы в различных областях жизни - от чисто бизнесовых вопросов до исследования космических частиц. Не забудем также затронуть вопросы жизненного цикла моделей и важности его автоматизации.
Как управлять внедрением и развитием продвинутой аналитики, чтобы ML был применим в бизнес-процессе и приносил финансовую пользу.
Применение нейронных сетей на многомерных временных данных для решения классических банковских задач
Всё что будет полезно знать об обновленном ODS 3.0. А также активности, early access, и многое другое во время переходного периода — тоже будут складироваться здесь 👀
Курс о линейной зависимости: поговорим о линейной и логистической регрессиях, метриках, валидации, генерации признаков и применим знания в конкурсе "Alice".
Архитектура LightAutoML для разработки кастомных пайпланов из блоков с примерами
Курс по графам знаний (Knowledge Graphs) и как их готовить в 2021 году.
Вводный курс. Основные принципы и подходы Lean Data Science.
В каких кейсах использовать аплифт модели? Какие бывают типы моделей, как их обучить? Как оценить качество? Как подготовить обучающую выборку? Как провести АБ тест с аплифт моделью? Все это вы узнаете из курса по uplift моделированию от создателей библиотеки scikit-uplift.
Курс про лицензирование свободного программного обеспечения и безопасную разработку ПО
NLP, CV, Whitebox, AutoUplift, автоматические отчеты и мониторинг в LightAutoML
Трек LightAutoML - создание, ускорение и кастомизация пайплайнов автоматизированного машинного обучения
Трек для глубокого изучения рекомендательных систем на практике
ML in Marketing: ML для задач маркетинга. Привлечение, удержание, работа с узнаваемостью, где вашему бизнесу пригодится ML уже сегодня.
Использование обработки естественного языка в практике
Трек с проектами, где мы приглашаем участников влиться и помочь Open Source библиотекам, которые разрабатывают наши участники из ODS.
Трек с Open Science исследовательскими проектами, где участники могут попробовать свои силы в современных не-школьных DS и ML задачах.
Мы любим развивать и Open Source, и Open Science, и, конечно же, сам ODS. Вдохновившись Google Summer of Code и зимней школой CompTech NSU, мы тоже решили организовать активность, где участники сообщества могли бы внести вклад в крутые открытые проекты.
Обучаем современным ML инструментам для ваших проектов и задач
Про хранение, визуализацию, обработку и анализ данных с применением языка программирования Python.
ML тренировки - это серия митапов, на которых обсуждаются Data Science соревнования
Трек, посвященный проблематике анализа исходных кодов “Code Mining” как и в предыдущие года, делится знаниями экспертов области Data-Driven Software Engineering. В 2021 году доклады представят эксперты компаний Athenian, JetBrains и Profiscope.io
Трек проектов, в которых с помощью ML и других приблуд в области DS можно сделать мир лучше. Здесь мы поделимся новостями существующих проектов и будем очень рады новым участникам со свежими идеями!
Про инженерные подходы к обработке информации. В нашей секции мы стараемся уйти от buzzword-ов и говорить только про инженерные подходы и решения, делится опытом и набитыми шишками.
Спецы из лучших российских ML-стартапов расскажут про ужасы медицинских данных - есть ли Ground Truth в медицине, что делать с несовпадающей кросс-разметкой и как на всём этом оценивать качество моделек.
Как собирать данные и где они обитают: методологии сбора данных, архитектуры систем, доставка данных до моделей машинного обучения и многое другое.
Catalyst - PyTorch framework for Deep Learning research and development. + Reinforcement learning in a Nutshell: games, articles, production - choose wisely.
Индустрия Антифрода/Антиспама/Антивсего: какие есть особенности и как с этим работать. У нас будет несколько докладов от крупных IT компаний, все доклады будут от людей, которые на практике защищают сервисы, пользователей или партнеров.
Всё про карьеру и найм в DS от индустриальных топов
Трек посвящен управлению Data Science проектами и продуктами. Приходите, если вам интересно развиваться в сторону DS менеджмента.
Нестандартные и креативные приложения машинного обучения.
Взглянем на трансформеры как на универсальный инструмент для анализа и обработки семантических последовательностей и рассмотрим их применение в разных задачах.
Цель трека - создание сообщества для решения актуальных проблем интерпретируемости моделей машинного обучения и выявления причинно-следственных связей в них.
Поговорим о том, как бизнеса пройти путь от определения точек роста до устойчивого финансового эффекта с помощью аналитики данных
Инструменты и практики управления экспериментами в Machine Learning, обеспечения воспроизводимости (Reproducibility) и автоматизации процессов.
Data Science в МегаФоне совсем не ограничивается телекомом! Вы познакомитесь с интересными проектами и методами из сферы Causal ML, Recommendations и просто работы с табличными данными. Также сможете попробовать свои силы в соревновании по Uplift Modelling. И на закуску - телеграм чаты+подкаст об ML с любимыми спикерами из индустрии и академии.
quantum ods: все о применении ml в квантовом мире, а также достижений из квантового мира в ml под соусом незабываемого общения
Митап ODS Reliable ML по АБ-тестированию и Causal Inference - 17 декабря 2022 г.
Лекции и встречи в самом сердце Академгородка и онлайн для всех увлечённых машинным обучением.
Серия осенних митапов 2021, на которых обсуждается управление Data Science проектами и продуктами
Серия осенних митапов 2021, на которых обсуждаются Data Science соревнования
Серия осенних митапов 2021, на которых обсуждается ML для задач маркетинга: привлечение, удержание, работа с узнаваемостью, где вашему бизнесу пригодится ML уже сегодня
Your first recsys.
A lot of people in ODS contribute to open source projects, or even create their own. In this track they will tell us about their projects and we will discuss open source in general and in data science world specifically.
ML in Healthcare - medical imaging and other medical applications. Machine Learning and Data Analysis in medical applications.
Язык Julia создан математиками для математиков, он действительно прост, красив и элегантен, но при этом очень быстр. За последние годы, язык созданный в 2009 году сильно окреп, оброс серьезной экосистемой и стал действительно привлекать внимание специалистов в области анализ данных. Именно поэтому мы решились сделать курс про основы Julia для применения в Data Science проектах.
SysML — это область анализа данных и больших данных, в которой внимание уделяется вопросам применения машинного обучения и больших данных в продакшне. В докладах мы обсуждаем почему некоторые из подходов из Kaggle-конкурсов не работают на реальных задачах, в чем особенность больших нагрузок при применения машинного обучения, как считать тяжелые фичи на лету и как справиться с большими объемами данных.
Машинное обучение в реальных секторах экономики - от добычи нефти до генерации энергии и производства стали.
Трек о том, что такое data governance, что это может дать компании и вам и как начать.
Машинное обучение для безопасности и безопасность машинного обучения.
Advanced methods and topics in the world of A/B testing.
Catalyst - PyTorch framework for Deep Learning research and development.
Reinforcement Learning in a Nutshell. Games, articles, production - choose wisely.
Welcome to the Machine Learning REPA: Reproducibility, Experiments and Pipelines Automation!
AI Hardware is computers and chips designed specifically for machine learning applications. In this section, we will share with you our experience in AI hardware design and highlight industry trends.
В этом году очень отличаются форматы, состав и сценарии секций. Например, в нашей секции про образование в этом году основной фокус на личных историях. Цифры образовательного рынка доступны в сети, описания самых разных программ, от массовых до персональных, тоже. Вы все знаете где лучшие курсы по 180К, здесь вас нечем удивить. К тому же, во время пандемии многие остались наедине со своими целями и сомнениями. Поэтому мы решили показать вам людей. Мы покажем тех, кто учится и учит. Их опыт, ошибки, истории успеха и наоборот. Может это кого-то сподвигнет на новые подвиги, кто-то поймет, что он на верном пути, а кто-то найдет ту команду для творческого роста, которой как раз не хватало.
Track «From pet-project to startup» business section of Data Fest 2020.
Трек ВТБ будет посвящен fusion идеям, которые заключаются не в поисках маржинального улучшения в конкретных узких областях ML, а идеям извлечения большого business value из концепции объединения данных, синергии модельных подходов и процессов. Например, концепции объединения или переноса алгоритмов из одной области машинного обучения в другую. И даже fusion процессов в машинном обучении.
Расскажем из чего состоит жизненный цикл решения на базе NLP. Как довести гипотезу до продуктивной среды и сделать так, чтобы поддержка этого решения не съедала все свободное время.
A tutorial on uncertainty estimation in ML for a non-research practitioners of machine learning. Will cover basics of uncertainty estimation via ensemble methods, ensemble-emulation methods and generative methods. We will also provide a detailed case-study of an example usage of uncertainty estimation.
Что такое МЛ-тренировки? Это рассказ о победных решениях соревнований по машинному обучению.
Track about Data Science without Machine Learning, Big Data, Neural Networks or anything else requiring training or big amount of storage.
О том, как data science помогает решать задачи бизнеса! Юзкейсы из ключевых отраслей, углубленная аналитика в тяжелой промышленности, специальный гость из Quantum Black - Causal Machine Learning: a rising tide (ENG)
Трек посвящен методам управления Data Science проектами.
Расскажем про оптимизацию ритейл сети, учёт причинно-следственных связей, Positive Unlabeled learning и про акселератор для стажёров. Также вас ждет воркшоп по основам анализа геоданных в Python и технический data science квест.
Сделаем обзор того, что делают банки и страховые в ML. Погружаемся вглубь исследования клиентов, размещения офисов, биометрии… Но и наука расскажет как им ML для анализа фондового рынка, и можно ли собрать данные для прогноза инфляции.
На треке мы представляем серию докладов от ведущих специалистов области анализа исходных кодов в России: JetBrains, JetBrains Research, PVS-Studio, Profiscope.io.
Great jobs don’t simply fall out of the sky as soon as you’ve mastered Python, R or SQL. This year's Career section unites Data Science experts to discuss the most exciting career questions. How to become a senior in Data Science? Why is the middle not yet senior and how to become a senior? How to improve one’s soft skills and is it important at all? Star speakers, industry experts, tricky questions to the recruiters, and many more.
Our goal is to engage Data Scientists in the process of creating objects and tools of modern media and technological art. Creating collaborations between artists and scientists. During the conference we will hold several meetups with talks from various artists working with machine learning.
Интерпретация моделей машинного обучения: как объяснить результаты статистических моделей заказчику.
Hi! Welcome to the optimization track on Datafest! Here we will discuss both theory and practice of modern optimization. We say really modern because the results and methods explained in the section are used either to conduct bleeding-edge research or train neural networks faster and larger.
Цель трека - создание causal inference guide для data scientist-ов. Классические и современные подходы причинно-следственного анализа в применении к задачам машинного обучения.
Разберемся с архитектурой и типами квантового компьютера, а также поговорим о нейронных сетях в квантовой физике.
Что сейчас происходит в области обработки естественного языка (NLP)?
19-20 сентября Яндекс проводит секцию по краудсорсингу. Вас ждут доклады от команды Яндекс.Толоки про эффективные методы контроля качества в краудсорсинге, разметку данных на большом масштабе и ТОП-10 ошибок заказчика, из-за которых теряются время и деньги.
Хрестоматия разработчика компьютерного зрения: как без боли решить задачу компьютерного зрения и заставить это решение работать в проде. Вдохновляемся опытом коллег о том, как они прошли через тернистый путь разработки модели компьютерного зрения для своих задач. Если вы хотите дополнить трек своим докладом, то пишите в Telegram @sigmoida или в ODS @Sonya.
Graph Machine Learning is the science between graph theory and machine learning. It is now a very active area of research, with hundreds of publications each month, impactful applications in the industry, and new insights about our world. Intersection of graph theory and machine learning. Overview, SOTA, applications.
Голосование за лучших из лучших в премии сообщества 2023
Голосование за лучших из лучших в премии сообщества 2022
Вместе выбираем и награждаем участников сообщества за их вклад в Open Data Science 2021. Добро пожаловать на ежегодную премию сообщества 🌟 ODS Awards 2021 🏆!
Лучшие из лучших в 2020 году
Обзоры состояния различных Data Science областей по состоянию на конец 2021
Обзоры состояния различных Data Science областей по состоянию на конец 2020
Добро пожаловать на ежегодное соревнование по машинному обучению Data Fusion Contest c призовым фондом в 2 000 000 рублей!
Ежегодное соревнование по машинному обучению Data Fusion Contest. В 2023 году это турнир по Adversarial ML между командами атакующих и защищающих ML модели на транзакционных данных.
Matching соревнование по машинному обучению: научитесь угадывать одних и тех же клиентов по их поведению на данных транзакций и кликстрима. 3 задачи, 2 номинации и 2 000 000 рублей!
ПРО//ЧТЕНИЕ - серия технологических конкурсов для разработчиков в области машинного обучения.
AIJ Contest - an international online data analysis and AI competition held among industry developers and experts worldwide since 2016.
Первая секция про интерпретируемость моделей машинного обучения в рамках ежегодного Data Fest.
Cookies help us deliver our services. By using our services, you agree to our use of cookies.