DataCon: как научиться применять ИИ на химических данных
Друзья, с момента основания проекта прошло уже 20 лет и мы рады сообщать вам, что сайт, наконец, переехали на новую платформу.
Какое-то время продолжим трудится на общее благо по адресу
На новой платформе мы уделили особое внимание удобству поиска материалов.
Особенно рекомендуем познакомиться с работой рубрикатора.
Спасибо, ждём вас на N-N-N.ru
Блог компании ИТМО. Уже два года подряд Центр искусственного интеллекта в химии ИТМО проводит DataCon – это сочетание образовательного интенсива и хакатона. Ученые Центра “делегируют” участникам хакатона обработку данных, собранных в ходе экспериментов и по открытым источникам. Результат – обученные ML-модели, прогнозирующие характеристики новых наночастиц из проектов Центра.
В то же время DataCon – бесплатный образовательный интенсив, который проходит онлайн для школьников и студентов, уже имеющих базу в области химии. Они расширяют свои знания по нейросетям и работе с ними в контексте обработки экспериментальных данных. В этой статье расскажем о том, как это работает и какие результаты дает.
Под капотом DataCon
DataCon – это конкурсная активность в рамках “Приоритета 2030”, которая совмещает в себе обучение широкого круга заинтересованных и пользу для научных проектов в области биологии и химии наночастиц, над которыми Центр химии и искусственного интеллекта работает сегодня.
Задачи и примеры для DataCon подкидывают научные группы. Коллеги выбирают актуальный на момент проведения активности проект, который находится на нужной стадии развития. Каждый раз проекты разные, но объединяет их одна проблема – наличие большой базы необработанных данных, собранных нашими сотрудниками. Данные могут быть получены экспериментально или собраны по открытым источникам, но они не валидированы и не приведены к единому формату, т.е. в чистом виде не могут использоваться для дальнейших исследований. У самих подразделений не всегда хватает ресурсов эти данные обработать. Тут-то и подключаются участники DataCon.
Образовательная часть DataCon – это различные лекции, семинары и воркшопы, которые должны погрузить участников в предметную область проекта и показать, какие подходы используются для обработки данных. В среднем длятся они две недели, а ведут их магистранты и аспиранты ИТМО, плюс приглашенные внешние специалисты.
В рамках обучающей части участники прокачивают в том числе и практические навыки, а также разбиваются на команды. К каждой команде прикрепляется ментор. Кстати, именно этот фактор и определяет лимит на количество участников – мы берем столько, сколько может “переварить” команда организаторов.
Обучение завершается хакатоном, в рамках которого команды обрабатывают данные и формируют предсказания по собранной базе. Команда победителей имеет возможность проверить свое решение экспериментально. Понятно, что участвуя удаленно, они не могут прийти в лабораторию сами. Но им помогают сотрудники ИТМО, выполняя эксперимент (откровенно говоря, это продуктивнее, чем пытаться быстро познать экспериментальные методы в незнакомой лаборатории или стерильном боксе).
Конкурсная часть в данном случае – не главная. Основное – это обучение. Но хакатон помогает добавить соревновательный элемент и дополнительно мотивировать искать решение. А кроме того он дает огромную пользу именно научному проекту – группа получает сразу множество вариантов решения актуальной задачи.
Участие и тем более победа в DataCon дает определенные неформальные преференции. Например, за участие в этой инициативе абитуриентам добавляют баллы к ЕГЭ. Студенты могут указывать факт участия в DataCon при подаче заявок на стажировки – в этом случае у них будет приоритет. Также участники команды победителей могут попасть в магистратуру Центра для химиков без экзаменов.
Поскольку перед DataCon не стоит задачи кого-то отсеять и выбрать только самых лучших, проигравшие команды тоже в своем роде победители. Если им понравилось направление, после того как будет закончена экспериментальная проверка решения команды победителей, они могут напомнить о себе, постажироваться в группе или поработать удаленно, просто связавшись с организаторами.
Оказалось, что участие в подобных мероприятиях хорошо воспринимается и внешними работодателями. Одна из участниц последнего DataCon поделилась опытом, что рассказ об этом проекте (о кейсе, который разбирали в рамках DataCon) помог ей устроиться в крупный банк на новую для нее роль аналитика данных.
Как это было?
DataCon проходил уже дважды – летом в 2022 и 2023 годах.
- Источник(и):
- Войдите на сайт для отправки комментариев