Нейросеть в проекте помогает биологам автоматизировать весь цикл мониторинга и, впоследствии, быстрее получать данные для новых исследований. Вместе с учёными НИИ биологии Иркутского государственного университета нейросеть разрабатывали компания MaritimeAI, команда платформы Yandex Cloud и Фонд поддержки прикладных экологических разработок и исследований «Озеро Байкал».
На базе Yandex Cloud разработана уникальная нейросеть для экомониторинга Байкала
Команда учёных и разработчиков запустила нейросеть для экомониторинга Байкала на облачной платформе Yandex Cloud. Проект необходим для прогнозирования состояния озера, влияния климатических изменений на его экосистему, а также оценки рыбозапаса.
Алгоритм машинного обучения (ML) анализирует пробы воды из озера, определяет и классифицирует содержащиеся в ней микроорганизмы. Уже сейчас нейросеть умеет работать с 70 формами планктона, которые чаще всего встречаются в пробах. Внедрение искусственного интеллекта упростит работу биологов, которые много лет подсчитывали и определяли микроорганизмы вручную.
Биологи предоставили почти 50 тыс. изображений проб, из которых 20 тыс. было использовано для обучения алгоритмов. Теперь изображения проб с микроскопов автоматически передаются в облачную платформу Yandex Cloud. Алгоритм определяет мельчайших рачков, их видовую принадлежность и формирует отчётные карточки. Нейросеть продолжает обучаться в сервисе для разработки и эксплуатации ML-алгоритмов Yandex DataSphere. Разметка данных происходила с помощью краудсорсингового сервиса «Толока».
«Научное сообщество и образовательные организации делают всё больше открытий в облаке. Одна из приоритетных задач нашей платформы — создать надёжный трамплин для лёгкого использования облачных сервисов в исследовательских проектах. В Yandex Cloud запускали систему мониторинга урожая, создавали алгоритм для беспилотного гоночного болида, исследовали тёмную материю. Нейросеть для экологического мониторинга Байкала — особый проект и для нас, и для всего сообщества, невероятный по своему масштабу и значимости».
В будущем участники проекта планируют масштабировать мониторинг и отслеживать состояние воды в других точках Байкала. Также разработчики последовательно будут выкладывать в opensource технологии, которые используются в проекте. Так, в свободном доступе уже есть датасет изображений проб с разметкой. Его можно использовать для тестирования гипотез по детекции, сегментации и классификации планктонных организмов. Позже будут выложены более полный набор данных и исходный код. Это поможет разрабатывать собственные системы мониторинга водоёмов другим научным группам и институтам по всему миру.