Сергей Нестерук представил крупнейший датасет для умных касс и систем учёта магазинов

Ритейлеры смогут использовать этот датасет для обучения алгоритмов в умных кассах и системах учёта.

PackEat — это самый большой в мире открытый набор данных для систем компьютерного зрения в розничной торговле. Это набор фотографий фруктов и овощей, который ритейлеры могут использовать для обучения алгоритмов в умных кассах и системах учёта. С помощью датасета можно значимо улучшить точность распознавания продуктов в реальных супермаркетах — он учитывает изображения объектов с полиэтиленовыми пакетами, пересечением объектов и «шумным» фоном на прилавках.

Для датасета PackEat команда исследователей собрала изображения 34 видов и 65 сортов фруктов и овощей. Это привычные для покупателей товары с овощных и фруктовых прилавков, снятые с разных точек обзора в реальных магазинах. Всего собрали свыше 100 тыс. снимков более 370 тыс. отдельных объектов в магазинах разных городов. Около 9 тыс. изображений содержат разметку каждого отдельного объекта, для каждого снимка указано количество объектов и общий вес упаковки. Этот набор данных поможет решить ключевые задачи компьютерного зрения в ритейле: различать виды и сорта продуктов, выделять каждый объект отдельно, даже когда они пересекаются или частично закрыты, а также автоматически подсчитывать количество единиц товара.

В розничных сетях сохраняется проблема ручной идентификации видов, сортов и дефектов весового товара, и это приводит к убыткам. По данным исследований, нейросети могут достичь точности в 92%, подтверждая важность автоматизации.

Статью с описанием датасета опубликовали в открытом доступе в журнале Scientific Data. Набор изображений разместили на платформе Zenodo, а код и примеры моделей — на платформе Kaggle. Это позволяет исследователям и разработчикам сразу использовать их в своих проектах и сравнивать получающиеся решения с результатами авторов.

О команде исследователей

Ключевую роль в исследовании сыграли Сергей Нестерук из Yandex Cloud и Светлана Илларионова из Центра ИИ Сколтеха.

Сергей Нестерук — руководитель команды безопасности искусственного интеллекта Yandex Cloud. Его научная деятельность связана с изучением компьютерного зрения. Среди его работ — публикации в международных журналах и сборниках IEEE. Он регулярно выступает на профильных конференциях. Соавтор материалов по безопасной разработке ИИ‑агентов и мультиагентных систем. Команда Сергея обеспечивает безопасность при использовании ИИ, а также разрабатывает ИИ‑инструменты для защиты данных и безопасности Yandex Cloud.

Светлана Илларионова — руководитель группы «Компьютерное зрение для обработки данных» Центра ИИ Сколтеха. Выпускница магистратуры МГУ им. М. В. Ломоносова по специальности «Прикладная математика и информатика», в 2023‑м защитила PhD в Сколтехе по теме компьютерного зрения для дистанционного зондирования Земли. Реализует исследовательские проекты по применению алгоритмов компьютерного зрения для обработки мультимодальных данных, в частности применительно к спутниковому мониторингу окружающей среды и медицинскому анализу. Автор более 25 научных статей в ведущих рецензируемых журналах и нескольких патентов на изобретения.

author
Команда Yandex Cloud
Сергей Нестерук представил крупнейший датасет для умных касс и систем учёта магазинов
Войдите, чтобы сохранить пост