Статью с описанием датасета опубликовали в открытом доступе

Сергей Нестерук представил крупнейший датасет для умных касс и систем учёта магазинов
Ритейлеры смогут использовать этот датасет для обучения алгоритмов в умных кассах и системах учёта.
PackEat — это самый большой в мире открытый набор данных для систем компьютерного зрения в розничной торговле. Это набор фотографий фруктов и овощей, который ритейлеры могут использовать для обучения алгоритмов в умных кассах и системах учёта. С помощью датасета можно значимо улучшить точность распознавания продуктов в реальных супермаркетах — он учитывает изображения объектов с полиэтиленовыми пакетами, пересечением объектов и «шумным» фоном на прилавках.
Для датасета PackEat команда исследователей собрала изображения 34 видов и 65 сортов фруктов и овощей. Это привычные для покупателей товары с овощных и фруктовых прилавков, снятые с разных точек обзора в реальных магазинах. Всего собрали свыше 100 тыс. снимков более 370 тыс. отдельных объектов в магазинах разных городов. Около 9 тыс. изображений содержат разметку каждого отдельного объекта, для каждого снимка указано количество объектов и общий вес упаковки. Этот набор данных поможет решить ключевые задачи компьютерного зрения в ритейле: различать виды и сорта продуктов, выделять каждый объект отдельно, даже когда они пересекаются или частично закрыты, а также автоматически подсчитывать количество единиц товара.
В розничных сетях сохраняется проблема ручной идентификации видов, сортов и дефектов весового товара, и это приводит к убыткам. По данным исследований
О команде исследователей
Ключевую роль в исследовании сыграли Сергей Нестерук из Yandex Cloud и Светлана Илларионова из Центра ИИ Сколтеха.
Сергей Нестерук — руководитель команды безопасности искусственного интеллекта Yandex Cloud. Его научная деятельность связана с изучением компьютерного зрения. Среди его работ
Светлана Илларионова — руководитель группы «Компьютерное зрение для обработки данных» Центра ИИ Сколтеха. Выпускница магистратуры МГУ им. М. В. Ломоносова по специальности «Прикладная математика и информатика», в 2023‑м защитила PhD в Сколтехе по теме компьютерного зрения для дистанционного зондирования Земли. Реализует исследовательские проекты по применению алгоритмов компьютерного зрения для обработки мультимодальных данных, в частности применительно к спутниковому мониторингу окружающей среды и медицинскому анализу. Автор более 25 научных статей в ведущих рецензируемых журналах и нескольких патентов на изобретения.
