Векторный поиск — одна из технологических инициатив, которые суммарно получили 330 млн рублей в качестве инвестиции фонда Яндекса YaTF. Векторный поиск уже применяют в разных продуктах компании, в том числе в Алисе. С его помощью она умеет находить наиболее подходящие ответы для пользователей — диалог похож на разговор с друзьями с общим контекстом.

Векторный поиск в YDB: технология, которая ускорит развитие ИИ‑решений для бизнеса
Векторный поиск позволит быстро находить похожие данные и создавать системы, персонализировано отвечающие на запросы пользователей. При разработке ИИ‑продуктов он улучшит и ускорит работу виртуальных ассистентов, рекомендательных и поисковых систем.
Векторный поиск основан на поиске семантически похожих элементов в большом объёме данных. Разные типы информации: текст, изображения, аудио и видео — представляются в виде наборов чисел, эмбеддингов. Они сохраняются в базу данных YDB
В YDB теперь доступны две версии векторного поиска — точный и приближённый. Первый гарантирует, что будут найдены наиболее похожие данные, но требует большой вычислительной сложности, если их много. Приближённый векторный поиск позволяет искать по сотням миллионов векторов за десятки или сотни миллисекунд, даже если все векторы не помещаются в оперативную память.
В Яндексе много работают с ИИ‑решениями, для которых важен семантический поиск по данным. Для развития приложений на базе ИИ важна надёжная инфраструктура, которая обеспечивает отказоустойчивость и масштабируемость конечного решения. Теперь доступ к векторному поиску в YDB
