Qdrant
Qdrant — это передовая векторная база данных и поисковая система нового поколения для приложений искусственного интеллекта, доступная в облаке. Она предлагает надёжный механизм поиска векторов по сходству и решение для базы данных с удобным API для хранения, поиска и управления векторами с дополнительными нагрузками (payload). Qdrant выделяется обширными возможностями фильтрации, что делает его идеальным для сопоставления на основе нейронных сетей и семантики, фасетного поиска и различных других приложений.
Фильтрация и управление нагрузками (payload): Qdrant позволяет прикреплять JSON-нагрузки к векторам, обеспечивая хранение данных и фильтрацию по значениям нагрузок. Поддерживает разнообразные типы данных и условия запросов, включая сопоставление по ключевым словам, полнотекстовую фильтрацию, числовые диапазоны, геопозиции и многое другое.
Гибридный поиск со разреженными векторами: Поддерживает гибридные методы поиска, сочетающие поиск по сходству векторов с традиционными поисками по разреженным векторам.
Квантование векторов и хранение на диске: Оптимизирует эффективность хранения за счёт квантования векторов и решений для хранения на диске.
Распределённое развёртывание и масштабирование: Предлагает варианты распределённого развёртывания с горизонтальным масштабированием через шардирование и репликацию, обеспечивая обновления без простоев и плавное динамическое масштабирование коллекций.
Планирование запросов и индексы нагрузок: Использует сохранённую информацию о нагрузках для оптимизации стратегий выполнения запросов, повышая производительность поиска.
Аппаратное ускорение SIMD: Использует современные архитектуры процессоров (x86-x64 и Neon) для аппаратного ускорения, обеспечивая повышенную производительность.
Асинхронный ввод-вывод (Async I/O): Применяет io_uring для максимизации использования пропускной способности диска, даже на сетевом хранилище.
Предварительная запись журналов (Write-Ahead Logging): Гарантирует сохранность данных с подтверждением обновлений, защищая от потери данных при сбоях питания.
-
Получите пару SSH-ключей для подключения к виртуальной машине (ВМ).
-
Создайте ВМ из публичного образа. В блоке Выбор образа/загрузочного диска перейдите на вкладку Cloud Marketplace и выберите Qdrant. В блоке Доступ:
- в поле Логин введите имя пользователя;
- в поле SSH-ключ вставьте содержимое файла с открытым SSH-ключом.
-
Убедитесь, что в выбранной Группе безопасности разрешены входящие порты
TCP/22иTCP/6333. -
Нажмите Создать ВМ и дождитесь завершения процесса развертывания.
-
Отправьте запрос на создание тестовой коллекции:
curl -X PUT 'http://<IP-адрес ВМ>:6333/collections/test_collection' \ -H 'Content-Type: application/json' \ --data-raw '{ "vectors": { "size": 4, "distance": "Dot" } }' -
Проверьте результат:
{"result":true,"status":"ok","time":0.468969413}
- Высокопроизводительная векторная база данных и поиск
- Гибридный поиск
- Бесшовная интеграция с инструментами построения AI агентов и процессов, такими как langflow
- Использование в качестве векторной базы данных для RAG
Служба технической поддержки Yandex Cloud отвечает на запросы 24 часа в сутки, 7 дней в неделю. Доступные виды запросов и срок их обработки зависят от тарифного плана. Подключить платную поддержку можно в консоли управления. Подробнее о порядке оказания технической поддержки.
Yandex Cloud не предоставляет техническую поддержку продукта. При возникновении проблем обращайтесь к информационным ресурсам разработчика.