Milvus Distributed
Milvus — высокопроизводительная, облачная векторная база данных, специально разработанная для приложений искусственного интеллекта. Созданная на Go и C++, она использует аппаратное ускорение для достижения лучшей в своем классе производительности векторного поиска как на CPU, так и на GPU.
Благодаря распределенной архитектуре, разделяющей вычисления и хранение, Milvus масштабируется горизонтально для обработки миллиардов векторов и тысяч одновременных запросов. Она поддерживает все основные типы векторных индексов (HNSW, IVF, FLAT, SCANN, DiskANN) и предлагает расширенные функции, такие как фильтрация метаданных, гибридный поиск, объединяющий плотные и разреженные векторы, и мультитенантность.
Milvus пользуется доверием разработчиков ИИ по всему миру для создания критически важных приложений, таких как семантический поиск, генерация с дополнением извлечением (RAG), поиск изображений и рекомендательные системы.
Доступная в нескольких вариантах развертывания — от легких локальных экземпляров до полностью распределенных кластеров — Milvus обеспечивает гибкость и производительность, необходимые для современной инфраструктуры ИИ.
- Установите продукт в Yandex.Cloud Marketplace в уже существующий кластер.
- Дождитесь поднятия всех ресурсов Milvus Distributed.
- Получите временный пароль для авторизации с помощью команды " kubectl get cm milvus -n milvus -o jsonpath='{.data.default.yaml}' | sed -n 's/.defaultRootPassword: «(.)"/\1/p' »
- Смените пароль по инструкции — https://milvus.io/docs/authenticate.md#Update-user-password
- Milvus будет доступен по следующим адресам:
- Attu — attu.<доменное имя указанное при установке>
- Milvus GRPC — milvus.<доменное имя указанное при установке>
- Milvus WebUI — выполните команду kubectl port-forward -n <namespace> service/milvus 27018:19530 и откройте в браузере http://localhost:27018
Генерация с дополнением извлечением (RAG)
# Сценарий
> Разработчик: "Мне нужно улучшить точность ответов моей LLM-модели, используя нашу собственную базу знаний с миллионами документов."
Решение Milvus: Интегрируйте Milvus в свой RAG-конвейер для высокопроизводительного векторного поиска. Храните и извлекайте релевантный контекст из вашей базы знаний за миллисекунды, уменьшая галлюцинации и повышая точность ответов при обработке миллиардов документов в масштабе.
Поиск изображений
# Сценарий
> Пользователь: "Я хочу найти все изображения в моей библиотеке, похожие на это фото горного пейзажа."
Решение Milvus: Создавайте мощные системы поиска изображений с эффективным векторным поиском по сходству Milvus. Независимо от того, разрабатываете ли вы персональную фотобиблиотеку или коммерческое приложение для поиска изображений, Milvus обеспечивает производительность и масштабируемость, необходимые для мгновенного поиска визуально похожих изображений в огромных наборах данных.
Семантический поиск
# Сценарий
> Пользователь: "Покажи мне документы о влиянии искусственного интеллекта на здравоохранение."
Решение Milvus: Выйдите за рамки сопоставления ключевых слов с возможностями семантического поиска Milvus. Понимайте намерения пользователя и предоставляйте более релевантные результаты, выполняя поиск на основе смысла, а не точных совпадений, значительно улучшая качество поиска для ваших пользователей.
Рекомендательные системы
# Сценарий
> Бизнес-требование: "Нам нужно персонализировать рекомендации товаров в реальном времени для миллионов пользователей."
Решение Milvus: Обеспечивайте персонализированные рекомендации в масштабе с Milvus. Эффективно храня и выполняя поиск по векторным представлениям пользователей и товаров, Milvus позволяет создавать актуальные рекомендации в реальном времени, которые повышают вовлеченность и конверсию на вашей платформе.
Служба технической поддержки Yandex Cloud отвечает на запросы 24 часа в сутки, 7 дней в неделю. Доступные виды запросов и срок их обработки зависят от тарифного плана. Подключить платную поддержку можно в консоли управления. Подробнее о порядке оказания технической поддержки.
Yandex Cloud не предоставляет техническую поддержку продукта. При возникновении проблем обращайтесь к информационным ресурсам разработчика.
| Helm-чарт | Версия | Pull-команда | Документация |
|---|---|---|---|
| yandex-cloud/milvus | 4.2.57-yc-3 | Открыть |
| Docker-образ | Версия | Pull-команда |
|---|---|---|
| yandex-cloud/milvus/milvus1765288633195192012980844047526539813177200186230 | v2.5.15 | |
| yandex-cloud/milvus/milvus-config-tool1765288633195192012980844047526539813177200186230 | v0.1.2 | |
| yandex-cloud/milvus/heaptrack1765288633195192012980844047526539813177200186230 | v0.1.0 | |
| yandex-cloud/milvus/attu1765288633195192012980844047526539813177200186230 | v2.5.3 | |
| yandex-cloud/milvus/etcd1765288633195192012980844047526539813177200186230 | 3.5.18-r1 | |
| yandex-cloud/milvus/minio1765288633195192012980844047526539813177200186230 | RELEASE.2024-05-28T17-19-04Z | |
| yandex-cloud/milvus/pulsar1765288633195192012980844047526539813177200186230 | 3.0.7 | |
| yandex-cloud/milvus/kafka1765288633195192012980844047526539813177200186230 | 3.1.0-debian-10-r52 | |
| yandex-cloud/milvus/kafka-exporter-archived1765288633195192012980844047526539813177200186230 | 1.4.2-debian-10-r182 | |
| yandex-cloud/milvus/jmx-exporter1765288633195192012980844047526539813177200186230 | 0.16.1-debian-10-r245 |