Векторные хранилища: Pinecone, Qdrant, pgvector, Chroma, FAISS
Сравнение управляемых и self-hosted хранилищ, типы индексов HNSW и IVF, как поднять Qdrant в Docker и pgvector в Postgres, когда что выбирать.
Поднимите Qdrant в Docker и pgvector локально. Загрузите 1000 векторов в оба, замерьте latency топ-5 запроса и сравните. Создайте HNSW-индекс в pgvector и повторите замер — насколько ускорилось?
Скопируйте и адаптируйте под свой контекст. Текст в треугольных скобках — то, что нужно заменить.
Помоги выбрать векторное хранилище. Объём: <число векторов>, размерность: <…> Инфраструктура: <есть ли Postgres / k8s / managed-only> Требования: <приватность, фильтрация, бюджет, латентность> Сравни Pinecone / Qdrant / pgvector / Chroma по этим осям и дай рекомендацию с типом индекса (HNSW/IVF) и параметрами.
- FAISS используют как «базу» и удивляются отсутствию фильтров и сети — это библиотека индекса.
- В pgvector забывают создать HNSW-индекс — поиск идёт seq scan и тормозит на больших таблицах.
- Метрика индекса (cosine) не совпадает с тем, как нормированы эмбеддинги.
- Берут Pinecone для приватных данных без учёта того, что данные уходят вендору.