Glossar · KI & LLMs

Vector Database

Datenbank, optimiert für ANN-Suche (Approximate Nearest Neighbor) über hochdimensionale Vektoren — also semantische statt exakter Matches.

Definition

Klassische Datenbanken sind für exakte Lookups und Range-Scans gebaut; Vector-DBs sind für Ähnlichkeitssuche optimiert. Sie nutzen Indexstrukturen wie HNSW, IVF oder ScaNN, um in Millisekunden die top-k ähnlichsten Vektoren aus Millionen von Einträgen zu finden — bei minimal verlustbehafteter Genauigkeit.

Optionen reichen von dedizierten Diensten (Pinecone, Weaviate, Qdrant) über Open-Source-Selfhosting (Milvus, Chroma) bis zu Extensions in klassischen DBs (pgvector für PostgreSQL, Atlas Vector Search für MongoDB).

Wahlkriterien: Skalierungsbedarf (10k vs. 100M Vektoren), Filterlogik (Metadaten-Filter pro Tenant), Latenz-SLA und Operational Overhead. Für die meisten Mittelstands-Use-Cases ist pgvector vollkommen ausreichend.

So nutzen wir das bei adsbird

Wenn ein Kunde bereits PostgreSQL nutzt, nehmen wir fast immer pgvector — keine zusätzliche Infrastruktur, kein separater Vendor, Row-Level-Security pro Mandant kommt aus dem Postgres-Setup. Nur bei >10M Vektoren oder strengen Latenz-SLAs wechseln wir auf Qdrant oder Pinecone.

Verwandte Begriffe

Embedding → RAG (Retrieval-Augmented Generation) → Multi-Tenancy →

Vector Database in deinem Projekt?

Wir bauen damit,
jeden Tag.

Wenn du Vector Database in einem konkreten Workflow brauchst — wir haben das wahrscheinlich schon gebaut.

Erstgespräch → Alle Begriffe

Vector Database

Wir bauen damit,jeden Tag.

Wir bauen damit,
jeden Tag.