Vector Databases

What Is a Vector Database?

A vector database is a specialised database designed to store, index, and search high-dimensional vectors (arrays of numbers), typically produced by machine learning models such as:

Text embeddings (NLP)
Image embeddings (computer vision)
Audio embeddings
Recommendation system features

Instead of querying by exact values (e.g. WHERE name = 'x'), vector databases query by similarity:

“Find items most similar to this item.”

Why Do Vector Databases Exist?

Traditional databases struggle with semantic similarity.

Example:

Query: “A red sports car”
Stored text: “Ferrari 488 in crimson”

A relational or document DB sees different words resulting in no match

A vector DB sees similar meaning resulting in a high similarity score

Vector databases enable:

Semantic search
AI-powered retrieval (RAG)
Recommendation systems
Clustering and classification
Fraud/anomaly detection

Core Concept: Embeddings

An embedding is a numeric representation of data in a high-dimensional space.

Example (simplified):

"cat"  → [0.12, 0.98, -0.45, ...]
"dog"  → [0.10, 0.95, -0.40, ...]
"car"  → [-0.88, 0.01, 0.76, ...]

“cat” and “dog” vectors are close
“car” is far away

Modern embeddings typically have:

384, 768, 1024, or 1536 dimensions
Generated by models like OpenAI, HuggingFace, Cohere, etc.

How Vector Databases Work (High Level)

flowchart LR
    A[Raw Data: Text / Image / Audio] --> B[Embedding Model]
    B --> C[Vector: float]
    C --> D[Vector Database]
    Q[User Query] --> B
    B --> C2[Query Vector]
    C2 --> D
    D --> R[Top-K Similar Results]

Key Steps

Convert data into vectors
Store vector array + metadata
Index vectors for fast similarity search
Query with a vector
Return nearest neighbours

Similarity Search (The Core Operation)

Vector databases use distance metrics:

Metric	Meaning
Cosine similarity	Angle between vectors (most common for text)
Euclidean distance	Straight-line distance
Dot product	Magnitude-weighted similarity

Example (Cosine Similarity)

Similarity = 1 → identical meaning
Similarity = 0 → unrelated
Similarity < 0 → opposite meaning

Indexing: Why Vector Search Is Fast

Brute-force comparison is too slow for millions of vectors.

Vector DBs use Approximate Nearest Neighbour (ANN) algorithms:

HNSW (Hierarchical Navigable Small World graphs)
IVF (Inverted File Index)
PQ (Product Quantization)

These trade perfect accuracy for huge performance gains.

“Vector databases prioritise recall and latency over exactness using ANN indexing.”

What Makes a Database a “Vector Database”?

Core features:

Native vector data type (float[])
ANN indexing
Similarity search APIs
Metadata filtering
Hybrid queries (vector + structured)
Horizontal scaling

Popular Vector Databases (2025 Landscape)

Database	Type	Notes
Pinecone	Managed SaaS	Very popular, easy
Weaviate	Open-source / managed	Strong hybrid search
Milvus	Open-source	High performance
Qdrant	Open-source	Rust-based, fast
Chroma	Open-source	Dev-focused
Azure AI Search	Managed	Vector + keyword
PostgreSQL + pgvector	Extension	Simple workloads

Vector DB vs Traditional Databases

Vector DB vs Relational (SQL Server, PostgreSQL)

Feature	Relational DB	Vector DB
Exact lookups	✔	✘
Joins	✔	✘
Transactions	✔	Limited
Semantic similarity	✘	✔
ANN indexing	✘	✔

SQL Server (even in .NET 10 ecosystems) is not suitable for large-scale vector similarity search.

Vector DB vs Document DB (MongoDB)

Aspect	MongoDB	Vector DB
Text search	Keyword-based	Semantic
AI workloads	Weak	Strong
Similarity search	Limited	Native

Hybrid Approaches

Very common pattern:

SQL / NoSQL → metadata
Vector DB → semantic search