Vektorspeicherung (Phase 4)

Ziel

Chunks werden in einen mathematischen Ähnlichkeitsraum überführt. Die Vektordatenbank dient ausschließlich dem Auffinden inhaltlich ähnlicher Chunks. Sie ist kein Wissensspeicher und trägt keine semantische Wahrheit.

Vektorisierung

Qdrant-Konfiguration

EigenschaftWert
Hostlocalhost:6333
Dimensionen1536
Distance MetricCosine
Collectionsdocuments, system-docs

Payload-Struktur (erlaubt)

{
  "chunk_id": 1234,
  "document_id": 42,
  "section_id": 15,
  "language": "de",
  "document_type": "pdf"
}

Payload enthält KEINE

Rolle der Vektordatenbank

Wird genutzt fürWird NICHT genutzt für
ÄhnlichkeitssucheFaktenhaltung
KontextretrievalSchlussfolgerung
Vorfilterung relevanter ChunksKonsistenzprüfung

Abgrenzung zur Semantik

Beteiligte Komponenten

KomponentePfadFunktion
store_in_qdrant()pipeline/embed.py:47Speicherung via REST API
Qdrant REST APIPUT /collections/{name}/pointsUpsert Points

Prüfbedingungen für Supervision