Vektorbasierte Vorselektion (Phase A2)

Ziel

Reduktion des Suchraums auf potenziell relevante Chunks. Dies ist eine Vorselektion, keine Wahrheitsfindung.

Ablauf

  1. Der Query-Vektor wird gegen die definierte Collection gesucht
  2. Die Vektordatenbank liefert:
    • Chunk-Referenzen (IDs)
    • Relevanz-Scores (Cosine Similarity)
  3. Es werden ausschließlich Chunk-IDs und Payload-Metadaten verwendet
  4. Anzahl der Ergebnisse wird durch top_k begrenzt

Kritische Abgrenzung

Scores sindScores sind NICHT
DistanzmaßeWahrheitsmaße
HeuristischSemantisch valide
VorselektionEndergebnis

Ähnlichkeit ≠ Relevanz ≠ Wahrheit

Qdrant-Abfrage

POST /collections/documents/points/search
{
  "vector": [0.123, -0.456, ...],  // 1536 Dimensionen
  "limit": 10,
  "with_payload": true,
  "filter": {
    "must": [
      {"key": "collection", "match": {"value": "documents"}}
    ]
  }
}

Ergebnisartefakte

Beteiligte Komponenten

KomponentePfadFunktion
search_similar()pipeline/rag.pyQdrant-Suche
Qdrant REST APIlocalhost:6333Vektor-Suche

Prüfbedingungen für Supervision