Kontext-Aufbau (Phase A4-A5)

Phase A4: Kontext-Selektion und Priorisierung

Ziel

Zusammenstellung eines sinnvollen, begrenzten Arbeitskontextes aus den nachgeladenen Chunks.

Ablauf

  1. Chunks werden priorisiert nach:
    • Relevanz-Score (aus Vorselektion)
    • Dokumentenvielfalt (nicht alle Chunks aus einem Dokument)
    • Redundanzfreiheit (keine inhaltlichen Dopplungen)
  2. Auswahl erfolgt bis zum:
    • Token-Limit (Modell-abhängig)
    • Kontext-Limit (konfiguriert als top_k)
  3. Reihenfolge wird festgelegt und stabilisiert

Abgrenzung

Ergebnisartefakte

Phase A5: Kontext-Formalisierung

Ziel

Übersetzung der ausgewählten Chunks in ein LLM-verwertbares Kontextformat.

Ablauf

  1. Jeder Chunk wird versehen mit:
    • Quellenkennzeichnung (z.B. [Quelle 1])
    • Dokumentenreferenz (Dateiname, Seite)
  2. Trennmarker werden eingefügt zwischen Chunks
  3. Token-Limits werden technisch geprüft

Kontextformat

[Quelle 1: Systemisches Coaching.pdf, S. 12]
Die Auftragsklärung ist der erste Schritt im Coaching-Prozess...

---

[Quelle 2: Methodenhandbuch.pdf, S. 45]
Skalenfragen ermöglichen eine differenzierte Einschätzung...

---

[Quelle 3: Grundlagen der Systemik.pdf, S. 8]
Ressourcenorientierung bedeutet, den Fokus auf vorhandene Stärken...

Ergebnisartefakte

Beteiligte Komponenten

KomponentePfadFunktion
build_context()pipeline/rag.pyKontext-Zusammenstellung
format_sources()pipeline/rag.pyQuellenformatierung

Prüfbedingungen für Supervision