Anfrage-Verarbeitung (Phase A0-A1)
Grundsatz
Der Abfrageprozess ist kein Spiegel der Importpipeline. Er ist ein konsumierender Prozess, der ausschließlich auf bereits validierten, versionierten Zuständen arbeitet.
- Die Abfrage erzeugt kein Wissen
- Sie kombiniert, filtert und formuliert vorhandene Information
- Der Graph wird nicht verändert
- Die SQL-Datenbank bleibt kanonisch
- Die Vektordatenbank wird nur zur Vorselektion genutzt
Phase A0: Anfrage-Eingang und Kontextdefinition
Ziel
Eindeutige Definition dessen, was gefragt wird und in welchem Rahmen.
Ablauf
- Eine Anfrage wird vom Nutzer über eine Anwendung initiiert:
- KI-Chat
- Content Studio
- Die Anfrage besteht aus:
- Primärfrage oder Briefing
- Anwendungs-Kontext
- optionalen Parametern
- Kontextparameter sind explizit:
- Ziel-Collection(s)
- gewünschte Kontext-Tiefe (top_k)
- Modellwahl
- Token-Limits
- Die Anfrage wird als Abfrageobjekt behandelt, nicht als Textfragment
Ergebnisartefakte
- Anfrage-ID
- Roh-Anfragetext
- Abfragekonfiguration
Phase A1: Anfrage-Einbettung
Ziel
Überführung der Anfrage in einen Suchvektor für Ähnlichkeitsretrieval.
Ablauf
- Der Anfragetext wird technisch normalisiert
- Die Anfrage wird mit demselben Embedding-Modell eingebettet wie die Chunks
- Es entsteht genau ein Query-Vektor
Abgrenzung
- Keine semantische Analyse
- Keine Interpretation
- Keine Graph-Abfrage
Ergebnisartefakte
- Query-Vektor (1536 Dimensionen)
- Referenz auf verwendetes Embedding-Modell
Beteiligte Komponenten
| Komponente | Pfad | Funktion |
|---|---|---|
| ChatController | src/Controller/ChatController.php | Anfrage-Entgegennahme |
| ContentController | src/Controller/ContentController.php | Briefing-Verarbeitung |
| get_embedding() | pipeline/embed.py | Query-Embedding |
Prüfbedingungen für Supervision
- Die Anfrage ist vollständig parametriert, bevor irgendein Retrieval beginnt
- Modellidentität zwischen Indexierung und Anfrage ist geprüft
- Query-Vektor verwendet exakt dasselbe Modell wie Chunk-Vektoren