{
"event": "PreToolUse",
"tool_name": "mcp__mcp-docs__docs_create",
"tool_input": {
"title": "Normalisierung und Konsolidierung",
"slug": "normalisierung",
"parent_id": 100,
"description": "Phase 6: Rohdaten zu konsistentem, referenzierbarem Wissensbestand konsolidieren",
"status": "published",
"sort_order": 12,
"content": "<h2>Normalisierung und Konsolidierung (Phase 6)<\/h2>\n\n<h3>Ziel<\/h3>\n<p>Aus temporären Rohdaten entsteht ein konsistenter, referenzierbarer Wissensbestand. Diese Phase überführt extrahierte Signale in stabile Entitäten und Relationen. <strong>Ab hier beginnt semantische Verlässlichkeit.<\/strong><\/p>\n\n<h3>Eingangsbasis<\/h3>\n<ul>\n <li>Grundlage sind ausschließlich die Rohdaten aus Phase 5<\/li>\n <li>Rohdaten behalten ihren Bezug zu Chunk, Abschnitt und Dokument<\/li>\n <li>Keine neuen semantischen Elemente werden hinzugefügt<\/li>\n<\/ul>\n\n<h3>Normalisierung von Entitäten<\/h3>\n<p>Entitäten werden sprachlich und formal normalisiert:<\/p>\n<table>\n <thead><tr><th>Normalisierung<\/th><th>Beispiel<\/th><\/tr><\/thead>\n <tbody>\n <tr><td>Schreibweisen<\/td><td>\"SystemCoaching\" → \"System-Coaching\"<\/td><\/tr>\n <tr><td>Abkürzungen<\/td><td>\"NLP\" → \"Neuro-Linguistisches Programmieren\"<\/td><\/tr>\n <tr><td>Synonyme<\/td><td>\"Klient\", \"Coachee\" → kanonische Form<\/td><\/tr>\n <tr><td>Singular\/Plural<\/td><td>\"Coaches\" → \"Coach\"<\/td><\/tr>\n <\/tbody>\n<\/table>\n<p><strong>Normalisierung verändert die Darstellung, nicht die Bedeutung.<\/strong><\/p>\n\n<h3>Koreferenzauflösung<\/h3>\n<ul>\n <li>Es wird geprüft, ob verschiedene Roh-Entitäten dieselbe reale Entität bezeichnen<\/li>\n <li>Kriterien für Gleichheit sind dokumentiert und reproduzierbar<\/li>\n <li>Gleiche Entitäten werden zu einer <strong>kanonischen Entität<\/strong> zusammengeführt<\/li>\n <li>Unterschiedliche Entitäten bleiben getrennt, auch wenn sie ähnlich sind<\/li>\n<\/ul>\n\n<h3>Vergabe stabiler Identitäten<\/h3>\n<table>\n <thead><tr><th>Eigenschaft<\/th><th>Beschreibung<\/th><\/tr><\/thead>\n <tbody>\n <tr><td>Entity-ID<\/td><td>Systemweit eindeutig<\/td><\/tr>\n <tr><td>Stabilität<\/td><td>Unabhängig von Textvarianten oder Fundstellen<\/td><\/tr>\n <tr><td>Wiederverwendung<\/td><td>Einmal vergeben, nie wiederverwendet<\/td><\/tr>\n <\/tbody>\n<\/table>\n\n<h3>Konsolidierung von Relationen<\/h3>\n<ul>\n <li>Roh-Relationen werden geprüft und vereinheitlicht<\/li>\n <li>Relationstypen werden auf einen kontrollierten Satz abgebildet<\/li>\n <li>Unzulässige oder unklare Relationen werden verworfen oder markiert<\/li>\n <li>Relationen referenzieren ausschließlich stabile Entity-IDs<\/li>\n<\/ul>\n\n<h3>Dublettenerkennung und Bereinigung<\/h3>\n<ul>\n <li>Doppelte Entitäten und Relationen werden identifiziert<\/li>\n <li>Dubletten werden zusammengeführt oder entfernt<\/li>\n <li>Der Vorgang ist nachvollziehbar und reversibel<\/li>\n<\/ul>\n\n<h3>Persistenz<\/h3>\n<ul>\n <li>Erst nach Abschluss aller Prüfungen erfolgt Persistenz<\/li>\n <li>Persistiert werden: konsolidierte Entitäten und validierte Relationen<\/li>\n <li>Persistenz erfolgt in der <strong>SQL-Datenbank als kanonischer Quelle<\/strong><\/li>\n<\/ul>\n\n<h3>Abgrenzung zur Ontologie<\/h3>\n<ul>\n <li>In dieser Phase erfolgt <strong>keine Klassenzuordnung<\/strong><\/li>\n <li>Ontologische Einordnung ist Gegenstand von Phase 8<\/li>\n<\/ul>\n\n<h3>Ergebnisartefakte<\/h3>\n<ul>\n <li>Stabile Entitäten mit Entity-ID<\/li>\n <li>Konsolidierte Relationen<\/li>\n <li>Bereinigter Wissensrohbestand<\/li>\n<\/ul>\n\n<h3>Prüfbedingungen für Supervision<\/h3>\n<ul>\n <li>Jede persistierte Entität besitzt genau eine stabile Entity-ID<\/li>\n <li>Keine persistierte Relation referenziert Roh-Entitäten<\/li>\n <li>Alle Zusammenführungen sind nachvollziehbar dokumentiert<\/li>\n<\/ul>"
}
}
{
"tool_response": [
{
"type": "text",
"text": "{\n \"success\": true,\n \"doc\": {\n \"id\": 122,\n \"parent_id\": 100,\n \"slug\": \"normalisierung\",\n \"path\": \"\/prozesse\/rag-prozess\/normalisierung\",\n \"title\": \"Normalisierung und Konsolidierung\",\n \"description\": \"Phase 6: Rohdaten zu konsistentem, referenzierbarem Wissensbestand konsolidieren\",\n \"content\": \"<h2>Normalisierung und Konsolidierung (Phase 6)<\/h2>\\n\\n<h3>Ziel<\/h3>\\n<p>Aus temporären Rohdaten entsteht ein konsistenter, referenzierbarer Wissensbestand. Diese Phase überführt extrahierte Signale in stabile Entitäten und Relationen. <strong>Ab hier beginnt semantische Verlässlichkeit.<\/strong><\/p>\\n\\n<h3>Eingangsbasis<\/h3>\\n<ul>\\n <li>Grundlage sind ausschließlich die Rohdaten aus Phase 5<\/li>\\n <li>Rohdaten behalten ihren Bezug zu Chunk, Abschnitt und Dokument<\/li>\\n <li>Keine neuen semantischen Elemente werden hinzugefügt<\/li>\\n<\/ul>\\n\\n<h3>Normalisierung von Entitäten<\/h3>\\n<p>Entitäten werden sprachlich und formal normalisiert:<\/p>\\n<table>\\n <thead><tr><th>Normalisierung<\/th><th>Beispiel<\/th><\/tr><\/thead>\\n <tbody>\\n <tr><td>Schreibweisen<\/td><td>\\\"SystemCoaching\\\" → \\\"System-Coaching\\\"<\/td><\/tr>\\n <tr><td>Abkürzungen<\/td><td>\\\"NLP\\\" → \\\"Neuro-Linguistisches Programmieren\\\"<\/td><\/tr>\\n <tr><td>Synonyme<\/td><td>\\\"Klient\\\", \\\"Coachee\\\" → kanonische Form<\/td><\/tr>\\n <tr><td>Singular\/Plural<\/td><td>\\\"Coaches\\\" → \\\"Coach\\\"<\/td><\/tr>\\n <\/tbody>\\n<\/table>\\n<p><strong>Normalisierung verändert die Darstellung, nicht die Bedeutung.<\/strong><\/p>\\n\\n<h3>Koreferenzauflösung<\/h3>\\n<ul>\\n <li>Es wird geprüft, ob verschiedene Roh-Entitäten dieselbe reale Entität bezeichnen<\/li>\\n <li>Kriterien für Gleichheit sind dokumentiert und reproduzierbar<\/li>\\n <li>Gleiche Entitäten werden zu einer <strong>kanonischen Entität<\/strong> zusammengeführt<\/li>\\n <li>Unterschiedliche Entitäten bleiben getrennt, auch wenn sie ähnlich sind<\/li>\\n<\/ul>\\n\\n<h3>Vergabe stabiler Identitäten<\/h3>\\n<table>\\n <thead><tr><th>Eigenschaft<\/th><th>Beschreibung<\/th><\/tr><\/thead>\\n <tbody>\\n <tr><td>Entity-ID<\/td><td>Systemweit eindeutig<\/td><\/tr>\\n <tr><td>Stabilität<\/td><td>Unabhängig von Textvarianten oder Fundstellen<\/td><\/tr>\\n <tr><td>Wiederverwendung<\/td><td>Einmal vergeben, nie wiederverwendet<\/td><\/tr>\\n <\/tbody>\\n<\/table>\\n\\n<h3>Konsolidierung von Relationen<\/h3>\\n<ul>\\n <li>Roh-Relationen werden geprüft und vereinheitlicht<\/li>\\n <li>Relationstypen werden auf einen kontrollierten Satz abgebildet<\/li>\\n <li>Unzulässige oder unklare Relationen werden verworfen oder markiert<\/li>\\n <li>Relationen referenzieren ausschließlich stabile Entity-IDs<\/li>\\n<\/ul>\\n\\n<h3>Dublettenerkennung und Bereinigung<\/h3>\\n<ul>\\n <li>Doppelte Entitäten und Relationen werden identifiziert<\/li>\\n <li>Dubletten werden zusammengeführt oder entfernt<\/li>\\n <li>Der Vorgang ist nachvollziehbar und reversibel<\/li>\\n<\/ul>\\n\\n<h3>Persistenz<\/h3>\\n<ul>\\n <li>Erst nach Abschluss aller Prüfungen erfolgt Persistenz<\/li>\\n <li>Persistiert werden: konsolidierte Entitäten und validierte Relationen<\/li>\\n <li>Persistenz erfolgt in der <strong>SQL-Datenbank als kanonischer Quelle<\/strong><\/li>\\n<\/ul>\\n\\n<h3>Abgrenzung zur Ontologie<\/h3>\\n<ul>\\n <li>In dieser Phase erfolgt <strong>keine Klassenzuordnung<\/strong><\/li>\\n <li>Ontologische Einordnung ist Gegenstand von Phase 8<\/li>\\n<\/ul>\\n\\n<h3>Ergebnisartefakte<\/h3>\\n<ul>\\n <li>Stabile Entitäten mit Entity-ID<\/li>\\n <li>Konsolidierte Relationen<\/li>\\n <li>Bereinigter Wissensrohbestand<\/li>\\n<\/ul>\\n\\n<h3>Prüfbedingungen für Supervision<\/h3>\\n<ul>\\n <li>Jede persistierte Entität besitzt genau eine stabile Entity-ID<\/li>\\n <li>Keine persistierte Relation referenziert Roh-Entitäten<\/li>\\n <li>Alle Zusammenführungen sind nachvollziehbar dokumentiert<\/li>\\n<\/ul>\",\n \"status\": \"published\",\n \"sort_order\": 12,\n \"depth\": 2,\n \"created_at\": \"2025-12-24T10:14:32\",\n \"updated_at\": \"2025-12-24T10:14:32\"\n },\n \"message\": \"Dokument 'Normalisierung und Konsolidierung' erstellt mit ID 122\"\n}"
}
]
}