KI-System Datenbank
MariaDB-Schema für Dokumentenverarbeitung, Semantik und Content-Erstellung.
| Datenbanken | ki_dev + ki_content |
|---|---|
| Tabellen | 58 (23 + 35) |
| Engine | InnoDB |
| Charset | utf8mb4_unicode_ci |
Datenbank-Architektur
| Datenbank | Zweck | Tabellen |
|---|---|---|
| ki_dev | Infrastruktur: Tasks, Contracts, Docs, Pipeline, Logs | 23 |
| ki_content | Content: Chat, Wissen, Entitäten, Taxonomie | 35 |
ki_dev (23 Tabellen)
Contracts (3 Tabellen)
| Tabelle | Beschreibung |
|---|---|
| contracts | Contract-Definitionen (YAML) |
| contract_history | Versions-Historie |
| contract_validations | Validierungsergebnisse |
Dokumentation (3 Tabellen)
| Tabelle | Beschreibung |
|---|---|
| dokumentation | Hierarchische Dokumentationsseiten (MCP-Docs) |
| dokumentation_chunks | Chunked Content für RAG |
| dokumentation_history | Änderungshistorie |
Tasks (4 Tabellen)
| Tabelle | Beschreibung |
|---|---|
| tasks | Task-Verwaltung |
| task_assignments | Zuweisungen (Human/AI) |
| task_comments | Kommentare zu Tasks |
| task_results | Ergebnisse |
Code-Analyse (4 Tabellen)
| Tabelle | Beschreibung |
|---|---|
| code_analysis | PHP-Klassen/Interfaces/Traits |
| code_dependencies | Abhängigkeiten zwischen Klassen |
| code_quality | Quality-Scan-Ergebnisse |
| code_scan_config | Scan-Konfiguration |
LLM & RAG (3 Tabellen)
| Tabelle | Beschreibung |
|---|---|
| prompts | Versionierte Prompts |
| llm_requests | Request-Logging mit Kosten |
| rag_collections | Collection-Metadaten (Qdrant-Sync) |
AI & Modelle (1 Tabelle)
| Tabelle | Beschreibung |
|---|---|
| ai_models | Registrierte AI-Modelle |
Logging & Audit (5 Tabellen)
| Tabelle | Beschreibung |
|---|---|
| protokoll | Claude-Protokoll |
| mcp_log | MCP-Server Logging |
| pipeline_log | Pipeline-Verarbeitungs-Log |
| audit_log | System-Audit-Trail |
| file_backup_history | Datei-Backup-Historie |
ki_content (35 Tabellen)
Chat (3 Tabellen)
| Tabelle | Beschreibung |
|---|---|
| chat_sessions | Chat-Sessions mit Settings |
| chat_messages | Nachrichten mit Chunk-Referenzen |
| search_history | Suchverlauf |
Content Studio (6 Tabellen)
| Tabelle | Beschreibung |
|---|---|
| content_config | Unified Config (Profiles, Contracts, Structures, Critics) |
| content_config_history | Config-Änderungshistorie |
| content_orders | Erstellungsaufträge |
| content_versions | Content-Versionen |
| content_critiques | Kritik-Ergebnisse |
| content_sources | RAG-Quellen pro Auftrag |
Hinweis: Kritiker-Personas werden in content_config mit type='critic' gespeichert.
Dokumente & Chunks (4 Tabellen)
| Tabelle | Beschreibung |
|---|---|
| documents | Quelldokumente aus Nextcloud |
| document_pages | Seiten pro Dokument |
| chunks | Extrahierte Text-Chunks mit Metadaten |
| generated_questions | Generierte Fragen für Chunks |
Chunk-Zuordnungen (3 Tabellen)
| Tabelle | Beschreibung |
|---|---|
| chunk_entities | Entity-Chunk-Zuordnung |
| chunk_semantics | Semantik-Chunk-Zuordnung |
| chunk_taxonomy | Taxonomie-Chunk-Zuordnung |
Entitäten (7 Tabellen)
| Tabelle | Beschreibung |
|---|---|
| entities | Extrahierte Entitäten (Personen, Konzepte, ...) |
| entity_types | Entity-Typen-Definition |
| entity_synonyms | Synonyme für Deduplizierung |
| entity_relations | Relationen zwischen Entitäten |
| entity_classifications | Entity-Ontologie-Mapping |
| entity_semantics | Semantische Annotationen |
| entity_taxonomy_mapping | Entity-Taxonomie-Zuordnung |
Dokument-Zuordnungen (2 Tabellen)
| Tabelle | Beschreibung |
|---|---|
| document_entities | Entity-Dokument-Zuordnung |
| document_taxonomy | Dokument-Taxonomie-Zuordnung |
Semantik (4 Tabellen)
| Tabelle | Beschreibung |
|---|---|
| ontology_classes | Ontologie-Klassen (hierarchisch) |
| taxonomy_terms | Taxonomie-Hierarchie |
| stopwords | Stoppwörter für NLP |
| provenance | Herkunfts-Tracking |
Pipeline (4 Tabellen)
| Tabelle | Beschreibung |
|---|---|
| pipeline_configs | Pipeline-Konfigurationen |
| pipeline_queue | Verarbeitungs-Queue |
| pipeline_runs | Pipeline-Ausführungen |
| pipeline_steps | Step-Definitionen |
Sonstige (2 Tabellen)
| Tabelle | Beschreibung |
|---|---|
| prompts | Content-spezifische Prompts |
| semantic_queue | Queue für semantische Analyse |
Datenbankzugriff
Wichtig: Verwende MCP-DB für sichere Datenbankzugriffe statt direkter SQL-Befehle.
# MCP-DB (empfohlen)
db_tables(database="ki_dev")
db_tables(database="ki_content")
db_select("SELECT * FROM documents LIMIT 5", database="ki_content")
db_describe(table="chat_sessions", database="ki_content")
# Direkter Zugriff (nur für Admin-Tasks)
mysql -u root -p ki_dev
mysql -u root -p ki_content
Siehe MCP-DB Dokumentation für Details.
Änderungshistorie
| Datum | Änderung |
|---|---|
| 2025-12-31 | Tabellenanzahl korrigiert: ki_dev 19→23, ki_content 23→35, Gesamt 42→58 |
| 2025-12-31 | critics-Tabelle entfernt (existiert nicht, Kritiker in content_config mit type='critic') |
| 2025-12-31 | Neue Tabellen dokumentiert: code_analysis, code_dependencies, code_quality, code_scan_config, ai_models, audit_log, dokumentation_chunks, pipeline_*, entity_*, document_*, stopwords, semantic_queue, provenance |
| 2025-12-29 | Row-Counts entfernt (ändern sich ständig), Tabellennamen verifiziert |
| 2025-12-21 | Korrektur: ki_system → ki_dev/ki_content, 31 → 42 Tabellen |
| 2025-12-21 | Entfernt: author_profiles, content_contracts, content_structures (ersetzt durch content_config) |
| 2025-12-21 | Hinzugefügt: rag_collections, task_comments, content_config, chunk_* Tabellen |
| 2025-12-20 | Initial erstellt |