Dokumentation » KI-System » Datenbank

KI-System Datenbank

Erstellt: 2025-12-20 | Aktualisiert: 2025-12-31

MariaDB-Schema für Dokumentenverarbeitung, Semantik und Content-Erstellung.

Datenbankenki_dev + ki_content
Tabellen58 (23 + 35)
EngineInnoDB
Charsetutf8mb4_unicode_ci

Datenbank-Architektur

DatenbankZweckTabellen
ki_devInfrastruktur: Tasks, Contracts, Docs, Pipeline, Logs23
ki_contentContent: Chat, Wissen, Entitäten, Taxonomie35

ki_dev (23 Tabellen)

Contracts (3 Tabellen)

TabelleBeschreibung
contractsContract-Definitionen (YAML)
contract_historyVersions-Historie
contract_validationsValidierungsergebnisse

Dokumentation (3 Tabellen)

TabelleBeschreibung
dokumentationHierarchische Dokumentationsseiten (MCP-Docs)
dokumentation_chunksChunked Content für RAG
dokumentation_historyÄnderungshistorie

Tasks (4 Tabellen)

TabelleBeschreibung
tasksTask-Verwaltung
task_assignmentsZuweisungen (Human/AI)
task_commentsKommentare zu Tasks
task_resultsErgebnisse

Code-Analyse (4 Tabellen)

TabelleBeschreibung
code_analysisPHP-Klassen/Interfaces/Traits
code_dependenciesAbhängigkeiten zwischen Klassen
code_qualityQuality-Scan-Ergebnisse
code_scan_configScan-Konfiguration

LLM & RAG (3 Tabellen)

TabelleBeschreibung
promptsVersionierte Prompts
llm_requestsRequest-Logging mit Kosten
rag_collectionsCollection-Metadaten (Qdrant-Sync)

AI & Modelle (1 Tabelle)

TabelleBeschreibung
ai_modelsRegistrierte AI-Modelle

Logging & Audit (5 Tabellen)

TabelleBeschreibung
protokollClaude-Protokoll
mcp_logMCP-Server Logging
pipeline_logPipeline-Verarbeitungs-Log
audit_logSystem-Audit-Trail
file_backup_historyDatei-Backup-Historie

ki_content (35 Tabellen)

Chat (3 Tabellen)

TabelleBeschreibung
chat_sessionsChat-Sessions mit Settings
chat_messagesNachrichten mit Chunk-Referenzen
search_historySuchverlauf

Content Studio (6 Tabellen)

TabelleBeschreibung
content_configUnified Config (Profiles, Contracts, Structures, Critics)
content_config_historyConfig-Änderungshistorie
content_ordersErstellungsaufträge
content_versionsContent-Versionen
content_critiquesKritik-Ergebnisse
content_sourcesRAG-Quellen pro Auftrag

Hinweis: Kritiker-Personas werden in content_config mit type='critic' gespeichert.

Dokumente & Chunks (4 Tabellen)

TabelleBeschreibung
documentsQuelldokumente aus Nextcloud
document_pagesSeiten pro Dokument
chunksExtrahierte Text-Chunks mit Metadaten
generated_questionsGenerierte Fragen für Chunks

Chunk-Zuordnungen (3 Tabellen)

TabelleBeschreibung
chunk_entitiesEntity-Chunk-Zuordnung
chunk_semanticsSemantik-Chunk-Zuordnung
chunk_taxonomyTaxonomie-Chunk-Zuordnung

Entitäten (7 Tabellen)

TabelleBeschreibung
entitiesExtrahierte Entitäten (Personen, Konzepte, ...)
entity_typesEntity-Typen-Definition
entity_synonymsSynonyme für Deduplizierung
entity_relationsRelationen zwischen Entitäten
entity_classificationsEntity-Ontologie-Mapping
entity_semanticsSemantische Annotationen
entity_taxonomy_mappingEntity-Taxonomie-Zuordnung

Dokument-Zuordnungen (2 Tabellen)

TabelleBeschreibung
document_entitiesEntity-Dokument-Zuordnung
document_taxonomyDokument-Taxonomie-Zuordnung

Semantik (4 Tabellen)

TabelleBeschreibung
ontology_classesOntologie-Klassen (hierarchisch)
taxonomy_termsTaxonomie-Hierarchie
stopwordsStoppwörter für NLP
provenanceHerkunfts-Tracking

Pipeline (4 Tabellen)

TabelleBeschreibung
pipeline_configsPipeline-Konfigurationen
pipeline_queueVerarbeitungs-Queue
pipeline_runsPipeline-Ausführungen
pipeline_stepsStep-Definitionen

Sonstige (2 Tabellen)

TabelleBeschreibung
promptsContent-spezifische Prompts
semantic_queueQueue für semantische Analyse

Datenbankzugriff

Wichtig: Verwende MCP-DB für sichere Datenbankzugriffe statt direkter SQL-Befehle.

# MCP-DB (empfohlen)
db_tables(database="ki_dev")
db_tables(database="ki_content")
db_select("SELECT * FROM documents LIMIT 5", database="ki_content")
db_describe(table="chat_sessions", database="ki_content")

# Direkter Zugriff (nur für Admin-Tasks)
mysql -u root -p ki_dev
mysql -u root -p ki_content

Siehe MCP-DB Dokumentation für Details.

Änderungshistorie

DatumÄnderung
2025-12-31Tabellenanzahl korrigiert: ki_dev 19→23, ki_content 23→35, Gesamt 42→58
2025-12-31critics-Tabelle entfernt (existiert nicht, Kritiker in content_config mit type='critic')
2025-12-31Neue Tabellen dokumentiert: code_analysis, code_dependencies, code_quality, code_scan_config, ai_models, audit_log, dokumentation_chunks, pipeline_*, entity_*, document_*, stopwords, semantic_queue, provenance
2025-12-29Row-Counts entfernt (ändern sich ständig), Tabellennamen verifiziert
2025-12-21Korrektur: ki_system → ki_dev/ki_content, 31 → 42 Tabellen
2025-12-21Entfernt: author_profiles, content_contracts, content_structures (ersetzt durch content_config)
2025-12-21Hinzugefügt: rag_collections, task_comments, content_config, chunk_* Tabellen
2025-12-20Initial erstellt
]]>