KI-System
Integriertes System zur Dokumentenverarbeitung, semantischen Analyse und Content-Erstellung mit RAG-Chat.
| Status | In Entwicklung |
|---|---|
| Backend | Python 3.13 |
| Frontend | PHP 8.4 + HTMX |
| LLM | Claude Opus 4.5 + Ollama |
| Datenbanken | ki_dev (Infrastructure), ki_content (User-facing) |
| Embedding | mxbai-embed-large (1024 dim) |
Infrastruktur
- Ollama - LLM Runtime
- Qdrant - Vektor-Datenbank
- NVIDIA CUDA - RTX 4000 SFF Ada
- Datenbank - MariaDB Schema
- Embedding - mxbai-embed-large
Pipeline
- Document Pipeline - Nextcloud → MariaDB → Qdrant
- Protokoll - Claude Request Logging
Semantik
Anwendungen
- RAG-Chat - Semantische Suche + LLM
- Content-Studio - Autorenprofile, Contracts, Kritiker
Datenbank-Struktur
| Datenbank | Zweck | Tabellen |
|---|---|---|
| ki_dev | Development/Infrastructure | protokoll, tasks, contracts, dokumentation, prompts, mcp_log |
| ki_content | Content/User-facing | chat_sessions, chat_messages, content, personas, knowledge_graph |
Datenfluss
Nextcloud (lokal)
↓
Pipeline (Python)
├── Text-Extraktion (OCR, Vision)
├── Semantisches Chunking
└── Metadaten-Anreicherung
↓
MariaDB (ki_dev + ki_content)
├── Dokumente, Chunks
├── Entitäten, Relationen
└── Taxonomie, Ontologie
↓
Qdrant (Embeddings, 1024 dim)
↓
Web-UI (Chat, Content-Studio)
Unterseiten
- Navigation - Dropdown-Navigation mit Mobile-Support für die Campus-Anwendung.
- Ollama - Lokale LLM-Runtime für KI-Modelle. Nutzt die NVIDIA GPU für schnelle Inferenz ohne Cloud-Abhängigkeit. Ermöglicht datenschutzkonforme KI-Nutzung.
- Qdrant - Speichert Embeddings für semantische Suche und RAG (Retrieval Augmented Generation). Ermöglicht KI-gestützte Ähnlichkeitssuche in Dokumenten.
- NVIDIA CUDA - GPU-Treiber und CUDA-Toolkit für Hardware-beschleunigte KI-Berechnungen. Die RTX 4000 mit 20GB VRAM ermöglicht lokales LLM-Hosting ohne Cloud.
- Pipeline - Automatischer Import und Verarbeitung von Dokumenten aus Nextcloud.
- Embedding - Vektorerzeugung für semantische Suche und RAG.
- Entitäten - Automatische Extraktion und Verwaltung von Entitäten aus Dokumenten.
- Taxonomie - Automatische hierarchische Klassifikation von Dokumenten.
- Ontologie - Formale Wissensstruktur mit Klassen, Eigenschaften und Relationen.
- Chat - Retrieval-Augmented Generation Chat mit semantischer Suche.
- Content - Strukturierte Content-Erstellung mit Autorenprofilen, Contracts und Kritikersystem.
- Datenbank - MariaDB-Schema für Dokumentenverarbeitung, Semantik und Content-Erstellung.
- Protokoll - Automatisches Logging-System für Claude Code Sessions. Erfasst alle Requests, Responses und Tool-Aufrufe in einer MariaDB-Datenbank via Hook-System.