Persistenz des Graphen (Phase 11)
Ziel
Der Graph wird als dauerhaftes, versioniertes Wissensmodell gespeichert. Er ist integraler Bestandteil der semantischen Wahrheit des Systems als Modell, wird aber aus der SQL-Quelle aufgebaut und als veröffentlichter Zustand persistiert.
Grundprinzip
- Der Graph bildet das semantische Rückgrat des Systems
- Er entsteht aus konsolidierten, validierten Daten vorheriger Phasen
- Er ist unabhängig von der konkreten Speichertechnologie
- Die SQL-Datenbank bleibt kanonisch - der Graph ist ein abgeleiteter, versionierter Veröffentlichungszustand
Inhalt des Graphen
Der Graph enthält ausschließlich persistente, geprüfte Elemente:
| Element | Beschreibung |
|---|---|
| Entitäten | Mit stabilen Entity-IDs als Knoten |
| Relationen | Typisierte Kanten zwischen Entitäten |
| Aussagen | Als eigenständige Knoten oder Kantenobjekte |
| Ontologie-Klassen | Begriffliches Weltmodell |
| Taxonomie | Hierarchische Ordnungsstruktur |
Temporäre Rohdaten sind im Graphen nicht enthalten.
Graphstruktur
- Entitäten sind Knoten
- Aussagen sind explizite semantische Beziehungseinheiten
- Relationen sind Bestandteil von Aussagen oder klar typisierte Kanten
- Ontologie und Taxonomie sind eigene Subgraphen mit stabiler Struktur
Konsistenz
Der Graph ist konsistent zu:
- Der SQL-Datenbank als Quelle der Wahrheit
- Den Versionen von Entitäten, Aussagen, Klassen und Beziehungen
Inkonsistenzen sind technisch ausgeschlossen oder explizit markiert.
Versionierung
- Änderungen erzeugen neue Versionen
- Alte Versionen bleiben referenzierbar
- Versionierung erfolgt semantisch, nicht nur technisch
Persistenzstrategie
Die Speicherung gewährleistet:
- Wiederherstellbarkeit - Graph kann aus SQL rekonstruiert werden
- Vergleichbarkeit - Versionen können verglichen werden
- Reproduzierbare Abfragen - Gleiche Abfrage, gleiches Ergebnis
Der Graph kann über mehrere physische Speicher verteilt sein, bleibt logisch konsistent.
Abgrenzung zur Vektordatenbank
| Graph | Vektordatenbank |
|---|---|
| Semantisches Wissensmodell | Ähnlichkeitsindex |
| Entitäten, Aussagen, Ontologie | Nur Embeddings + IDs |
| Enthält Bedeutung | Enthält keine Bedeutung |
| Keine Vektoren | Keine Semantik |
Implementierungsoptionen
- Graphmodell in relationalen Tabellen (aktuell: MariaDB)
- Native Graphdatenbank (Neo4j, ArangoDB, TigerGraph)
- RDF Triplestore (Blazegraph, GraphDB)
Ergebnisartefakte
- Persistenter Wissensgraph als veröffentlichter Zustand
- Versionierte Graphzustände
- Konsistentes semantisches Modell
Prüfbedingungen für Supervision
- Jedes Graph-Element ist auf eine persistente Quelle zurückführbar
- Der Graph enthält keine Rohdaten oder temporären Elemente
- Änderungen am Graphen sind versioniert und nachvollziehbar
- Ein kompletter Neuaufbau aus SQL erzeugt denselben Graphzustand