Chunk #395

Aus: Pipeline (Index: 0)

72 Tokens
Synced Status
Nächster (#1) »

Taxonomie

Kategorie Pipeline
Pfad Pipeline > Document Pipeline > Pipeline-Schritte
Heading-Pfad Pipeline > Document Pipeline > Pipeline-Schritte

Entities

Name Typ
DETECT COMMAND
EXTRACT TECHNOLOGY
CHUNK CONCEPT
ENRICH SERVICE
STORE SERVICE
EMBED TECHNOLOGY
INDEX SERVICE
ANALYZE CONCEPT

Keywords

Pipeline Schritte OCR Vision Vektoren Qdrant

Inhalt

1. DETECT    → Neue/geänderte Dateien erkennen
2. EXTRACT   → Text extrahieren (OCR, Vision)
3. CHUNK     → Semantisches Chunking
4. ENRICH    → Metadaten anreichern
5. STORE     → In MariaDB speichern
6. EMBED     → Vektoren erzeugen
7. INDEX     → In Qdrant speichern
8. ANALYZE   → Semantische Analyse

Clean Content

```
`1. DETECT → Neue/geänderte Dateien erkennen
2. EXTRACT → Text extrahieren (OCR, Vision)
3. CHUNK → Semantisches Chunking
4. ENRICH → Metadaten anreichern
5. STORE → In MariaDB speichern
6. EMBED → Vektoren erzeugen
7. INDEX → In Qdrant speichern
8. ANALYZE → Semantische Analyse`
```

Metadaten

Analysiert am20.12.2025 12:36:12
Analyse-Modellgemma3:4b-it-qat
Embedding-Modellmxbai-embed-large
Qdrant-IDfe57c276-a11b-413d-b092-b28c67061e87
Erstellt20.12.2025 12:34:42
Aktualisiert20.12.2025 12:53:35