Explorer API

REST-API für Doc2Vector Pipeline mit Dokumenten, Seiten, Chunks, Taxonomie und Suche.

ControllerController\Api\ExplorerController
Base-URL/api/v1/explorer
Datenbankki_system.dokumentation, dokumentation_chunks

Statistiken

GET /api/v1/explorer/stats

Liefert Übersicht über alle Daten:

{
  "dokumente": 15,
  "seiten": 73,
  "chunks": {
    "total": 450,
    "tokens": 125000,
    "analyzed": 440,
    "synced": 435
  },
  "taxonomy_categories": [
    {"taxonomy_category": "Betriebsdokumentation", "count": 120},
    {"taxonomy_category": "API-Referenz", "count": 85}
  ]
}

Dokumente

Liste aller Dokumente

GET /api/v1/explorer/dokumente

Liefert alle Root-Dokumente (depth=0) mit Statistiken.

Dokument-Details

GET /api/v1/explorer/dokumente/{id}

Liefert Dokument mit Seiten und Taxonomie.

Seiten

Seiten auflisten

GET /api/v1/explorer/seiten?search=apache&parent_id=5&limit=50&offset=0
ParameterTypBeschreibung
searchstringSuche in Titel und Pfad
parent_idintFilter nach Parent-Dokument
limitintMax. Ergebnisse (max 100)
offsetintPagination-Offset

Seiten-Details

GET /api/v1/explorer/seiten/{id}

Liefert Seite mit Chunks und Unterseiten.

Chunks

Chunks auflisten

GET /api/v1/explorer/chunks?category=Betriebsdokumentation&status=completed&limit=50
ParameterTypBeschreibung
categorystringTaxonomie-Kategorie
statusstringpending, completed, error
searchstringSuche in Content und Keywords
limitintMax. Ergebnisse (max 100)
offsetintPagination-Offset

Chunk-Details

GET /api/v1/explorer/chunks/{id}

Liefert Chunk mit allen Metadaten:

{
  "id": 42,
  "chunk_index": 3,
  "content": "...",
  "token_count": 280,
  "taxonomy_category": "Betriebsdokumentation",
  "taxonomy_path": ["Server", "Apache", "Konfiguration"],
  "entities": [
    {"name": "Apache", "type": "SOFTWARE"},
    {"name": "mod_rewrite", "type": "COMPONENT"}
  ],
  "keywords": ["vhost", "ssl", "proxy"],
  "analysis_status": "completed",
  "qdrant_id": "abc123..."
}

Taxonomie

GET /api/v1/explorer/taxonomie

Liefert Kategorien mit Counts und Top-Keywords:

{
  "categories": [
    {"taxonomy_category": "Betriebsdokumentation", "chunk_count": 120, "token_count": 35000}
  ],
  "top_keywords": {
    "apache": 45,
    "php": 38,
    "mariadb": 25
  }
}

Entities

GET /api/v1/explorer/entities

Aggregierte Entities aus allen Chunks, gruppiert nach Typ:

{
  "entities": [
    {"name": "Apache", "type": "SOFTWARE", "count": 45},
    {"name": "MariaDB", "type": "SOFTWARE", "count": 38}
  ],
  "by_type": {
    "SOFTWARE": [...],
    "COMPONENT": [...],
    "PERSON": [...]
  },
  "total": 250
}

Hybrid-Suche

POST /api/v1/explorer/suche
Content-Type: application/json

{
  "query": "Apache SSL Konfiguration",
  "category": "Betriebsdokumentation",
  "limit": 10
}

Kombiniert Vektor- und Keyword-Suche:

{
  "query": "Apache SSL Konfiguration",
  "results": [
    {
      "chunk_id": 42,
      "content": "...",
      "score": 0.92,
      "dokument_title": "Apache",
      "taxonomy_category": "Betriebsdokumentation"
    }
  ],
  "suggestions": ["mod_ssl", "Let's Encrypt", "HTTPS"],
  "count": 8
}

Response-Format

{
  "success": true,
  "data": { ... },
  "meta": {
    "total": 450,
    "limit": 50,
    "offset": 0
  }
}

Datenmodell

dokumentation

FeldTypBeschreibung
idintPrimärschlüssel
parent_idintParent-Dokument
titlevarcharTitel
pathvarcharURL-Pfad
depthintHierarchie-Tiefe (0=Root)

dokumentation_chunks

FeldTypBeschreibung
idintPrimärschlüssel
dokumentation_idintFK zu dokumentation
chunk_indexintPosition in Dokument
contenttextChunk-Inhalt
token_countintToken-Anzahl
taxonomy_categoryvarcharKategorie
taxonomy_pathjsonPfad im Taxonomie-Baum
entitiesjsonExtrahierte Entities
keywordsjsonKeywords
analysis_statusenumpending, completed, error
qdrant_idvarcharQdrant-Vektor-ID

Verwandte Dokumentation