Dokumentation » API » Explorer API

Explorer API

Erstellt: 2025-12-20 | Aktualisiert: 2025-12-31

REST-API für den Doc2Vector Explorer mit Dokumenten, Seiten, Chunks, Entitäten, Taxonomie und Suche.

ControllerController\Api\ExplorerController
Base-URL/api/v1/explorer
Datenbankki_content (documents, chunks, entities, ...)

Endpoints-Übersicht

MethodePfadBeschreibung
GET/api/v1/explorer/statsStatistiken
GET/api/v1/explorer/dokumenteAlle Dokumente
GET/api/v1/explorer/dokumente/{id}Dokument-Details
GET/api/v1/explorer/seitenAlle Seiten
GET/api/v1/explorer/seiten/{id}Seiten-Details
GET/api/v1/explorer/chunksAlle Chunks
GET/api/v1/explorer/chunks/{id}Chunk-Details
GET/api/v1/explorer/taxonomieTaxonomie-Kategorien
GET/api/v1/explorer/entitiesEntitäten gruppiert
POST/api/v1/explorer/sucheHybrid-Suche

Statistiken

GET /api/v1/explorer/stats

Liefert Übersicht über alle Daten:

{
  "success": true,
  "data": {
    "dokumente": 15,
    "seiten": 120,
    "chunks": {
      "total": 450,
      "tokens": 125000,
      "analyzed": 400,
      "synced": 380
    },
    "taxonomy_categories": [...]
  }
}

Dokumente

Liste aller Dokumente

GET /api/v1/explorer/dokumente

Liefert alle Quelldokumente mit Statistiken.

Dokument-Details

GET /api/v1/explorer/dokumente/{id}

Liefert Dokument mit zugehörigen Seiten und Taxonomie.

Seiten

Seiten auflisten

GET /api/v1/explorer/seiten?search=&parent_id=&limit=50&offset=0
ParameterTypBeschreibung
searchstringSuche in Inhalt
parent_idintFilter nach Parent-Dokument
limitintMax. Ergebnisse (max 50)
offsetintPagination-Offset

Seiten-Details

GET /api/v1/explorer/seiten/{id}

Liefert Seite mit Chunks und Unterseiten.

Chunks

Chunks auflisten

GET /api/v1/explorer/chunks?category=&status=&search=&limit=50&offset=0
ParameterTypBeschreibung
categorystringTaxonomie-Kategorie
statusstringChunk-Status
searchstringSuche in Content
limitintMax. Ergebnisse (max 50)
offsetintPagination-Offset

Chunk-Details

GET /api/v1/explorer/chunks/{id}

Liefert Chunk mit allen Metadaten:

{
  "success": true,
  "data": {
    "id": 42,
    "chunk_index": 3,
    "content": "...",
    "token_count": 280,
    "entities": [
      {"name": "Carl Rogers", "type": "PERSON"}
    ],
    "keywords": ["Therapie", "Empathie"],
    "qdrant_id": "abc123..."
  }
}

Taxonomie

GET /api/v1/explorer/taxonomie

Liefert Top-Kategorien und Keywords:

{
  "success": true,
  "data": {
    "categories": [...],
    "top_keywords": [...]
  }
}

Entitäten

GET /api/v1/explorer/entities

Liefert Entitäten gruppiert nach Typ.

Hybrid-Suche

POST /api/v1/explorer/suche
Content-Type: application/json

{
  "query": "Systemische Therapie",
  "category": "Psychotherapie",
  "limit": 10
}

Kombiniert Vektor- und Keyword-Suche:

{
  "success": true,
  "data": {
    "query": "Systemische Therapie",
    "results": [...],
    "suggestions": [...],
    "count": 8
  }
}

Response-Format

{
  "success": true,
  "data": { ... },
  "meta": {
    "total": 450,
    "limit": 50,
    "offset": 0
  }
}

Datenmodell

documents (ki_content)

FeldTypBeschreibung
idintPrimärschlüssel
filenamevarcharDateiname
titlevarcharTitel
sourcevarcharQuelle (Nextcloud-Pfad)
page_countintSeitenanzahl
statusenumpending, processing, completed, error

chunks (ki_content)

FeldTypBeschreibung
idintPrimärschlüssel
document_idintFK zu documents
chunk_indexintPosition in Dokument
contenttextChunk-Inhalt
token_countintToken-Anzahl
embedding_modelvarcharVerwendetes Modell
qdrant_idvarcharQdrant-Vektor-ID

entities (ki_content)

FeldTypBeschreibung
idintPrimärschlüssel
namevarcharEntity-Name
canonical_namevarcharNormalisierter Name
typeenumPERSON, CONCEPT, ORGANIZATION, ...

Verwandte Dokumentation

]]>