Protokoll #19552

ID19552
Zeitstempel2025-12-27 00:46:02.642957
Clientroot
IP145.224.72.140
Modellclaude-sonnet-4-20250514
Statuscompleted
Tokens154 (Input: 18, Output: 136)
Dauer19810 ms
Request-Zeit2025-12-27 00:46:02.642957
Response-Zeit2025-12-27 00:46:22.452855

Request

{
    "event": "UserPromptSubmit",
    "prompt": "läuft ollama auf der gpu? prüfe"
}

Response

{
    "assistant_response": "**Ja, Ollama läuft auf der GPU.**\n\n| Metrik | Wert |\n|--------|------|\n| GPU | NVIDIA RTX 4000 SFF Ada |\n| VRAM gesamt | 20.475 MB |\n| VRAM belegt | 4.950 MB (24%) |\n| Ollama Prozess | PID 1051299 - 4.942 MB GPU Memory |\n| GPU-Util | 0% (idle, kein aktiver Inference) |\n| Temperatur | 65°C |\n\nDer Ollama-Prozess ist unter den GPU-Prozessen gelistet und nutzt ~5 GB VRAM. Das entspricht einem geladenen Modell (wahrscheinlich `gemma3:27b-it-qat` im QAT-Format, das komprimiert ist).\n\nBei einer Inference-Anfrage würde GPU-Util auf 80-100% steigen."
}
← Vorheriger Zur Liste Nächster →