Ollama

Erstellt: 2025-12-20 | Aktualisiert: 2025-12-20

Lokale LLM-Runtime für KI-Modelle. Nutzt die NVIDIA GPU für schnelle Inferenz ohne Cloud-Abhängigkeit. Ermöglicht datenschutzkonforme KI-Nutzung.

Version	0.13.5
Port	11434
Modelle	/usr/share/ollama/.ollama/models

Installierte Modelle

ollama pull mxbai-embed-large
ollama pull mistral
ollama pull llama3.2
ollama list

ollama run llama3.2

curl http://localhost:11434/api/generate -d '{
  "model": "llama3.2",
  "prompt": "Hallo!"
}'

curl http://localhost:11434/api/embeddings -d '{
  "model": "mxbai-embed-large",
  "prompt": "Text zum Embedden"
}'

systemctl status ollama
ollama --version
ollama list