Jan Männig
Senior Developer | Backend
12. Januar 2026
12 min
Warum KI mehr braucht als einen Cloud-Zugang
KI ist in vielen Unternehmen längst beschlossen.
Die strategische Entscheidung ist gefallen. Doch zwischen „Wir setzen auf KI“ und „KI bringt echten Mehrwert“ liegt oft eine Lücke.
Denn sobald KI Teil des Arbeitsalltags wird, geht es nicht mehr nur um Möglichkeiten, sondern um Verantwortung:
Genau hier setzt unser m:e GPT an. Als klarer, pragmatischer Weg zu einer KI, die zu uns als Digitalagentur move:elevator passt.
Warum ein eigener GPT sinnvoll ist
Unser eigener GPT hat für uns den den Blick auf KI verändert.
Sie ist kein externer Service mehr, sondern Teil unserer Organisation.
Das bedeutet:
Unser m:e GPT steht genau für diesen Perspektivwechsel:
KI nicht nur nutzen, sondern bewusst gestalten.
Ollama: Der einfachste Weg zu lokalen LLMs
Ollama ist das technische Fundament von m:e GPT.
Man kann es sich wie einen App Store für Large Language Models vorstellen – nur eben lokal.
Statt komplizierter Setups bekommst du eine schlanke Lösung, mit der sich Open-Source-Modelle schnell installieren, verwalten und nutzen lassen. Modelle wie Llama, gpt-oss, Gemma, DeepSeek oder Qwen stehen direkt zur Verfügung.
Was Ollama dabei besonders stark macht:
Kurz gesagt: Ollama räumt den Infrastrukturballast aus dem Weg und bringt dich schnell ins Arbeiten.
Installation: Unkompliziert statt Overengineering
Der Einstieg ist bewusst niedrigschwellig gehalten.
Je nach Betriebssystem lässt sich Ollama bequem installieren – auf macOS, Windows, Linux oder auch in Server-Setups. Nach der Installation reicht oft ein einzelner Befehl, um das erste Modell zu laden. Kein langes Setup, keine Konfigurationshölle. Das lokale Sprachmodell steht innerhalb kürzester Zeit bereit.
Gerade für Teams, die KI schnell testen oder intern einführen wollen, ist das ein enormer Vorteil. Der Fokus liegt nicht auf Technik um der Technik willen, sondern auf dem, was wirklich zählt: Anwendung und Mehrwert.
Modelle: Von Allrounder bis Code-Spezialist
Im Modellverzeichnis von Ollama findest du eine breite Auswahl an Modellen für unterschiedliche Aufgaben.
Dazu gehören:
- allgemeine Sprachmodelle für Text, Analyse und Zusammenfassungen, wie z.B.: Llama,gpt-oss
- spezialisierte Coding-Modelle für technische Anwendungsfälle, wie z.B.: CodeLlama, Qwen-Coder oder Codestral
- Embedding-Modelle für semantische Suche und wissensbasierte Anwendungen
Das Entscheidende:
Modelle lassen sich einfach herunterladen, auflisten und wechseln – ohne komplexe Konfiguration. So wird KI gezielt dort eingesetzt, wo sie den größten Nutzen bringt.

Ollama ohne UI nutzen: API first
Wer KI nicht nur nutzen, sondern produktiv einbauen möchte, profitiert vom API-first-Ansatz von Ollama.
Über die lokale API lässt sich die KI direkt aus eigenen Anwendungen heraus ansprechen. Für gängige Programmiersprachen stehen passende Libraries zur Verfügung, ergänzt durch Community-SDKs. Auch bestehende Frameworks lassen sich anbinden.
So wird KI Teil bestehender Systeme – nicht nur eine zusätzliche Oberfläche.
Wenn du KI aber nicht nur technisch nutzen, sondern strategisch einbinden willst, unterstützt unsere KI-Transformation dabei, KI verständlich und gewinnbringend in deine Organisation zu integrieren.
LibreChat: Die ChatGPT-Alternative zum Selbsthosten
Während Ollama das technische Fundament liefert, bringt LibreChat die passende Oberfläche mit. Die Web-UI fühlt sich vertraut an und bietet gleichzeitig volle Kontrolle über Daten, Modelle und Funktionen. LibreChat läuft self-hosted, ist frei konfigurierbar und unterstützt neben klassischen Chats auch Custom GPTs, Tools und wissensbasierte Anwendungen.
Kurz gesagt: Es fühlt sich an wie die Nutzung von ChatGPT – nur mit voller Kontrolle über Daten, Modelle und Funktionen. Es gehört also ganz euch.
Ollama & LibreChat verbinden: Custom Endpoints
Damit Ollama-Modelle direkt in LibreChat genutzt werden können, werden sogenannte Custom Endpoints eingerichtet. Mit überschaubaren Anpassungen in der Konfiguration lassen sich die lokalen Modelle anbinden und stehen anschließend direkt in der Oberfläche zur Auswahl.
Der technische Aufwand ist gering – der Zugewinn an Flexibilität dafür umso größer.
Custom GPTs: Eigene Agenten statt Einheits-KI
Ein echtes Highlight von LibreChat sind individuelle Agenten. Statt einer allgemeinen KI entstehen spezialisierte GPT-Instanzen mit klarer Aufgabe.
Diese Agenten arbeiten mit festen Service-Prompts, können zusätzliche Tools und Workflows integrieren und greifen bei Bedarf auf eigene Wissensquellen zu. Jedes Setup lässt sich individuell konfigurieren – vom Modell bis zur Arbeitsweise.
So entstehen spezialisierte KI-Helfer für Content-Erstellung, Analyse, Dokumentation oder interne Prozesse.
Open Web UI: Die einfache Alternative
Du willst schneller starten und weniger konfigurieren?
Dann kann eine reduzierte Oberfläche wie Open Web UI sinnvoll sein.
Weniger Tiefe, weniger Struktur – aber perfekt für einfache Setups oder erste Tests.
Und vLLM? Die Profi-Variante für Produktion
Für produktive, skalierte Umgebungen lohnt sich ein Blick auf vLLM. Der Fokus liegt hier auf hoher Performance, geringeren Latenzen und GPU-optimierten Setups.
Während Ollama auf Einfachheit und lokale Nutzung abzielt, ist vLLM die richtige Wahl für anspruchsvolle Produktionsszenarien. Beide Ansätze bedienen unterschiedliche Anforderungen und Reifegrade.
Fazit: Eigener GPT, eigene Regeln
Mit Ollama und LibreChat wird klar:
Man braucht kein Cloud-Abo, um leistungsfähige KI sinnvoll einzusetzen. Ob lokales Experiment, internes Tool oder datensensibler Anwendungsfall – der Stack bietet volle Kontrolle über Daten, flexible Modellwahl und echte Custom GPTs. Vor allem aber eröffnet er einen realistischen Weg in Richtung produktiver KI-Nutzung.
Oder anders gesagt:
Euer GPT. Eure Daten. Eure Spielregeln.



