Um Ihnen die Funktionen unseres Online-Shops uneingeschränkt anbieten zu können setzen wir Cookies ein. Weitere Informationen
KI-Agenten im eigenen Rechenzentrum betreiben.
KI-Agenten on premise sind autonome KI-Systeme, die mehrstufig planen, Werkzeuge aufrufen und Aufgaben ausführen, dabei aber vollständig auf eigener Hardware laufen. Modelle, Kontext und sensible Daten bleiben im Haus. Mit NVIDIA-DGX-Systemen und dem NVIDIA Agent Toolkit bauen Sie diese Agenten DSGVO-konform und ohne Cloud-Roundtrip.

Agentische Workloads verlangen andere Hardware.
Agenten planen mehrstufig, rufen Werkzeuge auf und halten lange Kontexte. Das verschiebt die Hardware-Anforderung deutlich gegenüber klassischer KI.
Die entscheidende Frage: Wie gross ist Ihr Modell, wie viele Agenten laufen parallel, und wie sensibel sind die Daten? Die Antworten führen direkt zur passenden Plattform.
Welche NVIDIA-Plattform passt zu Ihrem Workload?
Von der Entwicklung am Arbeitsplatz bis zur AI Factory. Alle Modellgrössen sind offizielle NVIDIA-Angaben.
| Plattform | Lokale Modellgrösse | Speicher | FP4-Leistung | Typischer Einsatz | Status |
|---|---|---|---|---|---|
| NVIDIA DGX Spark | bis 200 Mrd. (Inferenz), bis 405 Mrd. gekoppelt | 128 GB unified, 273 GB/s | bis 1 PFLOP | Entwickeln, Prototyp, Edge-Agent | Verfügbar |
| NVIDIA DGX Station | bis 1 Billion Parameter | 748 GB kohärent | bis 20 PFLOPS | Produktiver Deskside-Agent | Verfügbar |
| Vera Rubin NVL72 | Trillion-Scale, MoE & Reasoning | 20,7 TB HBM4 / Rack | 3,6 EFLOPS / Rack | Skalierte Multi-Agent-Inferenz | H2 2026 |
| NVIDIA DGX SuperPOD | Trillion, Training & Inferenz | 38 TB schneller Speicher / System | bis 70× Hopper | Agenten-Flotte plus Training | Verfügbar |
Modellgrössen und Speicher sind offizielle NVIDIA-Angaben. Vergleichswerte wie 70× Hopper sind NVIDIA-Claims, keine DELTA-Messwerte. Quellen: NVIDIA Produkt- und Newsroom-Seiten.
Die NVIDIA-DGX-Systeme von DELTA.
Vier Plattformen, eine durchgaengige CUDA-Basis. Geliefert, integriert und betreut von DELTA.
Ein Pfad, vier Stufen.
Dieselbe Software-Basis (NVIDIA AI Enterprise, NIM, NVIDIA Agent Toolkit) läuft auf allen Stufen. Der Wechsel ist ein Hardware-Schritt, kein Software-Bruch.
Daten bleiben im Haus.
On premise heisst: Modelle und Agenten laufen auf Ihrer Hardware in Ihrem Rechenzentrum. Sensible Daten verlassen es nicht, es gibt keinen Transfer in eine fremde Cloud.
Wer agentische KI on-premise einsetzt.
Einige dieser Plattformen laufen heute cloud- oder hybrid. On-Premise ist der Weg, dieselben Workloads im eigenen Rechenzentrum zu betreiben.
Der NVIDIA-Software-Stack dahinter.
Das NVIDIA Agent Toolkit bündelt die Bausteine für autonome Agenten. Die Details und die Architektur erklären wir auf der Toolkit-Seite.
Beratung, Integration und Test-Centre aus einer Hand.
Häufige Fragen
Antworten für Entscheider, IT und Beschaffung rund um agentische KI on-premise.
Grundlagen & Datenschutz
Was sind KI-Agenten on premise?+
KI-Agenten on premise sind autonome KI-Systeme, die mehrstufig planen, Werkzeuge aufrufen und Aufgaben ausführen, dabei aber vollständig auf eigener Hardware im eigenen Rechenzentrum laufen. Modell, Kontext und Daten bleiben im Haus. Anders als ein Chatbot, der einzelne Anfragen beantwortet, arbeitet ein Agent eine Aufgabe über längere Zeit selbständig ab.
Lassen sich KI-Agenten DSGVO-konform betreiben?+
Ja. Im On-Premise-Betrieb verlassen sensible Daten das Rechenzentrum nicht, es gibt keinen Transfer in eine fremde Cloud und keine US-Datenübermittlung. Der OpenShell-Runtime ergänzt Policy- und Privacy-Controls und protokolliert jede Agenten-Aktion. DELTA ist nach ISO 27001 zertifiziert.
Bleiben meine Daten im eigenen Rechenzentrum?+
Ja. Inferenz und Agenten-Kontext laufen auf Ihrer eigenen NVIDIA-DGX-Compute. Es gibt keinen Cloud-Roundtrip. Sie behalten die volle Kontrolle über Modelle, Daten und Protokolle.
Hardware & Modelle
Welche Hardware brauche ich für KI-Agenten?+
Das hängt von Modellgrösse, Zahl paralleler Agenten und Datenschutz-Anforderung ab. Zum Entwickeln eine NVIDIA DGX Spark, für den produktiven Arbeitsplatz die NVIDIA DGX Station, für skalierte Inferenz Vera Rubin NVL72 und für den Produktions-Cluster der NVIDIA DGX SuperPOD. Die Workload-Matrix oben ordnet alles zu.
Wie gross darf das Modell lokal sein?+
Eine NVIDIA DGX Station trägt Inferenz bis etwa 1 Billion Parameter, ein NVIDIA DGX Spark bis rund 200 Mrd. (gekoppelt bis 405 Mrd.). Vera Rubin und DGX SuperPOD skalieren in den Trillion-Bereich. Welches Modell auf welche Plattform passt, klären wir im Sizing.
Kann ich Nemotron-Modelle on-premise selbst hosten?+
Ja. Die Nemotron-Modelle stehen unter der NVIDIA Open Model License und laufen lokal auf NVIDIA-DGX-Hardware. Details zur Modellfamilie und zum NVIDIA Agent Toolkit finden Sie auf unserer Toolkit-Seite.
DELTA & Beschaffung
Wer ist NVIDIA Elite Partner für DGX-Hardware in DACH?+
DELTA Computer Products ist NVIDIA Elite Partner und mehrfach ausgezeichneter Star Performer Central Europe, mit eigenem Test-Centre in Glinde und produktiven SuperPOD-Deployments in Europa. Beratung, Integration und Support kommen aus einer Hand.
Kann ich die Hardware vorab testen?+
Ja. Im DELTA Test-Centre in Glinde lassen sich die Systeme auf Ihren konkreten Workloads testen, bevor Sie beschaffen. NVIDIA DGX B300 ist dort live. Beratung anfragen.
Sprechen Sie mit DELTA über Ihre Agenten-Plattform.
Wir klären Use-Case, Modellgrösse und Datenschutz-Anforderungen und empfehlen die passende NVIDIA-Plattform, mit Test-Centre-Validierung vor der Beschaffung.