On-Premise KI-Agenten · NVIDIA Elite Partner

KI-Agenten im eigenen Rechenzentrum betreiben.

KI-Agenten on premise sind autonome KI-Systeme, die mehrstufig planen, Werkzeuge aufrufen und Aufgaben ausführen, dabei aber vollständig auf eigener Hardware laufen. Modelle, Kontext und sensible Daten bleiben im Haus. Mit NVIDIA-DGX-Systemen und dem NVIDIA Agent Toolkit bauen Sie diese Agenten DSGVO-konform und ohne Cloud-Roundtrip.

NVIDIA Nemotron und agentische KI
Warum eigene Hardware

Agentische Workloads verlangen andere Hardware.

Agenten planen mehrstufig, rufen Werkzeuge auf und halten lange Kontexte. Das verschiebt die Hardware-Anforderung deutlich gegenüber klassischer KI.

bis 15×
mehr Tokens pro Aufgabe als klassische KI
NVIDIA, Vera Rubin NVL72
kohärent
grosser Speicher hält Modell, KV-Cache und viele Agenten-Kontexte lokal
NVIDIA DGX
NVLink
und Unified Memory ersetzen Netzwerk-Hops und senken die Latenz
NVIDIA
always-on
On-Premise-Betrieb ohne Cloud-Roundtrip
DELTA

Die entscheidende Frage: Wie gross ist Ihr Modell, wie viele Agenten laufen parallel, und wie sensibel sind die Daten? Die Antworten führen direkt zur passenden Plattform.

 
Hardware-Matching

Welche NVIDIA-Plattform passt zu Ihrem Workload?

Von der Entwicklung am Arbeitsplatz bis zur AI Factory. Alle Modellgrössen sind offizielle NVIDIA-Angaben.

PlattformLokale ModellgrösseSpeicherFP4-LeistungTypischer EinsatzStatus
NVIDIA DGX Sparkbis 200 Mrd. (Inferenz), bis 405 Mrd. gekoppelt128 GB unified, 273 GB/sbis 1 PFLOPEntwickeln, Prototyp, Edge-AgentVerfügbar
NVIDIA DGX Stationbis 1 Billion Parameter748 GB kohärentbis 20 PFLOPSProduktiver Deskside-AgentVerfügbar
Vera Rubin NVL72Trillion-Scale, MoE & Reasoning20,7 TB HBM4 / Rack3,6 EFLOPS / RackSkalierte Multi-Agent-InferenzH2 2026
NVIDIA DGX SuperPODTrillion, Training & Inferenz38 TB schneller Speicher / Systembis 70× HopperAgenten-Flotte plus TrainingVerfügbar

Modellgrössen und Speicher sind offizielle NVIDIA-Angaben. Vergleichswerte wie 70× Hopper sind NVIDIA-Claims, keine DELTA-Messwerte. Quellen: NVIDIA Produkt- und Newsroom-Seiten.

Skalierungspfad

Ein Pfad, vier Stufen.

Dieselbe Software-Basis (NVIDIA AI Enterprise, NIM, NVIDIA Agent Toolkit) läuft auf allen Stufen. Der Wechsel ist ein Hardware-Schritt, kein Software-Bruch.

1
DGX Spark
Agent entwickeln und lokal testen, ohne Daten aus dem Haus zu geben.
2
DGX Station
Agent produktiv am Arbeitsplatz oder in der Abteilung betreiben.
3
Vera Rubin NVL72
Inferenz für viele Agenten gleichzeitig skalieren.
4
DGX SuperPOD
Agenten-Flotte betreiben und Modelle parallel weiter trainieren.
Datenhoheit

Daten bleiben im Haus.

On premise heisst: Modelle und Agenten laufen auf Ihrer Hardware in Ihrem Rechenzentrum. Sensible Daten verlassen es nicht, es gibt keinen Transfer in eine fremde Cloud.

01
Lokale Ausführung
Inferenz und Agenten-Kontext bleiben auf der eigenen DGX-Compute. Kein Cloud-Roundtrip, keine US-Datenübermittlung.
02
Policy- und Privacy-Controls (OpenShell)
Der OpenShell-Runtime setzt Regeln auf Systemebene durch, führt jeden Agenten in einer eigenen Sandbox aus und protokolliert jede Allow- und Deny-Entscheidung. Status: Early Preview.
03
Zertifizierter Betrieb
DELTA ist nach ISO 27001 zertifiziert und integriert die Systeme direkt in Ihrer Umgebung.
Branchen

Wer agentische KI on-premise einsetzt.

Pharma & Life Sciences
IQVIA betreibt eine agentische Plattform auf Nemotron-Modellen und dem NeMo Agent Toolkit mit über 150 Agenten. On-Premise hält Studien- und Patientendaten im Haus.
IQVIA / NVIDIA
Automotive & Industrie
Die Industrial AI Cloud von Deutsche Telekom und NVIDIA in München ist souverän und EU-datenschutzkonform. EDAG fährt sein Industrial-Metaverse darauf.
Telekom / NVIDIA
Engineering & EDA
Cadence (ChipStack AI) und Siemens (Fuse EDA Agent) bauen Engineering-Agenten auf dem NVIDIA Agent Toolkit.
NVIDIA Newsroom
Forschung & Hochschulen
Frontier-Modelle und autonome Forschungs-Agenten laufen DSGVO-konform im eigenen Rechenzentrum, ohne Cloud-Abhängigkeit.
DELTA

Einige dieser Plattformen laufen heute cloud- oder hybrid. On-Premise ist der Weg, dieselben Workloads im eigenen Rechenzentrum zu betreiben.

Software-Basis

Der NVIDIA-Software-Stack dahinter.

Das NVIDIA Agent Toolkit bündelt die Bausteine für autonome Agenten. Die Details und die Architektur erklären wir auf der Toolkit-Seite.

NVIDIA Agent ToolkitNemoClawOpenShellNemotronCUDA-XNVIDIA AI EnterpriseNIM Microservices
Warum DELTA

Beratung, Integration und Test-Centre aus einer Hand.

NVIDIA Elite Partner
Mehrfach ausgezeichneter Star Performer Central Europe, am Markt seit 1985. Sizing, Beschaffung, Integration und Support aus einer Hand.
Test-Centre Glinde
Validieren Sie Ihre Agenten-Workloads auf realer Hardware, bevor Sie investieren. NVIDIA DGX B300 ist im Test-Centre live.
SuperPOD-Erfahrung
DELTA hat mit Arion den ersten europäischen GB200-NVL72-SuperPOD ausgeliefert und mit Mercury einen DGX-H100-SuperPOD in die TOP500 gebracht.
Zertifiziert
ISO 9001, ISO 14001 und ISO 27001 zertifiziert, EcoVadis Gold.
FAQ

Häufige Fragen

Antworten für Entscheider, IT und Beschaffung rund um agentische KI on-premise.

Grundlagen & Datenschutz

Was sind KI-Agenten on premise?+

KI-Agenten on premise sind autonome KI-Systeme, die mehrstufig planen, Werkzeuge aufrufen und Aufgaben ausführen, dabei aber vollständig auf eigener Hardware im eigenen Rechenzentrum laufen. Modell, Kontext und Daten bleiben im Haus. Anders als ein Chatbot, der einzelne Anfragen beantwortet, arbeitet ein Agent eine Aufgabe über längere Zeit selbständig ab.

Lassen sich KI-Agenten DSGVO-konform betreiben?+

Ja. Im On-Premise-Betrieb verlassen sensible Daten das Rechenzentrum nicht, es gibt keinen Transfer in eine fremde Cloud und keine US-Datenübermittlung. Der OpenShell-Runtime ergänzt Policy- und Privacy-Controls und protokolliert jede Agenten-Aktion. DELTA ist nach ISO 27001 zertifiziert.

Bleiben meine Daten im eigenen Rechenzentrum?+

Ja. Inferenz und Agenten-Kontext laufen auf Ihrer eigenen NVIDIA-DGX-Compute. Es gibt keinen Cloud-Roundtrip. Sie behalten die volle Kontrolle über Modelle, Daten und Protokolle.

Hardware & Modelle

Welche Hardware brauche ich für KI-Agenten?+

Das hängt von Modellgrösse, Zahl paralleler Agenten und Datenschutz-Anforderung ab. Zum Entwickeln eine NVIDIA DGX Spark, für den produktiven Arbeitsplatz die NVIDIA DGX Station, für skalierte Inferenz Vera Rubin NVL72 und für den Produktions-Cluster der NVIDIA DGX SuperPOD. Die Workload-Matrix oben ordnet alles zu.

Wie gross darf das Modell lokal sein?+

Eine NVIDIA DGX Station trägt Inferenz bis etwa 1 Billion Parameter, ein NVIDIA DGX Spark bis rund 200 Mrd. (gekoppelt bis 405 Mrd.). Vera Rubin und DGX SuperPOD skalieren in den Trillion-Bereich. Welches Modell auf welche Plattform passt, klären wir im Sizing.

Kann ich Nemotron-Modelle on-premise selbst hosten?+

Ja. Die Nemotron-Modelle stehen unter der NVIDIA Open Model License und laufen lokal auf NVIDIA-DGX-Hardware. Details zur Modellfamilie und zum NVIDIA Agent Toolkit finden Sie auf unserer Toolkit-Seite.

DELTA & Beschaffung

Wer ist NVIDIA Elite Partner für DGX-Hardware in DACH?+

DELTA Computer Products ist NVIDIA Elite Partner und mehrfach ausgezeichneter Star Performer Central Europe, mit eigenem Test-Centre in Glinde und produktiven SuperPOD-Deployments in Europa. Beratung, Integration und Support kommen aus einer Hand.

Kann ich die Hardware vorab testen?+

Ja. Im DELTA Test-Centre in Glinde lassen sich die Systeme auf Ihren konkreten Workloads testen, bevor Sie beschaffen. NVIDIA DGX B300 ist dort live. Beratung anfragen.

Nächster Schritt

Sprechen Sie mit DELTA über Ihre Agenten-Plattform.

Wir klären Use-Case, Modellgrösse und Datenschutz-Anforderungen und empfehlen die passende NVIDIA-Plattform, mit Test-Centre-Validierung vor der Beschaffung.